想學大數據?先看完這幾本書再說

真正的數據愛好者有很多需要閱讀的內容:大數據,機器學習,數據科學,數據挖掘等。除了這些技術領域,還有一些特定的技術和語言需要你繼續研究:Hadoop,Spark,Python,和R等等,還有無數實現自動化的工具等等,這些工具幾乎每天都會用到,這就需要你不斷的學習。幸運的是,以上提到的這些都不缺關於它們的書籍。

本文首先幫大家盤點幾本大數據相關的書籍,這些書都是亞馬遜上的暢銷排行榜上的:

關於大數據

1、《Big Data》

在大數據的背景下,我很少看到關於數據建模,數據層,數據處理需求分析以及數據架構和存儲實現問題。這本書卻提供了令人耳目一新的全面解決方案。

【大數據開發學習資料領取方式】:加入大數據技術學習交流羣458345782,點擊加入羣聊,私信管理員即可免費領取

但不可忽略的是,它也引入了大多數開發者並不熟悉的、困擾傳統架構的複雜性問題。本書將教你充分利用集羣硬件優勢的Lambda架構,以及專門用來捕獲和分析網絡規模數據的新工具,來創建這些系統。

關於Apache Hadoop

2、《Hadoop: The Definitive Guide》

本書通過豐富的案例學習來解釋Hadoop的幕後機理,闡述了Hadoop如何解決現實生活中的具體問題。第3版覆蓋Hadoop的最新動態,包括新增的MapReduceAPI,以及MapReduce2及其靈活性更強的執行模型(YARN)。

關於Apache Spark

3、《Learning Spark》

《Spark 快速大數據分析》是一本爲Spark 初學者準備的書,它沒有過多深入實現細節,而是更多關注上層用戶的具體用法。不過,本書絕不僅僅限於Spark 的用法,它對Spark 的核心概念和基本原理也有較爲全面的介紹,讓讀者能夠知其然且知其所以然。

關於數據挖掘

4、《數據挖掘》

本書是關於數據挖掘領域的綜合概述,我認爲這本書作爲研究生的課程用書是最好的,或者作爲參考書。本書前版曾被KDnuggets的讀者評選爲最受歡迎的數據挖掘專著,是一本可讀性極佳的教材。

它從數據庫角度全面系統地介紹數據挖掘的概念、方法和技術以及技術研究進展,並重點關注近年來該領域重要和最新的課題——數據倉庫和數據立方體技術,流數據挖掘,社會化網絡挖掘,空間、多媒體和其他複雜數據挖掘。

5、《Mining of Massive Datasets》

本書是在Anand Rajaraman和Jeff Ullman於斯坦福大學教授多年的一門季度課程的材料基礎上總結而成的。簡單來說,本書是關於數據挖掘的。但是,本書主要關注極大規模數據的挖掘,也就是說這些數據大到無法在內存中存放。

由於重點強調數據的規模,所以本書的例子大都來自Web本身或者Web上導出的數據。另外,本書從算法的角度來看待數據挖掘,即數據挖掘是將算法應用於數據,而不是使用數據來“訓練”某種類型的機器學習引擎。

免費電子書

想從事數據科學,除了以上提及的那些書籍,還有很多這個領域的入門書籍,但是在你真正開始之前,你更應該對這個領域有一個廣泛的瞭解。

下面我們還精選了5本免費的電子書,可以幫助你更好的理解數據科學的全部內容,以及爲你後續學習數據科學、大數據和數據分析做好準備。

1、《Big Data: The Numbers Game Deciphered》

要想學習簡明扼要的關於大數據世界的概述,可以閱讀這本只有11頁的電子書,這本書以數據科學領域的最新發展爲背景,讀完這本書,你將可以瞭解到:

● 成爲數據科學家應該具備的學歷

● 數據科學領域需要具備的技術/非技術類的技能

● 數據科學的學習資源

書籍下載地址:http://www.simplilearn.com/the-numbers-game-deciphered-guide-pdf

2、《Top Programming Languages for a Data Scientist》

編程是數據科學家絕對必須具備的核心技術技能。通過這本詳細的指南,瞭解掌握哪些編程語言可以優先考慮入門數據科學。讀完這本書,你可以瞭解到

● 數據科學職業的十大編程語言列表;

● 這些編程語言的特點;

● 如何將你掌握的技能應用於數據科學家。

書籍下載地址:http://www.simplilearn.com/top-programming-languages-for-data-scientist-guide-pdf

3、《8 Essential Concepts of Big Data and Hadoop》

Hadoop可以說是大數據家族中最重要的技術,稱得上是大數據革命的核心。通過閱讀這本便捷指南,可以瞭解你需要了解的關於Hadoop及其生態系統的所有信息。

書籍下載地址:http://www.simplilearn.com/big-data-and-hadoop-8-essential-concepts-guide-pdf

4、《Secret to Unlocking Tableau's Hidden Potential》

Tableau使分析變得簡單易行,不僅適用於分析師,也適用於高層管理人員,IT專業人員以及其他所有人員。如果你正在尋找能夠充分發揮Tableau功能的技巧,以及有用的黑客技巧,這本電子書將會告訴你需要了解的內容。

書籍地址:http://www.simplilearn.com/secret-to-unlocking-tableau-hidden-potential-guide-pdf

5、《Top 25 Interview Questions and Answers: Big Data Analysis》

即便你是一位很厲害的數據專家,在求職面試中,你依然需要絞盡腦汁讓面試官對你印象深刻,否則你依然很難得到你一直夢寐以求的那個職位,這本書灰機了大數據面試最常問的問題和答案,相信可以助你一臂之力。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章