原创 [大數據]Hadoop+Storm+Spark全套入門及實戰視頻教程(課程內容&工具包都在其中)

  (課程內容&工具包都在其中)   課程由百度T8級別大數據架構師傾心製作。 樑爽,花名:中天。 計算機碩士,原BAT高級技術專家,大數據團隊Leader,PB級以上數據處理和挖掘專家。 在BAT曾主導研發個性化推薦系統、自然語言處

原创 (第7篇)八斗學習課堂筆記-【01、02】推薦系統

第一步:召回階段:用token檢索item,(比如8個item) 第二步:過濾階段:把劣質的item過濾掉,(剩餘5個item) 第三步:排序,把好的item排前面 第四步:截斷,取TopN   其中,第一步和第二步屬於粗排階段,側重於召

原创 (第6.1篇)大數據發展背後的強力推手——HBase分佈式存儲系統

前面的文章我們介紹了HDFS文件系統、Mapreduce計算框架、Zookeeper協作服務今天我們介紹可在廉價PC Server上搭建起大規模結構化存儲集羣的分佈式存儲系統——HBase。  HBase HBase – Had

原创 (第1篇)什麼是hadoop大數據?我又爲什麼要寫這篇文章?

前言 這些天,有很多人諮詢我大數據相關的一些信息,覺得大數據再未來會是一個朝陽行業,希望能儘早學會、入行,借這個機會,我決定寫一下關於大數據的知識和我這些年的感悟。 我寫這個博客目的就是爲了幫助新人快速的進入大數據行業,市面

原创 (第2篇)一篇文章教你輕鬆安裝hadoop

如果你看了我的上一篇文章,那此時你對hadoop已經有了一個大概的瞭解,那接下來這篇文章就教大家怎麼安裝hadoop環境,只要你用心,仔細的跟着文章中講到的做,肯定能正確安裝。    點擊鏈接 http://blog.csdn.net/i

原创 (第5篇)避免協作衝突--簡單易接入的Zookeeper

  點擊鏈接 http://blog.csdn.net/ijia1  訪問我的博客,學習更多Hadoop知識。 上一篇文章我們詳細介紹了mapreduce計算框架,此時你已經瞭解hadoop集羣的數據處理方式,接下來我們講解

原创 (第3篇)HDFS是什麼?HDFS適合做什麼?我們應該怎樣操作HDFS系統?

點擊鏈接 http://blog.csdn.net/ijia1  訪問我的博客,學習更多Hadoop知識。 HDFS文件系統 Hadoop 附帶了一個名爲 HDFS(Hadoop分佈式文件系統)的分佈式文件系統,專門存儲超大數據

原创 (第4篇)hadoop之魂--mapreduce計算框架,讓收集的數據產生價值

通過前面的學習,大家已經瞭解了HDFS文件系統。有了數據,下一步就要分析計算這些數據,產生價值。接下來我們介紹Mapreduce計算框架,學習數據是怎樣被利用的。 Mapreduce計算框架 如果將Hadoop比做一頭大象,那