2018年已過,我們迎來了新的一年,在機遇與挑戰同在的環境下,我們更應勤於學習。爲了方便大家學習,小編爲大家盤點了2018年阿里巴巴大數據—玩家社區雲棲號最火的乾貨文章分享給大家,讓我們在新的一年裏共同學習和成長!
阿里巴巴大數據 —玩家社區
雲棲號簡介:
阿里大數據博文,問答,社羣,實踐,有朋自遠方來,不亦說乎……
2018年10篇最受歡迎博文:
第一篇:
《MaxCompute/DataWorks權限問題排查建議》
MaxCompute與DataWorks爲兩個產品,在權限體系上既有交集又要一定的差別。在權限問題之前需瞭解兩個產品獨特的權限體系。
閱讀原文
第二篇:
《Hadoop數據遷移MaxCompute最佳實踐》
本文向您詳細介紹如何通過使用DataWorks數據同步功能,將Hadoop數據遷移到阿里雲MaxCompute大數據計算服務上。
閱讀原文
第三篇:
《在PyODPS DataFrame自定義函數中使用pandas、scipy和scikit-learn》
PyODPS DataFrame 提供了類似 pandas 的接口,來操作 ODPS 數據,同時也支持在本地使用 pandas,和使用數據庫來執行。
閱讀原文
第四篇:
《專訪20年技術老兵雲郎:16年峯迴路,每一步都是更好的沉澱》
場主見過很多瞄準CTO崗位逆流而上的程序員,也認識很多掙扎後放棄轉而創業的技術人,但是從技術轉型成產品卻不多。做產品,是不是技術人未來的一個可能?
閱讀原文
第五篇:
《MaxCompute Tunnel上傳典型問題場景》
分別描述使用MaxCompute Tunnel命令行工具上傳數據的數據類、網絡類、計費類問題,長期更新,歡迎大家拍磚~~
閱讀原文
第六篇:
《SQL優化器原理 - 查詢優化器綜述》
這是MaxCompute有關SQL優化器原理的系列文章之一。我們會陸續推出SQL優化器有關優化規則和框架的其他文章。添加釘釘羣“關係代數優化技術”(羣號11719083)可以獲取最新文章發佈動態。
閱讀原文
第七篇:
《MaxCompute幫你五步實現用戶畫像的數據加工》
企業最終的數據往往都隱藏在日誌背後,如果從日誌背後挖掘出有價值的信息,勾畫出平臺或網站的用戶畫像對精準化運營有着重要的幫助。阿里雲技術專家禕休帶來阿里在處理日誌、構建數倉上的最佳實踐分享。主要從數倉開發開始談起,重點講解了數據加工用戶畫像的五大步驟,最後進行了演示解析。
閱讀原文
第八篇:
《MaxCompute助力OSS支持EB級計算力》
MaxCompute是什麼 你的OSS數據是否作堆積在一旁沉睡已久存儲成本變爲企業負擔你是否想喚醒沉睡的數據驅動你的業務前行MaxCompute可以幫助你高效且低成本的解決這些問題通過對海量數據進行分析和計算來實現勾勒用戶畫像、提升營銷轉化、挖掘產品優化方向、預測業務發展等豐富的業務場景。
閱讀原文
第九篇:
《80後阿里P10,“關老闆”如何帶着MaxCompute一路升級?》
我是個幸運的人。雖然幸運不能被複制,但是眼光和努力可以。 “我是一個興趣驅動型的人,職業生涯總的來說,還算挺幸運的,做自己感興趣的事情,走上IT這一行……” 特別久以前,大概初中的時候有了自己的第一臺電腦,大名鼎鼎的486,帶一個數學協處理器,主頻266MHz,內存有4MB。”
閱讀原文
第十篇:
《Hadoop遷移MaxCompute神器之DataX-On-Hadoop使用指南》
DataX-On-Hadoop即使用hadoop的任務調度器,將DataX task(Reader->Channel->Writer)調度到hadoop執行集羣上執行。這樣用戶的hadoop數據可以通過MR任務批量上傳到ODPS、RDS等,不需要用戶提前安裝和部署DataX軟件包,也不需要另外爲DataX準備執行集羣。