Darawhale 暑期組隊學習計劃

Datawhale暑期組隊學習計劃

馬上就要開始啦

這次共組織15個組隊學習

涵蓋了AI領域從理論知識到動手實踐的內容

按照下面給出的最完備學習路線分類

難度係數分爲三檔

可以按照需要參加

學習路線

基礎知識

1 Python基礎

課程簡介

課程設計:馬晶敏,葉樑

組隊學習說明:學習python基礎知識,針對python小白的學習之路

任務路線:基礎知識 → 函數 → 第三方模塊 → 類和對象 → 基礎爬蟲

組隊學習週期:10天

定位人羣:python小白

難度係數低

每個任務完成大概所需時間:2~4h/天,根據個人學習接受能力強弱有所浮動

任務安排:

Task1:環境搭建 + python初體驗 + python基礎講解 + python數值基本知識 (2天)

Task2:列表 + 元組 + string字符串 + 字符串格式化問題 (2天)

Task3:數組 + 集合 + 判斷語句 + 三目表達式 + 循環語句 (2天)

Task4:數組 + 集合 + 判斷語句 + 三目表達式 + 循環語句 (2天)

Task5:函數 + file + os模塊 + datetime模塊 (2天)

2 LeetCode

課程簡介

課程設計:老表、於鴻飛、楊皓博

組隊學習說明:Leetcode刷題組隊學習,從零開始每天一道算法題,在良好的學習氛圍下,培養刷題習慣,學習算法思想。(不限制編程語言)

任務路線:騰訊精選練習(50 題)順序每天一道題。

地址鏈接:

https://leetcode-cn.com/probl...

組隊學習週期:50天(50題全部完成即結束)

定位人羣:適合有一門語言基礎的同學

難度係數中

每個任務完成大概所需時間:2~3h/天

任務安排:

選取騰訊精選練習(50 題)解答

3 統計學

課程簡介

課程設計:王佳鑫、許輝

組隊學習說明:學習內容涵蓋統計學中所有的主要知識,並對其分部分進行梳理總結。

任務路線:根據所學習內容進行

(1)統計學基本知識、二項及泊松分佈、大數定律、正態分佈等內容的總結進行整體的回顧、梳理與完善;

(2)中心極限定理、置信區間、 假設檢驗等內容的總結進行整體的回顧、梳理與完善。

組隊學習週期:7天

定位人羣:微積分、基本概率知識儲備

難度係數中

每個任務完成大概所需時間:2-3h/天

學習內容:

(1)本次統計學學習以網易雲可汗學院公開課爲主:

視頻鏈接:

http://open.163.com/special/K...

(2)並以《深入淺出統計學》爲輔:

書籍鏈接:

https://pan.baidu.com/s/1dCV6...

任務安排:

Task1:統計學基本知識 + 二項及泊松分佈 + 大數定律 + 正態分佈 (2天)

Task2:中心極限定理 + 置信區間 (1天)

Task3:假設檢驗 (2天)

Task4:線性迴歸 + 卡方分佈 + 方差分析 (2天)

4 編程

課程簡介

課程設計:光城 、LeoLRH

組隊學習說明:利用自己所熟知的編程語言,具有一定基礎,討論在面試中可能出現的數據結構問題,一起學習重溫經典數據結構

任務路線:數組 → 鏈表 → 棧 → 隊列 → 遞歸 → 排序 → 二分查找 → 哈希表 → 字符串 → 二叉樹 → 堆 → 圖 → 回溯 → 分治 → 動態規劃

組隊學習週期:15天甚至往上大概16天左右(週末進行整體整理討論)(每天任務時間具體看任務情況)

定位人羣:有一門語言基礎和算法基礎的同學

難度係數高,小白慎入!!!

每個任務完成大概所需時間:平均每天學習時間在1個小時左右,晚上統一,半個小時進行集體討論總結打卡。

任務安排:

Task1:數組 + 鏈表 (2天)

Task2:棧 + 隊列 + 遞歸 (3天)

Task3:排序 + 二分查找 (2天)

Task4:散列表(哈希表) + 字符串 (2天)

Task5:二叉樹 + 堆 (2天)

Task6:圖 (2天)

Task7:遞歸 + 回溯 + 分治 + 動態規劃 (2天)

數據分析/挖掘

1 Excel入門

課程簡介

課程設計:楊煜,李嚴

組隊學習說明:職場人士必備學習內容。通過集中式學習和大量實戰練習,快速瞭解並掌握Excel核心功能,保證今後工作中用得到。

任務路線:基礎界面 → 基礎文件操作 & 單元格操作 → 基礎函數 → 查找函數vlookup和 match/index → 基礎圖表 → 數據透視表

組隊學習週期:12天

定位人羣:小白,或有一點基礎但不熟練的人羣;初入職場人羣必學;

難度係數低

每個任務完成大概所需時間: 2-3h/每天

任務安排:

Task1:基礎界面 + 文件操作 + 基礎單元格操作 (3天)

Task2:單元格引用 + 運算符 + 文本函數 + 邏輯函數 + 計算函數 (2天)

Task3:vlookup函數用法 + match&index + 雙條件查找 (2天)

Task4:圖表類型+圖表類型選擇指南 + 圖表的構成要素 (3天)

Task5:數據透視表 + 實現數據分段統計 + 變更值彙總依據 + 設置三種值百分比 + 計算字段 & 計算項 (2天)

2 MySQL

課程簡介

課程設計:楊皓博 孫濤 楊煜

組隊學習說明:一週內快速瞭解並掌握MySQL的主要內容。通過大量SQL語句的實戰練習,可以在簡歷上寫熟練掌握MySQL。(注意:本課程只關注SQL查詢語句本身,對數據庫的涉及較少。)

任務路線:MySQL軟件安裝及數據庫基礎 → 查詢語句 → 表操作 → 表聯結 → MySQL 實戰 → MySQL實戰 - 複雜項目

組隊學習週期:8天

定位人羣:小白

難度係數低

每個任務完成大概所需時間:2-3h

任務安排:

Task1:軟件安裝及數據庫基礎 + 查詢語句 (3天)

Task2:表操作 (3天)

Task3:MySQL 實戰 (1天)

Task4:MySQL 實戰 - 複雜項目 (1天)

3 數據分析

課程簡介

課程設計:金娟娟

組隊學習說明:以《python for data analysis》爲輔,學習重要的python庫

任務路線:重要的python庫

(numpy/pandas/matplotlib/seaborn等) → 數據清洗和分析

組隊學習週期:22天

定位人羣:有一點python基礎,但不太會python庫的數據分析小白;

難度係數低

每個任務完成大概所需時間:2~4h/天,根據個人學習接受能力強弱有所浮動

任務安排:

預備任務:github + jupyter (1天)

Task1:第4章numpy + 作業1 (2天)

Task2:第5章pandas (2天)

Task3:第6章數據載入 (2天)

Task4:第7章數據清洗 (2天)

Task5:第8章數據聯合 (2天)

Task6:第10章數據聚合 (2天)

Task7:第12章高階pandas + 作業2 (2天)

Task8:第9章matplotlib + 作業3 (2天)

Task9:第11章時間序列 (2天)

Task10:大作業+總結 (3天)

4 爬蟲

課程簡介

課程設計:光城、李方

組隊學習說明:

從零基礎到能獨立完成一個簡易的爬蟲項目

任務路線:請求 → re → beautifulsoup → lxml → selenium → IP問題 → 實戰小項目

組隊學習週期:8天

定位人羣:有Python基礎。

難度係數中

每個任務完成大概所需時間:2-3h/天

任務安排:

Task1:get與post請求 + 正則表達式 (2天)

Task2:beautifulsoup + xpath (2天)

Task3:selenium + IP (2天)

Task4:實戰大項目 (2天)

機器學習

1 初級算法梳理

課程簡介

課程設計:蘇靜、康兵兵

組隊學習說明:通過查閱書籍或參考文獻、學習視頻等,對傳統機器學習算法進行梳理

任務路線:線性迴歸 → 邏輯迴歸 → 決策樹

組隊學習週期:6天

定位人羣:有概率論、矩陣運算、求導、泰勒展開等基礎數學知識;

難度係數低

每個任務完成大概所需時間:2~3h/天

任務安排:

Task1:線性迴歸算法梳理 (2天)

Task2:邏輯迴歸算法梳理 (2天)

Task3:決策樹算法梳理 (2天)

2 高級算法梳理

課程簡介

課程設計:黑桃,劉廣月,於鴻飛

組隊學習說明:通過查閱相關文獻,對機器學習算法進行梳理

任務路線:RF → GBDT → XGB

組隊學習週期:7天

定位人羣:有概率論、矩陣運算、求導、泰勒展開等基礎數學知識;

難度係數中

每個任務完成大概所需時間:2~3h/天

任務安排:

Task1:隨機森林算法梳理 (2天)

Task2:GBDT算法梳理 (2天)

Task3:XGB算法梳理 (3天)

Task4:LightGBM算法梳理 (3天)

深度學習

1 PyTorch

課程簡介

課程設計:許輝 李奇鋒

組隊學習說明:通過學習pytorch的基本操作,最終完成手寫數字的識別

任務路線:安裝pytorch → 設立圖並計算 → 實現邏輯迴歸 → 構建多層神經網絡 → PyTorch實現L1,L2正則化以及Dropout → 書寫優化器代碼 → 用PyTorch完成手寫數字識別

組隊學習週期:7天

定位人羣:熟悉python的基礎用法

難度係數中

任務完成所需時間:2-3h/天

任務安排:

Task1:PyTorch的基本概念 (2天)

Task2:設立計算圖並自動計算 (2天)

Task3:PyTorch實現Logistic regression (2天)

Task4:PyTorch實現多層網絡 (2天)

Task5:PyTorch實現L1,L2正則化以及Dropout (2天)

Task6:PyTorch理解更多神經網絡優化方法 (2天)

Task7:手寫數字識別 (2天)

理論應用

1 spark入門

課程簡介

課程設計:Summer

組隊學習說明:學習spark基礎知識,針對spark小白的學習之路

任務路線:運行原理 → 環境搭建 → RDD編程 → SparkSQL → MLlib → 常用算法

組隊學習週期:12天

定位人羣:spark小白

難度係數中

每個任務完成大概所需時間:2~4h/天,根據個人學習接受能力強弱有所浮動

任務安排:

Task1:運行原理,RDD設計,DAG,安裝與使用 (3天)

Task2:RDD編程,熟悉算子,讀寫文件 (3天)

Task3:DataFrame,SparkSQL (2天)

Task4:MLlib流設計,特徵工程 (2天)

Task5:邏輯迴歸,決策樹 (2天)

2 數據挖掘實戰

課程簡介

課程設計:範晶晶、李碧涵、

組隊學習說明:應用機器學習算法,完整地走完一個數據挖掘項目流程

任務路線:數據分析 → 特徵工程 → 模型構建 → 模型評估 → 模型調優 → 模型融合

組隊學習週期:12天

定位人羣:有Python基礎,sklearn基礎。

難度係數中

每個任務完成大概所需時間:2-3h/天

任務安排:

Task1:數據分析 (2天)

Task2:特徵工程 (2天)

Task3:模型構建 (2天)

Task4:模型評估 (2天)

Task5:模型調優 (2天)

Task6:模型融合 (2天)

3 自然語言處理基礎(理論+實踐)

課程簡介

課程設計:jepson

組隊學習說明:學習自然語言處理理論,並且通過對某些數據集的文本分類任務不斷優化來進行實踐。

任務路線:特徵提取 → 特徵選擇 → 文本表示 → 傳統機器學習算法跑模型 → LDA生成新特徵

定位人羣:有Python基礎,基本框架的基礎(例如TensorFlow、Keras和pyTorch等)!

難度係數高

組隊學習週期:8天

每個任務完成大概所需時間:3~4h/天

任務安排:

預備任務:tensorflow安裝+tensrflow基礎+NLP

Task1:數據集探索 (2天)

Task2:特徵提取 (2天)

Task3:特徵選擇 (2天)

Task4:傳統機器學習+討論(2天)

4 自然語言處理進階(理論+實踐)

課程簡介

課程設計jepson

組隊學習說明學習自然語言處理理論,並且通過對某些數據集的文本分類任務不斷優化來進行實踐。

任務路線word2vec算法跑模型 → 卷積神經網絡算法跑模型 → 循環神經網絡算法跑模型 → 注意力機制算法跑模型→ Bert

定位人羣:學完自然語言處理入門組隊學習的同學或有自然語言處理基礎的巨佬!

難度係數高

組隊學習週期:14天

每個任務完成大概所需時間:3~4h/天

任務安排

Task1:數據集探索 (2天)

Task2:神經網絡基礎 (2天)

Task3:簡單神經網絡+討論 (2天)

Task4:卷積神經網絡 (2天)

Task5:循環神經網絡 (2天)

Task6:Attention原理+討論 (2天)

Task7:Bert+討論 (2天)

5 NLP論文復現

課程簡介

課程設計:楊開漠,王翔

任務路線:論文學習 → 研讀模型 → 跑模型 → 針對學習中存在的問題進行後期討論

定位人羣:具有nlp基礎、代碼閱讀能力以及論文學習能力;

難度係數高

組隊學習週期:14天(1篇/周)

每個任務完成大概所需時間:3~4h/天

任務安排:

Task1:論文1發佈 + 論文研讀筆記作業 + 後期討論 (7天)

Task2:論文2發佈 + 論文研讀筆記作業 + 後期討論 (7天)

組隊學習將在8月1號陸續開始報名

具體學習將在高校羣在職羣分享進羣二維碼

進羣方式

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章