人工智能實戰就業(面試)學習路線圖
- 這個項目是幹什麼的?
整理這個項目的初衷是方便同學們快速開啓人工智能自學計劃,在學習過程中少走彎路用最快的效率入門Ai並開始實戰項目,
提供了近200個Ai實戰案例和項目,這些並不是網上搜集來的,而是我這五年線上線下教學所開發和積累的案例。可以說都是
反覆迭代更新出來的,適合同學們來進行循序漸進的學習與練手。來的同學記得點個star收藏下!
- 配套教材如何獲取?
19年底我出版了機器學習課程的配套教材《跟着迪哥學Python數據分析與機器學習實戰》,
風格依舊是通俗易懂,歷時兩年反覆修改訂正十餘次終於和大家見面了。
爲了方便更多同學們能快速開始學習計劃,我決定將本書的電子版免費送給大家。希望它能給大家帶來學習的收穫!
在本項目主頁即可下載PDF版本,教材如果喜歡也可從京東購買。
《跟着迪哥學Python數據分析與機器學習實戰》PDF原版下載 :
(網盤鏈接: https://pan.baidu.com/s/19wzJeyPmwTBDp9ASEWBvFQ 提取碼: tece )
- 按照什麼順序開始學習?
下面目錄也就是學習路線路了,初學者建議按照目錄中給出的順那我覺得你的別動序來進行學習,已經入門的同學就可以按照自己的喜好來選擇了。
- 提供案例如何獲取?
案例中涉及的數據都是真實數據集,有些會比較龐大,直接上傳github大家下載起來會非常慢,我會逐漸上傳各個模塊
的網盤鏈接,裏面包括了數據,代碼,PPT等學習資源。如需配套視頻講解請添加微信:digexiaozhuge(迪哥小助手拼音)
- 合作與交流
有各方面合作交流以及項目問題都可以直接添加微信:digexiaozhuge(迪哥小助手拼音)
目錄
必備基礎技能
要學人工智能(數據科學)這行還是需要一些基本功的,最基礎也是最核心的就是Python和數學了!這兩兄弟入門起來
並不難,先掌握基礎的邊用邊學也是可以的!
必備Python基礎
如果對Python不熟悉的同學們,建議先看一下我的Python入門視頻課程,可以快速入門!
- 爲什麼是Python?
最直接的解釋就是大家都用它!以前是面向對象編程,後來大家更喜歡面向複製粘貼編程,現在懶到面向github編程,確實如此,該偷懶就得偷懶,Python就是這個作用!
後續所有的實戰內容都是基於Python,所以沒得選啦!
- 需要安裝什麼?
Anaconda就夠了!Anaconda就夠了!Anaconda就夠了!好了,說了三遍了,具體解釋大家參考上面傳送門課程就好
- 用什麼編程工具開始?
雖然大家都有趁手的兵器,但是我給大家準備的絕大多數課件都是基於jupyter notebook的,所以這個肯定是必備的!
必備Python工具包
- 什麼是工具包?
工具包就是人家把功能都寫好了,咱們直接調用就完事啦!數據處理,分析,建模等都有對應的工具包。對於學習來說
並不用把這些工具包背下來,先熟悉起來,後續肯定還是要現用現查的。
- 哪些工具包是初學者必備的呢?
工具包名稱 | 功能概述 |
---|---|
Numpy | 矩陣計算必備!它是後續一切計算的核心,數據科學領域核心工具包 |
Pandas | 數據處理必備!讀數據,處理數據,分析數據,非他不可! |
Matplotlib | 可視化必備!功能十分強大,沒有畫不出來的圖,分析展示就靠它了! |
Seaborn | 更簡單的可視化神器!一行代碼給你搞定一個可視化展示結果 |
必備數學基礎
- 數學重要嗎?非學不可嗎?
數學有多重要同學們肯定都十分清楚,尤其是在人工智能(數據科學)領域,不懂數學想必寸步難行,很多同學都問過我一個問題,工作中真能用上這麼多數學嗎?
我跟大家來解釋一下,人工智能這行發展相當迅速,在實際工作中肯定要邊幹邊學,學什麼呢?想必就是當下的一些優秀論文了,如果連基本的數學公式都看不懂,
那就不用再去談什麼高端技術了。做這行的同學們肯定都會有這樣一個想法,所謂的人工智能就是對數據做各種各樣的數學計算罷了!
- 如何學數學?要定一個長期計劃嗎?
對於數學我覺得並不需要從頭開始花大量時間一步一個腳印去學習,舉一個例子,我和我身邊的同事,朋友都是幹這行蠻久的了,數學不知道擼了多少遍了,考研時候也曾刷題無數,
但也會遇到這樣的問題,很多知識點如果一段時間沒看很快還是會忘記。我最常做的一件事就是用到什麼查什麼,查找的過程其實也是學習進步過程。建議大家可以快速過一遍
常用的知識點(高數,線性,概率論中的基礎),這個過程中千萬別去看各種解題過程,也不用管具體求解的方法,說白了就是隻要理解一個公式是做什麼的,有什麼用
就足夠了,類似教材中的習題,練習冊上的求解這些統統不需要,以後也根本不會用筆去算這些麻煩事,把這個時間省下來去學習算法更划得來!
- 下面是課程中所設計的知識點,也是必備基礎
知識點 | 內容 | 作用 |
---|---|---|
高等數學 | 高等數學基礎,微積分,泰勒公式與拉格朗日, | 機器學習公式推導必備 |
線性代數 | 線性代數基礎,特徵值與矩陣分解, | 算法求解必備 |
概率論 | 概率論基礎,隨機變量與概率估計,常用分佈 | 機器學習經常提這些詞 |
統計分析 | 迴歸分析,假設檢驗,相關分析,方差分析 | 數據分析必備 |
機器學習
人工智能領域最核心的就是機器學習了,無論大家後續想從事哪個方向,肯定都是先從機器學習開始!主要就兩件事,
第一就是掌握經典算法原理,第二就是熟練應用Python工具包進行建模實戰!
機器學習算法
-
算法要學什麼?
理解機器學習算法是如何對數據進行操作從而完成建模求解過程,說白了就是熟悉下數學在算法中是如何應用的。重在理解即可!不要對一個問題鑽的沒完沒了,這樣太
浪費時間了,沒準後續學習過程中一下子就迎刃而解了。我覺得對算法的學習肯定不止一遍,尤其是準備面試就業的同學們,二刷,三刷都是很正常的現象(曾經有同學
跟我說面試前一共刷了6遍課程) -
有了深度學習還需要機器學習嗎?
深度學習可以說是機器學習算法的一種,並不是有了神經網絡其他經典算法就不需要了,需要根據不同的任務和數據來選擇最合適的算法,學習路經肯定是先從機器學習開始,
其實掌握了這些經典算法之後再看神經網絡真的很簡單!
- 下面是課程中會講解的算法,也是大家必須掌握的!這裏沒有列出所有機器學習算法,因爲有很多現在已經不實用了。
知識點 | 內容 | 概述 |
---|---|---|
分類算法 | 邏輯迴歸,決策樹,支持向量機,集成算法,貝葉斯算法 | 準備面試的同學們必須掌握 |
迴歸算法 | 線性迴歸,決策樹,集成算法 | 有些算法既能做分類也能做迴歸 |
聚類算法 | k-means,dbscan等 | 無監督是實在沒標籤的時候才考慮的 |
降維算法 | 主成分分析,線性判別分析等 | 重在理解降維的思想 |
進階算法 | GBDT提升算法,lightgbm,,EM算法,隱馬爾科夫模型 | 進階算法有時間精力的同學們可以挑戰 |
機器學習算法實驗分析
通過對比實驗分析經典算法建模方法及其參數對結果的影響,通過實驗與可視化展示理解算法中的參數與應用實例。
案例名稱 | 內容概述 |
---|---|
線性迴歸實驗分析 | 掌握一元與多元線性迴歸,非線性迴歸方法,正則化懲罰的作用 |
模型評估方法 | 常用分類與迴歸算法評估方法對比,數據集切分實例 |
邏輯迴歸實驗分析 | 經典分類模型構造方法,決策樹邊界繪製方法 |
聚類算法實驗分析 | 無監督建模實例,聚類算法評估方法,無監督的作用與應用實例 |
決策樹實驗分析 | 樹模型可視化實例與構造方法,樹模型的分類與迴歸應用 |
集成算法實驗分析 | 集成方法應用實例與效果分析,常見集成策略對比 |
支持向量機實驗分析 | SVM涉及參數與建模對比實驗 |
關聯規則實戰分析 | 關聯規則必備知識點與建模分析實例 |
機器學習算法代碼復現
爲了更好理解算法的機制從零開始復現經典算法,堅持不掉包原則,一步步完成算法所需所有模塊。
- 爲什麼要自己復現代碼?有何價值呢?
主要目的是更好的掌握算法的工作原理,重在練習!有時間的同學們可以自己復現一遍,時間緊的同學就不必親力親爲了。
案例名稱 | 內容概述 |
---|---|
線性迴歸代碼實現 | 分模塊構建算法常用函數 |
邏輯迴歸代碼實現 | 實例解讀邏輯迴歸實現方法 |
Kmeans代碼實現 | 非常簡單易懂的無監督算法 |
決策樹代碼實現 | 樹模型其實就是遞歸實現 |
神經網絡代碼實現 | 代碼量略大,建議debug模式學習 |
貝葉斯代碼實現 | 貝葉斯在文本任務中還是比較好解釋 |
關聯規則代碼實現 | 常用的數據分析算法 |
打造音樂推薦系統 | 從零開始構造推薦系統模型 |
機器學習經典案例實戰
- 實戰需要掌握哪些技能?
在實戰中可能把數學知識點都弱化了,因爲更多時候我們都是使用現成的工具包來完成任務(調包俠)。這裏需要大家掌握的節能功能比較多,
首先就是熟練使用這些常用工具包了,數據預處理,特徵工程,調參,驗證這些都是非常核心的步驟。概括來說就是要完成不同的任務所需流程和套路都是類似的,
但是使用的方法和算法卻可能不同,這就需要大家不斷積累來豐富實戰經驗了。給同學們提供的這些案例大家都可以當作是自己的實戰模板!
- 這些案例能讓我收穫什麼?
最重要的就是學會針對不同數據(數值,文本,圖像)如何進行預處理與分析,熟練應用工具包中各大核心函數進行調參與預處理,針對不同任務提出多種解決
方案並進行實驗分析。總結起來就是多做實驗,多動手,代碼寫的多了自然就熟練了!
案例名稱 | 內容概述 |
---|---|
K近鄰算法實戰 | 機器學習入門案例,掌握工具包應用於建模方法 |
交易數據異常檢測 | 十分重要,數據處理和建模策略的詳細分析對比 |
集成算法建模實戰 | 集成不用我多說了,必備核心策略 |
基於隨機森林的氣溫預測 | 隨機森林是機器學習中最常用的算法,詳細分析對比 |
新聞分類實戰 | 文本數據分析處理,基於貝葉斯算法展開建模實戰 |
聚類實踐分析 | 無監督應用實例 |
時間序列分析 | 時間序列數據製作方法,基於序列數據進行建模 |
用戶流失預警 | 我經常說夢幻西遊的用戶流失,這個只是個DEMO |
使用lightgbm進行飯店流量預測 | 又是一個大殺器,比xgboost還虎 |
人口普查數據集項目實戰-收入預測 | 核心模板,數據分析,可視化啥的該有的都有 |
貝葉斯優化實戰 | 難度較大,貝葉斯優化工具包使用實例 |
文本特徵方法對比 | 文本數據常用特徵提取方法對比 |
製作自己常用工具包 | 自己做個包玩玩 |
機器學習實戰集錦
- 這裏還給大家準備了豐富的實戰項目,非常適合大家來練手!
案例名稱 | 內容概述 |
---|---|
Python實戰關聯規則 | 用工具包來做關聯規則實在太輕鬆了 |
愛彼迎數據集分析與建模 | 房價數據集分析與建模實例 |
基於相似度的酒店推薦系統 | 來構建一個推薦系統完成酒店推薦 |
商品銷售額迴歸分析 | 銷售額預測,很常規的任務,常規套路搞定 |
絕地求生數據集探索分析與建模 | 絕地求生數據集,來看看你究竟被什麼人幹掉了 |
模型解釋方法實戰 | 建模後如何來解釋模型呢,這幾個工具包幫你搞定 |
自然語言處理必備工具包實戰 | NLP常用工具包解讀,實例演示 |
銀行客戶還款可能性預測 | 銀行客戶數據來預測還款的可能性 |
圖像特徵聚類分析實踐 | 圖像數據如何進行聚類呢? |
人口普查數據集項目實戰-收入預測 | 核心模板,數據分析,可視化啥的該有的都有 |
數據分析與挖掘
數據分析這個詞大家天天都在聽,要幹什麼呢?無非就是從數據中獲取有價值的信息,這其中方法與套路還是非常多的。
這個方向不需要什麼理論積累,直接上數據,幹就得了!案例的積累就是學習過程!
數據挖掘實戰
- 數據挖掘是什麼?和機器學習有什麼區別?
簡單來說數據挖掘就是對海量數據應用機器學習算法來得到想要的結果。在數據挖掘中重點並不是機器學習算法的選擇,而是怎麼樣對數據進行處理才能得到更好的
預測結果,在這裏特徵工程與預處理將成爲核心解決方案。
案例名稱 | 內容概述 |
---|---|
泰坦尼克號獲救預測 | 經典的kaggle競賽案例,入門數據挖掘的第一個實戰項目 |
數據特徵構建 | 特徵工程是數據挖掘的核心,基於sklearn講解多種特徵構建方法 |
用戶畫像實戰 | 用戶畫像想必大家都聽過了,如何應用數據來完成畫像呢? |
集成策略實例 | 數據挖掘中選擇通常都選擇集成策略來更好的提升效果 |
Xgboost實戰 | 集成中的典型代表,競賽的大殺器 |
京東購買意向預測 | 經典預測問題,基於用戶歷史行爲數據完成預測任務 |
kaggle數據科學調查 | 可視化展示kaggle競賽中參賽人員情況 |
房價預測 | 數據挖掘入門級別案例,快速掌握常規套路 |
電力敏感用戶分析 | 競賽實例,主要講解特徵工程的作用 |
fbprophet時間序列預測 | 時間序列預測非常實用的算法,用起來非常簡單 |
數據挖掘競賽優勝解決方案
- 我又不參加競賽,爲什麼要看人家的解決方案呢?
給大家選擇了天池,kaggle,融機等大型競賽案例,並且提供的代碼和方案均爲競賽時優勝者的解決思路。就好比要學下棋就得跟下的最好的玩自己纔會提升,
案例中均會講解優勝者的思路和整體解決方案並提供代碼實現。非常有助於大家提升!
案例名稱 | 內容概述 |
---|---|
快手短視頻用戶活躍度分析 | 基於用戶的行爲數據來預測接下來的活躍程度 |
工業化工生產預測 | 對化工數據進行分析,建模預測生產效率 |
智慧城市-道路通行時間預測 | 很接地氣的競賽,基於道路數據預測通行時間 |
特徵工程建模可解釋工具包 | 數據挖掘中很難的一點就是進行特徵解釋,這些工具包非常實用 |
醫學糖尿病數據命名實體識別 | 命名實體識別算法講解與應用實例分析 |
貸款平臺風控模型-特徵工程 | 用圖模型來構建特徵工程,這套思路應用很廣 |
新聞關鍵詞抽取模型 | 關鍵詞抽取可以說是NLP必備技能了 |
機器學習項目實戰模板 | 模板來了,以後有任務可以套用了,方法都差不多 |
電力敏感用戶分析 | 競賽實例,主要講解特徵工程的作用 |
數據分析實戰
- 數據分析的重點又是什麼呢?
數據挖掘主要是建模來進行預測,數據分析則重在可視化展示,分析其中各項指標對結果的影響等。給大家選擇了一些經典分析案例,很多都可以直接當作模板來使用
案例名稱 | 內容概述 |
---|---|
散點圖繪製技巧 | 都說了可視化是重點,畫圖肯定必須的了 |
紐約出租車運行情況分析建模 | 用了好多工具包,可以熟悉下對地理數據如何進行分析與展示 |
基於統計分析的電影推薦任務 | 統計分析常用方法,還能做推薦 |
數據分析與機器學習模板 | 這個模板真的非常全面了,分析,展示,建模,評估,簡直一套龍了 |
數據降維 | 幾種常用的降維算法對比分析與展示 |
商品可視化展示與文本處理 | 文本數據預處理與可視化展示 |
多變量分析 | 多變量分析也是數據分析中常見的方法 |
商品訂單數據集分析 | 訂單數據集分析 |
KIVA貸款數據分析 | 貸款數據集分析 |
深度學習
- 終於說到深度學習了,都需要學什麼呢?
深度學習可以說是當下最好用的算法了,各個領域都能吃得開。其實最核心的還是在計算機視覺和自然語言處理中,因爲神經網絡算法更適用於圖像和文本數據。
主要需要掌握的就是算法和框架了,算法就是CNN,RNN這些經典網絡模型,框架就是實戰的工具了例如tenorflow,Pytorch等,後面還會詳細說。
- 深度學習聽起來比較高大上,是不是比機器學習難很多?
好像現在好多小夥伴一拿到任務,第一個想法都是直接用深度學習做。如果深度學習難度大,做起來麻煩,那還能有這麼高的熱度嗎?其實恰恰相反,我覺得深度學習
真的比機器學習簡單很多,在機器學習中需要我們對不同的數據選擇不同的預處理方法和特徵工程構建方法。深度學習中的套路相對來說更固定一些,而且有這些開源框架
和各大經典網絡架構,我們通常需要做的就是套用就可以了。整體難度要比機器學習任務更容易一些(只是相對來說!)。
深度學習必備算法
- 深度學習都需要學哪些算法呢?
算法名稱 | 內容概述 |
---|---|
神經網絡 | 神經網絡是最基礎的,相當於爲後面網絡的學習打下基礎 |
卷積神經網絡 | 這個大家聽起來很熟悉吧,深度學習中的大哥大!計算機視覺的核心網絡 |
遞歸神經網絡 | 北喬峯,南慕容,它就是自然語言處理中的大哥大了! |
對抗生成網絡 | 現在比較火的模型,玩起來很有趣,可以進行各種圖像融合 |
序列網絡模型 | NLP中常用架構,機器學習翻譯模型,應用點比較多 |
各大經典網絡架構 | 剛纔說的CNN和RNN都是比較基礎的網絡模型,在其基礎上還有很多拓展需要大家掌握 |
深度學習必備工具
- 什麼是框架?能幫我們做什麼呢?
框架好比說你設計了一個網絡模型,但是如果把其中具體的計算過程全部自己完成就太麻煩了。框架提供了高效的計算方法並且不需要咱們來完成,一套全自動的計算。
相當於我們只需要設計好結構,具體的施工就交給它了。要玩深度學習必備的就是框架了。
- 深度學習框架哪家強?
tensorflow,Pytorch,keras,caffe等,有這麼多框架,我該選哪一個呢?是不是不同框架差異很大呢?
現在最主流的就是tensorflow和PyTorch了,相當於肯德基和麥當勞吧。都很強,至於具體選擇哪一個還是參考大家各自的項目組和任務需求吧。如果非要我推薦一個
我會給大家推薦PyTorch,因爲更簡潔通俗。這些框架我全都用過,最主要的原因就是工作中經常需要參考論文和開源項目,一般別人論文中源碼用什麼框架我也就接着進行
二次開發了,所以這些框架早晚大家都會用一遍的!
- 框架該怎麼學呢?
框架沒有什麼理論可談,也不用看各種長篇大論,直接用就得了!其實就是一個工具包,便用邊學,案例當模板來總結就可以了!
- 針對不同框架,分別給大家準備了豐富的實戰項目和學習內容。
框架名稱 | 內容概述 |
---|---|
Caffe框架 | 遠古時代的神級框架,現在有點跌落神壇了,我學習的第一個框架 |
Tensorflow2版本 | 2版本做了很多改進,終於更人性化了,用起來比1版本舒服多了 |
Keras | 一句話概述就是簡單!簡單!簡單!都不用學,看代碼非常容易理解 |
PyTorch | 現階段最火的框架,我估計也是今年(2020)最流行的框架了,推薦! |
深度學習框架
針對各大深度學習框架均給大家提供了豐富的實戰哪裏,用哪個就看大家的喜好了!
深度學習框架-Tensorflow2
- 請給我一個學tensorflow2的理由!
谷歌出品我就不用多解釋了,人家谷歌那麼多開源項目肯定都是基於TF框架的,要學習或者參考人家開源項目和論文肯定要學TF的,工業界應用也非常廣泛。這波肯定不虧!
- 給大家準備的案例內容,借用程咬金的配音:一個字,幹!
案例名稱 | 內容概述 |
---|---|
tensorflow安裝與簡介 | 2版本的介紹於安裝方法,簡單過一下就好 |
神經網絡原理解讀與整體架構 | 複習下神經網絡架構 |
搭建神經網絡進行分類與迴歸任務 | 用TF完成基本的分類於迴歸任務,掌握其應用方法 |
卷積神經網絡原理與參數解讀 | CNN的架構於其中每一個參數詳解 |
貓狗識別實戰 | 經典的圖像分類任務,這裏要講很多內容,非常重要 |
圖像數據增強實例 | 數據增強可以說了現在必備技能了 |
訓練策略-遷移學習實戰 | 遷移學習帶來的效果還是相當可以的 |
遞歸神經網絡與詞向量原理解讀 | RNN模型解讀 |
基於TensorFlow實現word2vec | 詞向量模型解讀,並基於TF來實現 |
基於RNN模型進行文本分類任務 | 基於TF完成文本分類任務 |
tfrecord製作數據源 | 數據源製作實例 |
將CNN網絡應用於文本分類實戰 | CNN也能玩文本分類 |
時間序列預測 | 時間序列數據處理與建模實例 |
對抗生成網絡實戰 | GAN來啦,這個可好玩了 |
基於CycleGan開源項目實戰圖像融合 | 我最喜歡玩的GAN,效果相當逗了! |
經典網絡架構Resnet實戰 | 必須懂的網絡架構,學就得了! |
深度學習框架-Pytorch
- 聽說它很火,爲啥呢?
19年底Pytorch框架使用人數已經超越tensorflow成爲當下最火的框架,原因其實很簡單,大家都喜歡用更簡單易懂的框架。整體的感覺確實比tensorflow好上手而且
調試起來十分方便,也是建議初學的同學們優先選擇Pytorch框架。
案例名稱 | 內容概述 |
---|---|
PyTorch框架基本處理操作 | PyTorch簡單熟悉一下就好,上手非常簡單 |
神經網絡實戰分類與迴歸任務 | 用PyTorch構建神經網絡模型,確實比TF用的順手 |
卷積神經網絡原理與參數解讀 | CNN模型架構與參數書解讀 |
圖像識別核心模塊實戰解讀 | 非常重要,PyTorch中的圖像處理核心模塊 |
遷移學習的作用與應用實例 | PyTorch中加載模型來進行遷移學習 |
遞歸神經網絡與詞向量原理解讀 | RNN模型架構解讀 |
新聞數據集文本分類實戰 | 基於PyTorch來構建文本分類模型 |
對抗生成網絡架構原理與實戰解析 | GAN模型通俗解讀 |
基於CycleGan開源項目實戰圖像融合 | PyTorch版本的CYCLEGAN,這個開源項目寫的相當棒 |
OCR文字識別原理 | OCR其實原理很簡單,需要多個模型協助完成 |
OCR文字識別項目實戰 | 構建OCR網絡模型 |
基於3D卷積的視頻分析與動作識別 | 用3D卷積來處理視頻數據並完成行爲識別 |
基於PyTorch實戰BERT模型 | BERT這個架構太火了,必備模型之一 |
PyTorch框架實戰模板解讀 | 提供一個模板,以後有任務可以基於模板來進行改進 |
深度學習框架-Keras
- Keras都說簡單,有多簡單呢?
整體感覺就是啥都不用學,從案例開始直接用就好了,TF2版本其實跟keras很像。適合做實驗寫論文,簡單快速!
案例名稱 | 內容概述 |
---|---|
安裝與簡介 | keras安裝與上手很容易,基於tf來進行 |
搭建神經網絡模型 | 搭建個神經網絡模型來試試水 |
再戰卷積神經網絡 | CNN模型構建起來也非常容易 |
LSTM時間序列預測任務 | LSTM模型應用於時間序列任務 |
文本分類實戰 | 文本分類實例 |
多標籤與多輸出 | 多標籤任務很常見,很有學習價值 |
新聞數據集文本分類實戰 | 基於keras的文本分類任務 |
數據增強 | 數據增強實例解讀 |
對抗生成網絡 | GAN架構,用keras來做更簡單 |
遷移學習與Resnet殘差網絡 | resnet模型大家一定自己動手玩一遍 |
地址郵編多序列任務 | 文本模型實例 |
seq2seq網絡實戰 | 序列網絡模型應用還是比較廣的 |
實戰模板總結 | 給大家提供的keras模板,再有任務直接寫就好 |
深度學習框架-Caffe
- Caffe框架現階段還有必要學習嗎?
我覺得現階段已經有tensorflow和pytorch了,暫時輪不到caffe登場了,初學的同學們就不推薦了。可能有些論文和任務還是需要caffe框架,需要的同學們自取就好啦!
案例名稱 | 內容概述 |
---|---|
Caffe配置文件解讀 | Caffe框架常用配置文件解讀 |
多種數據集構建方法 | 數據集構建方法,這個很重要 |
Caffe常用工具解讀 | 裏面內置了很多小工具,可以快速完成任務 |
人臉檢測實戰 | 基於Caffe框架構建人臉檢測模型 |
人臉關鍵點定位實戰 | 基於Caffe框架完成人間關鍵點識別模型 |
計算機視覺
- 計算機視覺發展這麼火,就業面試都需要哪些核心技能呢?
計算機視覺這個行業我就不用多說啦,當下最吃香的了。那都需要學什麼呢?最核心的其實就量部分了,一個是圖像處理,另一個是圖像建模。所謂的圖像處理就是Opencv
那一套啦,這個工具包簡直無敵了,但凡你要用的這裏全能找到。圖像建模主要就是用深度學習來完成檢測,識別等任務。現階段的學習我覺得關於傳統圖像處理算法可以
都不用去看啦,簡單熟悉一下就好,主流的方向還是用深度學習來做,這就需要大家多多最新的閱讀論文了。
Opencv圖像處理實戰
- 關於opencv我該怎麼學呢?
建議大家選擇Python版本來進行學習和使用,跟其他工具包一樣,調就完事了!遇到不熟悉的多查API,邊用邊學是最快的途徑。Opencv中基本所有函數都涉及非常多的
數學公式,這些大家都可以先放一放,如果把每個算法每個公式都學一遍那得猴年馬月了,以後用到了再說完全來得及。
- 這些案例我需要自己動手寫一遍嗎?
給大家準備了非常多的學習資源和案例,前期只需要熟悉即可,工具包就是用的,面向複製粘貼編程也是一項技能!
案例名稱 | 內容概述 |
---|---|
Opencv簡介與環境配置 | 環境安裝與配置 |
圖像基本操作 | 用opencv完成基本的圖像處理操作,練手! |
閾值與平滑處理 | 最常用的處理操作,幾行代碼就能搞定 |
圖像形態學操作 | 這幾個形態學操作熟悉下即可 |
圖像梯度計算 | 圖像梯度計算實例 |
邊緣檢測 | 邊緣檢測的應用面非常廣 |
圖像金字塔與輪廓檢測 | 輪廓檢測實例,效果還是不錯的 |
直方圖與傅里葉變換 | 熟悉下即可 |
項目實戰-信用卡數字識別 | 動手做一個實戰項目,對信用卡數字進行檢測與識別 |
項目實戰-文檔掃描OCR識別 | 掃描文檔數據,進行ocr識別 |
圖像特徵-harris | 常用特徵提取方法,算法簡單熟悉就可以 |
圖像特徵-sift | 最老牌的特徵提取方法了,數學還是蠻多的 |
案例實戰-全景圖像拼接 | 全景攝像大家肯定都玩過,怎麼實現的呢? |
項目實戰-停車場車位識別 | 重型項目,從零開始構建停車場車位識別模型 |
項目實戰-答題卡識別判卷 | 咱們也整一個自動閱卷的玩玩 |
背景建模 | 常規處理方法 |
光流估計 | 簡單熟悉即可 |
Opencv的DNN模塊 | 加載訓練好的模型進行識別 |
項目實戰-目標追蹤 | 追蹤的效果還是蠻有意思的 |
卷積原理與操作 | 卷積到哪都是核心 |
項目實戰-疲勞檢測 | 基於攝像頭檢測疲勞 |
計算機視覺實戰項目(基於深度學習)
- 這些項目我都需要掌握嗎?
對於準備面試就業的同學們建議都過一遍,裏面的思想都是蠻好的,大部分都是基於論文來進行復現,有時間的同學最好
先閱讀一遍論文再開始研究代碼,裏面的代碼量都會相對較大,建議從debug模式入手,一行代碼一行代碼來看,我在
講解過程中也會進入debug模式給大家逐行進行講解。
- 有沒有哪個是需要重點學習的?最好能寫在簡歷裏面呢?
重點推薦Mask-rcnn實戰項目,可以說是計算機視覺中的通用項目,檢測,識別,分割一步全到位了!應用場景非常
廣,也適合進行二次開發和改進,如果要寫在簡歷裏肯定非它莫屬了,算法原理和源碼都需要大家熟悉,在課程中
我會重點講解該項目,並應用到自己的數據任務中!
項目名稱 | 內容概述 |
---|---|
圖像風格轉換(style-transfer) | 主要來學習其思想,效果還是很有意思的 |
圖像缺失自動補全 | GAN網絡應用場景非常多,圖像也能自己修復 |
超分辨率重構 | 近幾年研究的重點領域之一,這篇論文的效果已經非常不錯了 |
物體檢測框架-MaskRcnn項目 | 這個就是我重點強調的開源項目,必看!必看!必看! |
MaskRcnn網絡框架源碼詳解 | 源碼非常重要,每一行都需要懂! |
基於MASK-RCNN框架訓練自己的數據 | 如何標註圖像數據並進行訓練呢?這裏給你答案 |
人體姿態識別demo | MaskRcnn應用場景非常多 |
物體檢測FasterRcnn系列 | 物體檢測的經典之作,可以當作學習資源 |
基於CycleGan開源項目實戰圖像融合 | PyTorch版本的CYCLEGAN,這個開源項目寫的相當棒 |
OCR文字識別原理 | OCR其實原理很簡單,需要多個模型協助完成 |
OCR文字識別項目實戰 | 構建OCR網絡模型 |
基於3D卷積的視頻分析與動作識別 | 用3D卷積來處理視頻數據並完成行爲識別 |
自然語言處理
- NLP學習難度大不大?就業方向怎麼樣呢?
難度可以說還是蠻大的,對於圖像來說,數據都是固定的,拍了什麼就是什麼!但是文本數據就沒那麼固定了,人類
有時候理解起來都不容易,更何況計算機了。高挑戰也是高收益,NLP發展前景還是非常不錯的,至於具體選擇哪個方向
其實還是看大家的喜好了!
自然語言處理實戰項目(基於深度學習)
- 這麼多項目,有沒有哪個是需要重點學習的?最好能寫在簡歷裏面呢?
18年的時候谷歌一篇論文橫空出世,BERT!相當於自然語言處理通用解決框架了,基本所有任務都能做!
這個需要大家重點來學習,並且可以當作項目寫在簡歷裏,可以說是當下NLP必備技能之一啦!
項目名稱 | 內容概述 |
---|---|
語言模型 | 語言模型需要大家熟悉下,後續詞向量的基礎 |
使用Gemsim構建詞向量 | Gensim這個包實在好用! |
基於word2vec的分類任務 | 先用這個例子來理解上如何使用詞向量 |
NLP-文本特徵方法對比 | 文本特徵構造方法這麼多,哪一個更好用呢? |
LSTM情感分析 | 用這個項目來理解RNN模型所需的輸入長什麼樣子 |
NLP-相似度模型 | 文本相似度計算方法 |
對話機器人 | 基於tensorlfow框架構建一個聊天機器人 |
動手打造自己的輸入法 | 能不能構建一款自己的輸入法呢?幫你搞定! |
機器人寫唐詩 | 看看模型寫出的唐詩咋樣! |
NMT機器翻譯框 | 開源項目,可以進行二次開發 |
地址郵編多序列任務 | 經典文本分類任務 |
自然語言處理通用框架BERT原理 | 這個就是上面說的BERT了,重點!重點!重點! |
谷歌開源項目BERT源碼解讀 | 源碼非常重要,每一行都需要理解 |
基於BERT的中文情感分析 | 基於開源項目進行模型開發 |
基於BERT的中文命名實體識別 | 基於開源項目進行命名實體識別 |