《Python數據分析與機器學習實戰-唐宇迪》讀書筆記第1 章--機器學習概念、入門環境

python數據分析個人學習讀書筆記-目錄索引

  唐宇迪,計算機專業博士,網易雲課堂人工智能認證行家,51CTO學院講師,CSDN博客專家、講師。擁有多年人工智能領域培訓經驗,帶領課程研發團隊累計開發AI課程60餘門,覆蓋當下人工智能熱門領域
  該書結合了機器學習、數據分析和 Python 語言,通過案例以通俗易懂的方式講解了如何將算法應用到實際任務。 全書共 20 章,大致分爲 4 個部分。第一部分介紹了 Python 的工具包,包括科學計算庫 Numpy、數據分析庫 Pandas、可視化庫 Matplotlib;第 2 部分講解了機器學習中的經典算法,例如迴歸算法、決策樹、集成算法、支持向量機、聚類算法等;第 3 部分介紹了深度學習中的常用算法,包括神經網絡、卷積神經網絡、遞歸神經網絡;第 4 部分是項目實戰,基於真實數據集,將算法模型應用到實際業務中。

       該書適合對人工智能、機器學習、數據分析等方向感興趣的初學者和愛好者。

      該書的推薦學習路線圖:

邀月工作室

     


《Python數據分析與機器學習實戰-唐宇迪》讀書筆記第1 章--機器學習概念、入門環境

1.1機器學習的應用領域:

 邀月工作室

 

2、機器學習流程:

 

邀月工作室

 

 

一般來說,機器學習流程大致分爲以下幾步:
  第①步:數據收集與預處理。例如,新聞中會摻雜很多特殊字符和廣告等無關因素,要先把這些剔除掉。除此之外,可能還會用到對文章進行分詞、提取關鍵詞等操作,這些在後續案例中會進行詳細分析。
  第②步:特徵工程,也叫作特徵抽取。例如,有一段新聞,描述“科比職業生涯畫上圓滿句號,今天正式退役了”。顯然這是一篇與體育相關的新聞,但是計算機可不認識科比,所以還需要將人能讀懂的字符轉換成計算機能識別的數值。這一步看起來容易,做起來就非常難了,如何構造合適的輸入特徵也是機器學習中非常重要的一部分。
  第③步:模型構建。這一步只要訓練一個分類器即可,當然,建模過程中還會涉及很多調參工作,隨便建立一個差不多的模型很容易,但是想要將模型做得完美還需要大量的實驗。
  第④步:評估與預測。最後,模型構建完成就可以進行判斷預測,一篇文章經過預處理再被傳入模型中,機器就會告訴我們按照它所學數據得出的是什麼結果。

1.3環境配置:

1)推薦下載Anaconda集成環境。

https://www.anaconda.com/

下載對應版本安裝即可。集成jupyter notebook、spyder等。注意修改爲清華的鏡像,參考:https://www.cnblogs.com/downmoon/p/12447551.html

不過,邀月個人還是鍾愛Eclipse,畢竟多開發語言環境。

如果還有個別包無法使用pip install,可以在這裏嘗試下載whl。https://www.lfd.uci.edu/~gohlke/pythonlibs/

2)jupyter notebook

一個非常適合教學的工具。

如果安裝或配置方面有什麼問題,可以參考這裏:https://www.cnblogs.com/downmoon/p/12598135.html

 

1.4其他資源 :

Github:https://github.com/

GitHub提供了非常豐富的開源項目和代碼。

kaggle社區:https://www.kaggle.com/

其內容都是和數據科學相關的,大家可以把它當成一個競賽站點,不僅包括各行各業的數據集,而且還有各路大神的解決方案。

 

本章小結:本章從整體上介紹了Python和機器學習的學習路線,該書所使用的環境只需一個Anaconda即可搞定。

 

第1章完。

python數據分析個人學習讀書筆記-目錄索引

 

該書資源下載,請至異步社區:https://www.epubit.com

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章