原创 [機器學習筆記] 機器學習常見算法總結(更新中)

機器學習常見算法總結 監督學習 Supervised Learning 線性迴歸算法 優點: 建模速度快,存儲資源低; 思想簡單,實現容易。建模迅速,對於小數據量、簡單的關係很有效; 是許多強大的非線性模型的基礎; 線性迴歸模型十分

原创 [統計學筆記] (四)數據分佈的數字特徵

(四)數據分佈的數字特徵 數據的分佈特徵與使用的描述統計量 數據集中趨勢 在統計研究中,需要蒐集大量數據並對其進行加工整理,大多數情況下數據都會呈現出一種鐘形分佈,即各個變量值與中間位置的距離越近,出現的次數越多;與中間位置距離越遠,出

原创 [機器學習筆記] (轉載學習)完整機器學習項目的工作流程

完整機器學習項目的工作流程 博客原文:https://ask.julyedu.com/question/7013 1 抽象成數學問題 明確問題是進行機器學習的第一步。機器學習的訓練過程通常都是一件非常耗時的事情,胡亂嘗試時間成本是非常高的

原创 [機器學習筆記] 常用的分類與預測算法

常用的分類與預測算法 算法名稱 算法描述 迴歸分析 迴歸分析是確定預測屬性(數值型)與其它變量間相互依賴的定量關係最常用的統計學方法。 包括:線性迴歸、非線性迴歸、Logistic迴歸、嶺迴歸、主成分迴歸、偏最小二乘迴歸等模型。 決策

原创 [機器學習筆記] 用Python分析 TED演講數據(更新中)

用Python分析 TED演講數據 首先準備TED演講數據集,TED演講數據集和信息可以從下面的資源獲得: https://www.datafountain.cn/datasets/11 該數據集包含2個文件: ted_main.csv

原创 [數據分析學習筆記] 數據預處理

數據分析學習筆記 —— 數據預處理 數據預處理一方面是要提高數據的質量,另一方面是要讓數據更好地適應特定的挖掘技術或工具。 爲什麼需要進行數據預處理? 包含在數據源中的大部分原始數據未被處理,它們是不完整的數據或者含有不符合數據分析要求的

原创 [機器學習] Python代碼來構建一顆決策樹(Decision Tree)的案例

Python代碼來構建一顆決策樹(Decision Tree)的案例 用Python代碼來構建一顆決策樹(Decision) 工具 Python+Jupyter Graphviz 2.38 (Graphviz是一個開源的圖形可視化軟件)

原创 [機器學習筆記] 用Python進行航空公司客戶價值分析筆記

用Python進行航空公司客戶價值分析(數據分析) 學習資料: 參考圖書:《Python數據分析與挖掘實戰》(機械工業出版社)第7章 參考博文:https://blog.csdn.net/a857553315/article/detail

原创 [機器學習筆記] 用Python分析:紅葡萄酒質量分析(數據探索)

用Python分析:紅葡萄酒質量分析(數據探索) 數據集:winemag-data_first150k.csv 先來導入數據 import numpy as np import pandas as pd import seaborn a

原创 [統計學筆記] (六) 參數估計

(六)參數估計 (Parameter Estimation) 參數估計是推斷統計的重要內容之一。它是在抽樣及抽樣分佈的基礎上,根據樣本統計量來推斷所關心的總體參數。 人們常常需要根據手中的數據,分析或推斷數據反映的本質規律。即根據樣本數據

原创 [統計學筆記] (十四)概率與概率分佈

概率與概率分佈 概率是度量偶然事件發生可能性的數值。假如經過多次重複試驗(用X代表),偶然事件(用A代表)出現了若干次(用Y代表)。以X作分母,Y作分子,形成了數值(用P代表)。在多次試驗中,P相對穩定在某一數值上,P就稱爲A出現的概率。

原创 [機器學習筆記] Python數據分析:用戶消費行爲(持續更新)

Python數據分析:用戶消費行爲(持續更新) 紅酒品鑑和用戶消費行爲分析是我學習Python數據分析入門的兩個案例,記錄一下。 網絡上關於這兩個案例的介紹非常多,但是我在學習過程中,發現有很多文章的邏輯不是很清晰,代碼也調試不同。 所以

原创 [機器學習筆記] 機器學習知識要點彙總

機器學習知識要點彙總   1.  機器學習的常見分類和常用的算法有哪些? 將機器學習分爲四種,分別是監督學習、無監督學習、半監督學習和增強學習。 (1)監督學習(Supervised Learning):是指每個進入算法的訓練數據樣本都

原创 [統計學筆記] (七) 假設檢驗

(七) 假設檢驗 一個問題 一個以減肥爲主要目標的健美俱樂部聲稱,參加其訓練班至少可以使減肥者平均體重減重8.5kg以上。爲了驗證該宣稱是否可信,調查人員隨機抽取了10名參加者,得到他們的體重記錄如下表: 在  的顯著性水平下,調查結果

原创 [統計學筆記] 統計學計算題選講(精華)

統計學計算題選講 第 1 題 某班級學生物理課程考試成績分別爲:              68  89  88  84  86  87  75  73  72  68              75  82  97  58  81