我的學習目錄
一,數據處理
Pandas 數據處理
- 不定期更新
二,機器學習
強力推薦:Python之Sklearn使用教程
sklearn提供的數據集:sklearn.datasets
上課進度及練習
傳送門:致理大樓 816
應用部分
生成自己的數據集
廣義線性模型
傳送門:廣義線性模型 - sklearn使用說明
傳送門:sklearn中的迴歸算法
內容預覽:
- 提取乳癌數據
— 包含數據集與測試集的拆分 - 線性迴歸
- 嶺迴歸
- 邏輯迴歸
交叉驗證:評估估算器的表現
傳送門:交叉驗證:評估估算器的表現 - sklearn的使用方法
傳送門:sklearn中的交叉驗證
計算 f1_score
傳送門:sklearn.metrics.f1_score 使用方法
數據降維
特徵選擇
- scipy.stats.pearsonr - 皮爾森相關係數
- 特徵選擇 - SelectKBest
- 特徵選擇 - SelectPercentile
- 特徵選擇 - SelectFromModel(根據重要性權重選擇特徵)
- 特徵選擇過濾器 - f_classif(計算提樣本的ANOVA F值)
- 特徵選擇過濾器 - f_regression(單變量線性迴歸測試)
- 特徵選擇過濾器 - mutual_info_regression(連續目標變量的互信息)
- 特徵選擇過濾器 -mutual_info_classif(離散目標變量的互信息)
- 特徵選擇過濾器 -chi2(卡方統計量)
1,k - 鄰近算法
傳送門:使用sklearn中提供的k鄰近算法
內容預覽:
- 如何從sklearn中引入數據
- 將數據分爲訓練集和測試集(train_test_split)
- 使用sklearn中的kNN
- 網格搜索(GridSearchCV)
- 歸一化(StandardScaler)
傳送門:實現knn算法
2,線性迴歸
傳送門:實現線性迴歸算法
內容預覽:
- 簡單線性迴歸實現
- 多元線性迴歸算法
傳送門:線性迴歸實戰(書P136)
內容預覽:
- 局部加權線性迴歸
- 預測鮑魚年齡
傳送門:使用sklearn中提供的線性迴歸算法
內容預覽:
- kNNRegressor中的線性迴歸算法
- 使用梯度下降法訓練的線性迴歸函數
傳送門:梯度下降法
內容預覽:
- 使用梯度下降訓練線性迴歸算法
- 使用sklearn中的SGD方法
3,決策樹
傳送門:決策樹 / 分類樹(書P33)
內容預覽:
- 決策樹的實現
- sklearn中決策樹的使用
4,樸素貝葉斯算法
傳送門:樸素貝葉斯算法(書P53)
內容預覽:
- sklearn中樸素貝葉斯算法的使用
- 樸素貝葉斯之鳶尾花數據實驗(算法實現)
- 使用樸素貝葉斯進行文檔分類(算法實現)
- 拉布拉斯平滑
5,邏輯迴歸
傳送門:邏輯迴歸(書P73)
內容預覽:
- 邏輯迴歸/ 定義、損失函數、正則化
- 梯度下降法
- 梯度下降法求解邏輯迴歸
- 實例:從疝氣病症預測病馬死亡率
6,聚類 - sklearn中的使用
傳送門:聚類 - sklearn中的使用方法
內容預覽:
- 聚類方法概述
- K-means
2.1. 小批量 K-Means - Affinity Propagation
- Mean Shift
- 層次聚類
5.1. 不同連接類型 - DBSCAN
三,數據庫(SQL)
0,示例模式圖
傳送門:示例模式圖
爲了方便對照,所以單獨寫了出來!
內容預覽:
- 大學數據庫示例
- 銀行數據庫示例
1,數據庫系統原理
傳送門:數據庫系統原理
內容預覽:
- 數據庫與數據庫管理系統定義
- 數據視圖(View of Data)
- 數據模型
- 數據庫語言
- 數據庫引擎(Database Engine)
- 數據庫體系結構(Database Architecture)
- 應用程序體系結構(Database Applications)
- 關係和關係模式
- 鍵(Keys)
- 關係查詢語言(Relational Query Languages)
- 空值(null)
- 數據庫的修改
2,SQL語言
傳送門:SQL語言(一)
內容預覽:
- 基本模式定義
- 基本查詢結構
- 嵌套子查詢(Nested Subqueries)
- 數據庫的修改
傳送門:SQL語言(二)
內容預覽:
- 視圖(View)
- 索引(Index)
傳送門:SQL語言(三)
內容預覽:
- 事務(transaction)
- 完整性約束
- 斷言(Assertion)
- 觸發器(Trigger)
- 數據安全性
- 審計跟蹤(Audit trail)
傳送門:SQL語言(四)
內容預覽:
- 嵌入式SQL
- 開放數據庫互連(ODBC)
傳送門:數據庫設計和E-R(實體關係)模型
內容預覽:
- 實體集
- 聯繫集
- 映射基數
- 鍵、碼
- 約束
- 實體關係模型(Entity Relationship Model)
- 擴展的E-R特性
- E-R模式設計
- 例:大學數據庫的設計
- E-R模式到表的轉換
四,數據結構與演算法
1,算法與算法分析
傳送門:算法與算法分析
內容預覽:
- 算法
- 漸進表示法(Asymptotic notation)
- 算法分析
2,樹
傳送門:演算法 - 樹
內容預覽:
- 樹和二叉樹的定義
- 樹的基本術語
- 二叉樹
3,排序
傳送門:演算法 - 排序
內容預覽:
- 插入排序(Insertion-Sort)
- 交換排序
- 選擇排序(Selection Sort)
- 歸併排序(Merge Sort)
- 基數排序(Radix sort)
- 計數排序(Counting sort)
- 桶排序(Bucket sort)
- 各種排序方法比較
4,分治法(Divide-and-Conquer)
傳送門:演算法 - 分治法(Divide-and-Conquer)
內容預覽:
- Divide-and-Conquer(分治法)
- Recurrences(遞歸)
- Divide-and-Conquer使用時機
- 遞迴演算法則的設計
5,圖及其圖的應用
傳送門:圖的基本概念及圖演算法
- 圖的定義的基本術語
- 深度優先搜索(DFS)
- 廣度優先搜索(BFS)
更多關於圖的應用: