原创 函數依賴和關係模式分解

文章目錄一,第一範式二,關係數據庫設計中易犯的錯誤2.1 數據冗餘2.2 插入、刪除、修改異常三,模式分解(I)四,函數依賴(FD)4.1 什麼是函數依賴4.2 函數依賴的使用4.3 函數依賴集的閉包Armstrong 公理計算

原创 範式篇 - BCNF、3NF和4NF

文章目錄Boyce - Codd範式檢查是否爲BCNFBCNF 分解算法BCNF與保持依賴第三範式(3NF)- 動機BCNF 與 3NF的比較檢查是否爲3NF3NF分解算法練習設計目標多值依賴多值依賴定義多值依賴理論第四範式(4N

原创 概率論 - 常見分佈(及其分佈表)

分佈表在對應的分佈下邊離散型的分佈一,0-1分佈二,幾何分佈三,二項分佈四,泊松分佈五,超幾何分佈連續性的分佈一,均勻分佈二,指數分佈三,正態分佈與標準正態分佈格格不入的三個分佈一,卡方分佈二,t 分佈三,F 分佈 下邊是我自己寫

原创 集成方法 - BaggingClassifier

文章目錄一,Bagging 算法介紹二,BaggingClassifier使用1,參數及屬性2,方法3,例子 參考:BaggingClassifier 一,Bagging 算法介紹 算法主要特點 Bagging: 平行合奏:每個

原创 這是一個小“廢”貼

我的學習目錄一,數據處理Pandas 數據處理二,機器學習上課進度及練習應用部分生成自己的數據集廣義線性模型交叉驗證:評估估算器的表現計算 f1_score數據降維特徵選擇1,k - 鄰近算法2,線性迴歸3,決策樹4,樸素貝葉斯算

原创 如何選擇sklearn中的特徵選擇包

特徵選擇一,刪除低方差的特徵二,單變量特徵選擇三,遞歸特徵消除四,使用SelectFromModel特徵選擇4.1 L1-based 特徵選擇4.2 Tree-based 特徵選擇五,使用part of a pipeline特徵選

原创 30分鐘學會如何使用集成學習(什麼是集成學習)

文章目錄一,什麼是集成學習二,使用SKlearn中提供的集成學習器解決分類問題2.1 Voting Classifier 投票集成2.1.1 少數服從多數原則的投票集成-Hard Voting2.1.2 考慮概率的投票集成-Sof

原创 分類樹(信息熵與基尼指數)

文章目錄一,決策樹的直觀理解二,分類樹2.1 信息熵2.2 條件信息熵示例2.3 基尼指數(Gini不純度)示例 一,決策樹的直觀理解 二,分類樹 2.1 信息熵 信息熵是用來衡量信息不確定性的指標,不確定性是一個事件出現不同結

原创 使用Dijkstra/Floyd算法解決最短路徑問題

文章目錄一,最短路徑問題抽象1.1 單源(兩點之間)最短路徑 - Dijkstra算法1.2 某源點到其他各點的最短路徑 - Floyd算法 一,最短路徑問題抽象 典型用途: 交通網絡問題(從甲地到乙地是否有公路連通?哪一條路是最

原创 10分鐘瞭解關鍵路徑及如何求得關鍵路徑

文章目錄一,什麼是關鍵路徑二,求解關鍵路徑需要的4個描述量三,如何求得關鍵路徑 視頻參考:6.6.4關鍵路徑2–求解關鍵路徑 一,什麼是關鍵路徑 【引例 1】某項目的任務是對A公司的辦公室重新進行裝修 如果10月1日前完成裝修工程

原创 什麼是最小生成樹以及如何構建

文章目錄一,概念回顧 - 生成樹1.1 什麼是生成樹1.2 如何建立無向圖的生成樹二,最小生成樹(Minimum Spanning Trees)2.1 最小生成樹的典型用途2.2 構造最小生成樹(MST)2.2.1 MST 性質2

原创 貪婪算法(Greedy Algorithms)

文章目錄一,什麼是貪婪算法二,最短路徑三,使用貪婪解題策略的演算法3.1 活動選擇問題3.2 貪婪選擇(Greedy options)3.3 將動態規劃解轉化爲貪婪解四,高效的貪婪算法4.1 貪婪算法的概述及特點4.2 設計貪婪算

原创 什麼是拓撲排序及其Python實現

文章目錄一,有向無環圖1.1 什麼是有向無環圖1.2 有向無環圖的應用1.3 如何表示子工程(活動)二,拓撲排序2.1 AOV 網的特點2.2 拓撲排序2.2.1 定義與方法2.2.2 檢測 AOV網中是否存在迴路三,Python

原创 圖的基本概念及圖演算法

文章目錄一,圖的定義的基本術語二,鄰接(Adjacency)2.1 列表表示(Adjacency-List)2.2 矩陣表示(Adjacency-Matrix)三,圖的遍歷3.1 深度優先搜索(DFS)3.1.1 深度優先搜索遍歷