台部落辰星M

目錄 1、線性可分支持向量機 1.1、間隔最大化 1.2、對偶函數 1.3、分隔超平面、決策函數、支持向量 2、線性支持向量機 2.1、軟間隔最大化 2.2、對偶函數 2.3、分離超平面、決策函數、支持向量 3、非線性支持向量機 3.1、

2019-01-17 00:38:40

目錄一、ALS模型 1、模型定義 2、參數求解 3、推薦計算二、pyspark實現ALS模型一、ALS模型 1、模型定義用戶u對商品i的偏好：其中，在隱式反饋中無法獲取用戶對商品明確的評分，在視頻推薦場景中rui

2018-12-31 03:09:10

目錄一、鏈表類定義二、查找鏈表的中間結點三、檢測鏈表是否有環四、刪除鏈表倒數第n個結點五、兩個有序鏈表合併六、鏈表反轉七、判斷鏈表是否是迴文字符串一、鏈表類定義結點定義： class Node: de

2018-12-26 01:17:49

目錄一、樹模型與線性模型的融合模型二、Python sklearn實現GBDT+LR融合模型一、樹模型與線性模型的融合模型樹模型GBDT原理：https://blog.csdn.net/woniu201411/article/de

2018-12-08 01:12:03

目錄 1、spark運行時架構 2、兩種操作：轉化操作和行動操作 3、在集羣上運行應用程序 4、使用spark-submit部署應用 1、spark運行時架構運行時架構描述： spark-submit啓動驅動器驅動器和集羣管理器通信

2018-11-26 09:40:46

目錄 1、相似度的度量 2、基於用戶的協同過濾算法 2.1 算法原理 2.2 用戶相似度計算的改進 2.3 使用的場景 3、基於物品的協同過濾算法 3.1 算法原理 3.2 物品相似度計算的改進 3.3 使用的場景 4、userCF和it

2018-11-22 09:18:07

目錄 1、圖遍歷 2、最小生成樹-Prime算法 3、最短路徑-Dijkstra算法圖的兩種常用的表示方式是鄰接矩陣和鄰接表。以下以鄰接矩陣爲例，圖的初始化定義： class Graph(): def __init__(sel

2018-11-14 10:01:53

149

目錄一、XGBoost模型理解 1、損失函數定義 2、正則項 3、樹結構 4、XGBoost算法總結：二、XGBoost、GBDT、RF三種集成模型比較三、XGBoost模型Python實現一、XGBoost模型理解監督學習的目

2018-11-04 10:34:53

累加器累加器提供了將工作節點中的值聚合到驅動器程序中的簡單語法。累加器一個常見用途是，在調試時對作業執行過程中的事件進行計數。執行行動操作後，累加器的值纔會更新；累加器的值只有在驅動程序

2018-10-26 22:34:42

目錄一、GBDT模型原理 1.1 GB(Gradient Boost)算法 1.2 GBDT模型二、spark ML機器學習庫中GBDT使用案例三、GBDT與Boost算法比較四、 GBDT與RF比較一、GBDT模型原理

2018-10-20 00:39:08

目錄一、決策樹CART 1.1分類決策樹 1.2迴歸決策樹 1.3 決策樹優點與缺點二、隨機森林RF 2.1隨機森林的生成 2.2 隨機森林的特點一、決策樹CART CART分類迴歸樹是一種典型的二叉決策樹，可以處理

2018-09-06 10:56:35

一、商品相似度定義基於物品的協同過濾算法是業界應用最多的算法，它的思想是給用戶推薦那些和他們喜歡的物品相似的物品，主要分爲兩個步驟：一，計算物品之間的相似度；二，根據物品相似度和用戶的歷史行爲給用戶生成推薦列表。物品i和物品j

2018-09-03 02:31:29

1、模型欠擬合及過擬合簡介 2、模型欠擬合及過擬合判斷 3、模型欠擬合與過擬合的優化方法一、模型欠擬合及過擬合簡介模型應用時發現效果不理想，有多種優化方法，包含：添加新特徵增加模型複雜度減小正則項權重獲取更多訓練樣本

2018-09-03 02:31:29

一、邏輯迴歸模型 1.1 模型定義 1.2 損失函數 1.3 梯度下降求解參數迭代直至收斂二、邏輯迴歸模型優缺點分析優點：結果通俗易懂，自變量的係數直接與權重掛鉤，可以

2018-09-03 02:31:29

數據抽取要正確反映業務需求處理缺失值和異常值數據轉換篩選有效的輸入變量變量共線性問題工業界有一個大家公認的看法，“數據和特徵決定了數據挖掘項目的上限，而算法只是儘可能地逼近這個上限”。在實戰中，特徵工程幾

2018-09-03 02:31:29