原创 模型評估與選擇

1. 欠擬合和過擬合 2. 迴歸模型的評估 3. 分類模型的評估 分類結果混淆矩陣 混淆矩陣表中,T和F代表預測結果的真假,P和N代表預測成正例還是反例,根據這張表可以求出很多性能評估指標 準確率(Accuracy):分類正確

原创 基於異構網絡節點表示的推薦系統(HERec)

論文鏈接:https://arxiv.org/abs/1711.10730 本文中,我們提出一種新奇的基於異構網絡節點表示學習的異構網絡推薦方法:HERec。爲了學習網絡節點的表示,我們設計了一種基於Meta-Path的隨機遊走方

原创 向量和矩陣

Andrew Ng機器學習算法入門((五):矩陣和向量 矩陣是由m×n個數組成的一個m行n列的矩形表格.特別地,一個m×1矩陣也稱爲一個m維列向量;而一個1×n矩陣 ,也稱爲一個n維行向量. 點贊 收藏

原创 聚類算法之層次聚類

一. 層次聚類 層次聚類(hierarchical clustering)是一種基於原型的聚類算法,試圖在不同層次對數據集進行劃分,從而形成樹形的聚類結構。數據集的劃分可採用"自底向上"的聚合策略,也可以採用"自頂向下"的分拆策略

原创 metapath2vec:異構網絡的可擴展表示學習

1. 基於元路徑的隨機遊走 以下圖爲例,元路徑“APA”表示兩位作者(A)之間的論文(P)上的共同作者關係,而“APVPA”代表兩位作者(A)發表論文(P) 同一地點(五),作者最後在實驗中使用的meta-path是”APVPA”