原创 優化算法——牛頓法與擬牛頓法(DFP / BFGS)

工作中遇到優化的問題,回顧一下當初學過的基本優化算法。   本博客主要考慮無約束且非線性的極小化優化問題:             在工作中遇到的變量和函數值均爲1維變量,方便理解和處理。   一、牛頓法 直接貼合工作目標,考慮變量的維度

原创 學習筆記3——LFM算法(Latent Factor Model)

1. LFM算法基本內容 輸入:user對item的點擊矩陣 參數:每一個user的向量表示和每一個item的向量表示 方式:用user矩陣和item矩陣的矩陣乘 擬合 user對item的點擊矩陣 2. LFM應用普適場景: 2.1 獲

原创 學習筆記1——個性化推薦算法綜述

1. 當物品數量遠超人可以手動遍歷的範圍時,稱爲信息過載; 2. 如果沒有明確需求的用戶訪問了服務,且該服務的物品對於用戶而言構成了信息過載,該系統基於一定規則策略(個性化推薦算法)將物品進行排序,並將排在前面的物品推薦給用戶,這就是推薦

原创 學習筆記2——個性化召回算法綜述

1. 個性化召回 召回:從item set中選取一部分作爲候選集(不同用戶喜歡不同的item、item量級大則會導致排序慢,後端響應時間久) 根據用戶的屬性行爲、上下文等信息從item set中選取其感興趣的item集合作爲候選集; 2.

原创 Hive SQL——技能 - 解析json列表,直至字段維度

小白問題描述: 通過類似word2vec等方法,利用商品的歷史訂單,我們可以獲取一些商品之間的關聯關係。通常這些關聯關係是以json串的形式存儲在Hive表中,且一個關聯關係下包含多個商品,通常的格式爲: 商品 關聯商品列表 1001 [

原创 Hive SQL——優化 - 減少查詢job 加速得到查詢結果

小白問題描述: 圖書館圖書按照類目進行區分,且由於圖書的量級過大,一般僅一級類目無法滿足快速定位到圖書的需求,因此人們往往把圖書劃分爲多級類目,例如一級類目cate1和二級類目cate2。 我想同時統計一級類目cate1下書的個數和二級類

原创 Machine Learning——Logistic Regression(邏輯迴歸)

邏輯迴歸(LR)雖然名字帶“迴歸”,但它卻是一種分類方法,用於二分類問題。 具體過程: 1. 構造預測函數 邏輯迴歸對應二分類問題,因此需要尋找一個預測函數h,該函數的輸出是兩個值。一般採用sigmoid函數,其函數形式如下所示:

原创 Algorithm——Quicksort(快速排序)

自己總結的快速排序的code,之前一直處於半懂狀態,自己敲定代碼後覺得纔是真的懂了! #include <iostream> using namespace std; #define maxn 65536 int arr[ma

原创 Binary Tree——給定二叉樹的前序遍歷和中序遍歷重建二叉樹

題目描述:輸入某二叉樹的前序遍歷和中序遍歷的結果,請重建出該二叉樹。假設輸入的前序遍歷和中序遍歷的結果中都不含重複的數字。例如輸入前序遍歷序列{1,2,4,7,3,5,6,8}和中序遍歷序列{4,7,2,1,5,3,8,6},則重建二叉