原创 【算法】在線學習算法FTRL詳解

原文鏈接:http://www.cnblogs.com/EE-NovRain/p/3810737.html   現在做在線學習和CTR常常會用到邏輯迴歸( Logistic Regression),而傳統的批量(batch)算法無法有效

原创 【總結】推薦系統學習-libFM

介紹   分解機(FM)是一個通過特徵工程模擬大多數分解模型的通用方法。libFM是一個實現以隨機梯度下降stochastic gradient descent (SGD)和可選擇最小二乘alternating least squares

原创 【總結】基於機器學習方法的POI品類推薦算法

來源:http://tech.meituan.com/category-recommend-base-ml.html 前言 在美團商家數據中心(MDC),有超過100w的已校準審覈的POI數據(我們一般將商家標示爲POI,POI基礎信

原创 【總結】Hive SQL的編譯過程

來源:http://tech.meituan.com/hive-sql-to-mapreduce.html Hive是基於Hadoop的一個數據倉庫系統,在各大公司都有廣泛的應用。美團數據倉庫也是基於Hive搭建,每天執行近萬次的Hi

原创 【總結】Bandit算法與推薦系統

原文:http://geek.csdn.net/news/detail/195714 推薦系統裏面有兩個經典問題:EE和冷啓動。前者涉及到平衡準確和多樣,後者涉及到產品算法運營等一系列。Bandit算法是一種簡單的在線學習算法,常常用於

原创 【算法】阿里精準推廣的核心算法MLR

原文:http://www.sohu.com/a/146522397_463994 阿里媽媽,是一個想讓天下沒有難做的營銷的大數據平臺,它擁有阿里巴巴集團的核心商業數據。在這裏,每天有超過50億的推廣流量完成超過3億件商品的推廣展現,覆

原创 【總結】推薦系統學習-LibMF

介紹   LibMF的作者是大名鼎鼎的臺灣國立大學,他們在機器學習領域享有盛名,近年連續多屆KDD Cup競賽上均獲得優異成績,並曾連續多年獲得冠軍。業界常用的LibSVM, Liblinear等都是他們開發的,開源代碼的效率和質量都非

原创 【方法】實例詳解機器學習如何解決問題

來源:http://tech.meituan.com/mt-mlinaction-how-to-ml.html 前言 隨着大數據時代的到來,機器學習成爲解決問題的一種重要且關鍵的工具。不管是工業界還是學術界,機器學習都是一個炙手可熱的

原创 【總結】推薦系統學習-SVDFeature

介紹   SVDFeature是由Apex Data & Knowledge Management Lab在KDD CUP11競賽中開發出來的工具包。它的目的是有效地解決基於特徵的矩陣分解。新的模型可以只通過定義新的特徵來實現。這種基於特

原创 【總結】推薦算法之工具包

1、SVDFeature    主頁:http://svdfeature.apexlab.org/wiki/Main_Page  開發語言:C++    2、LibMF    主頁:http://www.csie.ntu.edu.tw/~

原创 【實踐】廣告ctr模型之Deep cross network (dcn)

廣告ctr模型可用的深度模型其本質架構都一樣(可見https://blog.csdn.net/dengxing1234/article/details/79916532),這也是限制了模型的發展路線。Deep cross network在

原创 【算法】阿里雙十一推薦技術

阿里妹導讀:雙十一手淘首頁個性化場景是推薦生態鏈路中最大的場景之一,在手淘APP承載了整體頁面的流量第一入口,對用戶流量的整體承接、分發、調控,以及用戶興趣的深度探索與發現上起着至關重要的作用。雙11手淘首頁的幾個重要推薦場景截圖如下: 

原创 【算法】深度學習在CTR預估/推薦系統中的應用探索

前言深度學習憑藉其強大的表達能力和靈活的網絡結構在 NLP、圖像、語音等衆多領域取得了重大突破。在廣告領域,預測用戶點擊率(Click Through Rate,簡稱 CTR)領域近年也有大量關於深度學習方面的研究。本文就近幾年 CTR

原创 【算法】CTR預估中的貝葉斯平滑方法(一)

1. 背景介紹 廣告形式: 互聯網廣告可以分爲以下三種: 1)展示廣告(display ad) 2)搜索廣告(sponsored search ad) 3)上下文廣告(contextual ad)   競價模式: 對於在線廣告,主要有以下

原创 【實踐】Spark 協同過濾ALS之Item2Item相似度計算優化

最近項目在做推薦系統中match 策略中的CF召回優化,自之前第一版自己實現的基於item的協同過濾算法http://blog.csdn.net/dengxing1234/article/details/76122465,考慮到用戶隱型評