鏈家大數據使用到的機器學習算法

摘自: InfoQ對鏈家網大數據架構師蔡白銀的訪談

InfoQ:房地產數據挖掘會用到哪些算法?
蔡白銀:房產領域的數據挖掘用到的算法和平常大家用到的算法並不會有什麼類別的不同,只是數據挖掘本身需要和業務緊密關聯,所以這些算法在房產領域的使用細節上會有不同。
我們現如今已經使用的算法包括了 GBDT、隨機森林、Hedonic、神經網絡、卷積神經網絡、邏輯迴歸、SVM、HMM、ItemCF、UserCF、聚類算法等。
GBDT、隨機森林、Hedonic、神經網絡是我們在估價中使用的。卷積神經網絡是我們在戶型圖識別中使用的, 邏輯迴歸、SVM則是在用戶畫像中判別同一用戶、和判別用戶是否是買家還是賣家使用。HMM是我們用來描述用戶買賣行爲階段的算法。 聚類則是用在相似的樓盤識別,也用在了房源推薦和小區推薦當中。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章