原创 主題模型LDA及其在微博推薦&廣告算法中的應用--第1期

因爲原文偶爾會出現訪問不了的情況,所以特拷貝於此。 原文鏈接:http://www.wbrecom.com/?p=136                                

原创 scrapy模擬登錄新浪微博

原文鏈接:http://flychen.sinaapp.com/article/scrapy-analog-logged-sina-microblogging.html 這個文章還沒試,所以不知道文中的方法對現在的微博登陸系統是否還有

原创 微博推薦引擎體系結構簡述

原文鏈接:http://www.wbrecom.com/?p=48 這裏有個“道術孰優”的問題,何爲“道”?何爲“術”?舉個例子的話,《孫子兵法》是道,而《三十六計》則爲術。“道”所述,是宏觀的、原理

原创 漫談:機器學習中距離和相似性度量方法

原文鏈接:http://www.cnblogs.com/daniel-D/p/3244718.html 在機器學習和數據挖掘中,我們經常需要知道個體間差異的大小,進而評價個體的相似性和類別。最常見的是數據分析中的相關分析,數據

原创 微軟101道經典面試題

原文鏈接:http://blog.csdn.net/zzwu/article/details/1244905 微軟101道經典面試題   Algorithms and Programming 1. Given a

原创 LDA

原文鏈接:http://yinwenpeng1987.blog.163.com/blog/static/162471582201121210828165/ ____http://sy95122.blog.163.com/blog/

原创 機器學習經典算法詳解及Python實現–K近鄰(KNN)算法

原文鏈接:http://dataunion.org/?p=4237 作者:suipingsp (一)KNN依然是一種監督學習算法 KNN(K Nearest Neighbors,K近鄰 )算法是機器學習所有算法中理論最簡

原创 lda代碼的一些資料

原文鏈接:點擊打開鏈接 首先,我以前總結過,關於北郵一個人寫的導讀,連接在這裏。 肯定得看Blei 2003年的論文,點擊下載。 然後很重要的Blei的視頻和一個80多頁的Lecture。 Topic Models

原创 數據挖掘之大數據流處理

原文鏈接:http://blog.csdn.net/viewcode/article/details/9088467 目錄(?)[+] 大數據流 即 實時收集的大量的數據。 數據的流量大到無法實時將全部數據放入分

原创 如何準備機器學習工程師的面試

原文鏈接:http://www.zhihu.com/question/23259302 如何準備機器學習工程師的面試 ?修改 我之前面試一些公司的機器學習或者數據挖掘工程師的職位。感覺自己準備的不夠充分。想了解下一般

原创 聚類(1)——混合高斯模型 Gaussian Mixture Model

原文鏈接:http://blog.csdn.net/jwh_bupt/article/details/7663885 聚類系列: 聚類(序)----監督學習與無監督學習 聚類(1)----混合高斯模型 Gau

原创 Java模式(適配器模式)

原文鏈接:http://blog.csdn.net/elegant_shadow/article/details/5006175 今天看了下Java中的適配器模式,以下就來小做下總結和談談感想,以便日後使用。   首

原创 新浪微博模擬登錄 java實現

原文鏈接:http://yuncode.net/code/c_542f981eec3be26 package com.shiyimm.crawler.weibo; import java.io.FileNotFoundE

原创 基於機器學習方法的POI品類推薦算法

原文鏈接:http://dataunion.org/?p=4211 作者:wangbogong 前言 在美團商家數據中心(MDC),有超過100w的已校準審覈的POI數據(我們一般將商家標示爲POI,POI基礎信

原创 Python模擬新浪微博登錄

原文鏈接:http://blog.javachen.com/2014/03/18/simulate-weibo-login-in-python/ 看到一篇Python模擬新浪微博登錄的文章,想熟悉一下其中實現方式,並