原创 AdaRank和AdaBoost

這篇論文的題目是AdaRank: A Boosting Algorithm for InformationRetrieval。作者是微軟亞洲研究院的的徐君和李航。 這篇文章的主要思想就是利用boosting算法的思想在learning t

原创 梯度下降法-python代碼

一個通過迭代求解convex function最小值的方法: Gradient descent(梯度下降法) http://en.wikipedia.org/wiki/Gradient_descent 這裏給出一個python的代碼

原创 Semantic Search: The Myth and Reality 及其中文翻譯

 Semantic Search: The Myth and RealityWritten by Alex Iskold / May 29, 2008

原创 劉鐵巖-learning to rank

轉載-劉鐵巖 在研究院工作快5年了,沒想到電子工程出身的我會和SIGIR注1,這一信息檢索領 域的頂級會議,結下如此的不解之緣。 從2004年到2008年,自己在信息檢索這個方向上走過的道路,也是自己在微軟亞洲 研究院不斷成

原创 learning to rank 評價指標 MAP NDCG

MAP(Mean average precision):評價一個rank方法性能的一個指標,現在有很多query,首先看rank方法對各個query來說性能分別是怎麼樣的(也就是AP),再平均起來,就是MAP。AP怎麼算那?舉個例子,

原创 vc demension

VC 維在有限的訓練樣本情況下,當樣本數 n 固定時,此時學習機器的 VC 維越高學習機器的複雜性越高。VC 維反映了函數集的學習能力,VC 維越大則學習機器越複雜(容量越大)。  所謂的結構風險最小化就是在保證分類精度(經驗風險)的同

原创 彈球遊戲2--間隔計時器,信號

 間隔計時器(interval timer)      int setitimer(int which, const struct itimerval *new_value,                    struct itim

原创 會議排名

說明: 純屬個人看法, 僅供參考. tier-1的列得較全, tier-2的不太全, tier-3的很不全.同分的按字母序排列. 不很嚴謹地說, tier-1是可以令人羨慕的, tier-2是可以令人尊敬的,由於AI的相關會議非常多, 所

原创 BM25算法

BM25算法,通常用來作搜索相關性平分。一句話概況其主要思想:對Query進行語素解析,生成語素qi;然後,對於每個搜索結果D,計算每個語素qi與D的相關性得分,最後,將qi相對於D的相關性得分進行加權求和,從而得到Query與D的相關

原创 CoNLL大會內容

CoNLL(Conference on Computational Natural Language Learning)大會有論文集和評測06年:13種語言的依存句法分析評測(有漢語)07年:多語言依存分析(有漢語);英文依存分析的跨領域

原创 [轉]知乎上某人寫面試豆瓣產品經理的經歷

面試豆瓣產品經理的題目,你能答出來麼?經過長達一週的時間,我終究還是沒能弄明白這道題目,在我面試史上那個光燦燦的問題!話說給豆瓣投了移動產品經理職位的簡歷,當天收到人力回信,讓提交一個豆瓣社區或是類街旁LBS產品的研究報告,心想,哇!“豆

原创 ubuntu10.0.4下安裝tomcat

下 載:     從tomcat的官方下載新的tomcat版本 http://tomcat.apache.org/download-70.cgi 注意 ,一定要下載非源碼文件(題目中不帶src的),否則運行tomcat時會出現錯

原创 vi常用快捷鍵

一、移動光標 1)       h或 向左方向鍵(←)→ 光標向左移動一個字元  2)       j或 向下方向鍵(↓)→ 光標向下移動一個字元  3)       k或 向上方向鍵(↑)→ 光標向上移動一個字元  4)  

原创 皮爾遜相關係數

歐幾里德距離 歐幾里得度量定義歐幾里得空間中點 x = (x1,...,xn) 和 y = (y1,...,yn) 之間的距離爲 但是當評價結果中,評價者的評價相對於平均水平偏離很大的時候歐幾里德距離不能很好的揭示出真實的相似度.還有一

原创 無法找到稱心職位的25個原因

記住這些問題,很多讀者在找工作時,一定會增加成功的機會。 當你找工作時,若你覺得許多因素你不能掌控從而影響了你得到工作的可能性那會使你發 狂。 經濟,你所在的地理位置,行業趨勢,甚至招聘者的心情,都會對你是否能得到工作產生 影響。