原创 集體智慧編程_聚類

  發現組羣     這一章讓我很糾結,主要是我個人對python略懂,所以裏面很多的程序在python現在的版本中非常的不給力,尤其是那個gernerater的錯誤。這一章的題目是“發現組羣”,我覺得叫”組羣發現“好多了,而且我覺得中文

原创 Building Bridges for Web Query Classification

   前面幾篇論文都感覺在用詞方面我沒有怎麼講究,比如我通常籠統的說“查詢分類”。其實“查詢分類”還可以細分爲兩種,一種是我一直在強調的“意圖分類(intent classification)”,另一種就是“主題分類(topic clas

原创 Determining the informational, navigational and transactional intent of web queries

一篇非常長的文章,裏面的研究方法非常值得借鑑。從問題的分析,到數據的採集與加工,再到實驗以及實驗分析等等,都非常的詳細。論文題目是《Determining the informational, navigational and trans

原创 Understanding User Goals in Web Search

這是04年的一篇論文,題目是《Understanding User Goals in Web Search》,翻譯過來就是Web檢索中的用戶意圖理解。這個論文之所以我想看,是因爲他的作者是搜索巨頭雅虎裏面的牛人寫得,而且和鼻祖Border

原创 集體智慧編程_前言

  《集體智慧編程》(《Programming Collective Intelligence》)   這本書是我很久以前就很想看的一本書了,可能從名字上面看,很多人都會覺得莫名其妙,不知所云。的確,對於一般的望文生義,書名的確和機器

原创 Intentinal Query Suggestion: Making User Goals More Explicit During Search

其實總結起來,自己多多少少也看了這麼多的文章了,但是很多文章都是在說如何分類的事情。一個關鍵的問題是:如果分類出來了,有什麼作用?今天找了一篇非常給力的論文,將查詢意圖分類應用到了查詢建議中。前面也講過一篇論文,應用的領域也是查詢建議的

原创 The Intention Behind Web Queries

今天看了一篇論文,在以前看的很多論文中,都被引用了。題目是《The Intention Behind Web Queries》,作者是Baeza等,同樣是來自雅虎。這篇論文說實話我非常沒有看懂,這裏只是作爲一個記錄,以後如果想起來了這裏提

原创 手機版淘寶網日問量超3000萬 長尾效應明顯

 還沒上手機淘過東西嗎?那你真的OUT了。      2010年5月19日,淘寶網無線事業部負責人首次對外透露,手機版淘寶網(m.taobao.com)日訪問量已經超過3000萬,日交易筆數超過10萬,這意味着無線淘寶的發展潛力巨大,手

原创 Determining the Unser Intent of Web Search Engine Queries

05年的一篇論文,那個時候的方法就是啓發式。論文的題目《Determining the Unser Intent of Web Search Engine Queries》,翻譯過來是《Web查詢的用戶意圖識別》,作者是Jansen。  

原创 集體智慧編程_推薦系統2

上一篇裏面的協作過濾方法是基於用戶的,方法都是首先需要找到與自己相近的用戶,讓後利用這些小範圍的用戶來對自己沒有看到過的東西進行推薦。但是考慮一個情況,比如說淘寶,註冊用戶已經超過了六千萬左右,而且現在還在不停的漲。那麼上面的基於用戶的

原创 目的性標籤:一點兒思考

想象一下,我們平時在爲一個網站或者網頁作標籤的時候,我們用的是什麼方法,或者在標記的時候我們心裏是想得什麼東西。一個我相信很大衆的思維是:我的標註的依據就是這個網頁的“內容”。即這個網頁的內容是描述的什麼,我們就標註什麼。但是有這樣一個問

原创 Web搜索中的用戶意圖的自動識別

讀這篇文章,是因爲的確是太簡單易懂了,但是整個論文的結構卻是非常的嚴謹。從分析問題,到解決問題,特別是最後的實驗數據的說明,都是非常的詳細。不得不感嘆國外學者的治學態度,很小的一個問題,能夠將其講得如此透徹。論文的題目是《Automati

原创 Automatic Query Type Identification Based on Click Through Information

對於查詢意圖的自動分類,在前期也介紹過一篇,通過的是點擊的分佈和錨文本的分佈信息來判斷。今天讀了一篇清華的論文,在國外引用都是非常多的,因爲對於日誌類的資源利用,貌似這個的效果(P和R)都是最好的。這個論文的題目是《Automatic

原创 Effects ofGoal-Oriented Search Suggestions

  前幾天看的論文都是講如何進行意圖分類,而且在提到用途的時候都用一句話歸納:能夠提高搜索引擎的檢索質量,能夠對不同類別提供不同的排序算法。但是真正的利用起來都顯得比較蒼白,今天偶然看到一篇論文,這個論文寫得非產的好懂,值得一提的是它將意

原创 A web search analysis considering the intention behind queries

今天看了一個電影叫做《哈特的戰爭》,感覺非常好看。然後看了一篇論文,論文非常的長,看得不是非常仔細。論文名《A web search analysis considering the intention behind queries》,翻