原创 位圖算法的應用

位圖的應用 編程珠璣 Chapter1 位圖或位向量圖作爲一個集合,表示的這樣的一個數據結構:           用字符串 0 1 1 1 0 1 0 0 1 0 0 0 0 1 0 0 0 0 0 0 表示集合 {1,2,3,5,8

原创 事件驅動

3.4 事件驅動——有事我叫你,沒事別煩我 勞心者治人 , 勞力者治於人                                            ——《孟子·滕文公上》   關鍵詞:編程範式 , 事件驅動式

原创 基於JVM的異常診斷和性能調優

JVM GC 原理介紹:     以前我作爲java 開發人員,用的都是sun 的JVM (這也是當今最好用的虛擬機),由於垃圾收集的工作都是交給JVM 做,只要編碼的時候注意不要在靜態的集合對象中只添加對象,而不刪除對象的情況發生,就

原创 位操作基礎篇之位操作全面總結

      位操作篇共分爲基礎篇和提高篇,基礎篇主要對位操作進行全面總結,幫助大家梳理知識。提高篇則針對各大IT公司如微軟、騰訊、百度、360等公司的筆試面試題作詳細的解答,使大家能熟練應對在筆試面試中位操作題目。       下面就

原创 Learning To Rank之LambdaMART的前世今生

1.       前言          我們知道排序在很多應用場景中屬於一個非常核心的模塊,最直接的應用就是搜索引擎。當用戶提交一個query,搜索引擎會召回很多文檔,然後根據文檔與query以及用戶的相關程度對文檔進行排序,這些文檔

原创 手把手教你把Vim改裝成一個IDE編程環境(圖文)

手把手教你把Vim改裝成一個IDE編程環境(圖文) 本文轉自:http://blog.csdn.net/wooin/article/details/1858917 By: 吳垠 Date: 2007-09-07 Version: 0.5

原创 主題模型-LDA淺析

        上個月參加了在北京舉辦SIGKDD國際會議,在個性化推薦、社交網絡、廣告預測等各個領域的workshop上都提到LDA模型,感覺這個模型的應用挺廣泛的,會後抽時間瞭解了一下LDA,做一下總結: (一)LDA作用      

原创 頻繁項集挖掘算法之FPGrowth

背景:         頻繁項集挖掘算法用於挖掘經常一起出現的item集合(稱爲頻繁項集),通過挖掘出這些頻繁項集,當在一個事務中出現頻繁項集的其中一個item,則可以把該頻繁項集的其他item作爲推薦。比如經典的購物籃分析中啤酒、尿布故

原创 基於物品的協同過濾推薦算法——讀“Item-Based Collaborative Filtering Recommendation Algorithms”

        最近參加KDD Cup 2012比賽,選了track1,做微博推薦的,找了推薦相關的論文學習。“Item-Based Collaborative Filtering Recommendation Algorithms”這篇

原创 位圖排序及其擴展應用——《編程珠璣》讀書筆記

        一、基本的位圖排序         問題1:輸入一個包含n=100萬個正整數的文件,每個正整數都小於N=1000萬,而且這100萬個正整數沒有重複,對這個文件的數字進行排序,保存結果到文件中。要求佔用儘可能小的內存,速度

原创 洗牌程序

        之前在寫抽樣問題——《編程珠璣》讀書筆記這篇文章的時候提到將一個數列進行重新排列,目的是弄亂原有數據的排列,相當於洗牌,這篇文章主要講講這個洗牌程序的實現。         一、Fisher–Yates Shuffle  

原创 插入查找元素效率問題——《編程珠璣》讀書筆記

        這兩天看了第13章,看了好長一段時間,主要花在理解和編程實現上面,感覺自己的理解能力還有待提高。         這一章主要講如何實現一個有序集合(Set),該集合插入元素時不能插入重複元素,每次插入完後集閤中元素的排列是

原创 Bloom Filter的基本原理和變種

        學習一個東西首先要知道這個東西是什麼,可以做什麼,接着再瞭解這個東西有什麼好處和優勢,然後再學習他的工作原理。下面我們分別從這三點簡單介紹一下bloom filter,以及和他的變種。 What:在允許一定的錯誤率的情況下

原创 淺談網絡廣告

        今天下午參加了品友公司舉辦的技術交流會,該公司是做數字廣告平臺的,聽了一下午,技術上只瞭解了那麼幾個概念,收穫不大,倒是對網絡廣告的模式有了基本的認識。當聽到他們公司廣告投放平臺是怎麼運作的時候,對網絡投放廣告盈利模式比較

原创 史上最全的搜索下拉提示用戶交互研究——讀《An Eye-tracking Study of User Interactions with Query Auto Completion》

        搜索下拉提示(Query Auto Completion,簡稱QAC)現在幾乎是每個搜索引擎必備的基本功能,作用是在用戶在搜索框輸入查詢詞的過程中,給用戶展示一系列搜索查詢query供用戶選擇,可以方便用戶輸入、縮短用戶