原创 ubuntu環境安裝PHP+Apache

參考的是PHP與MYSQL程序設計(第三版)   mysql已經是按照ubuntu的apt-get先裝好的,所以剩下的任務就是裝apache和PHP了 去官網上下載的安裝包,不再累述。 一. Apache的安裝 1: $tar zxvf

原创 我不會OOO,仍然可以XXX

  轉載時請註明出處和作者聯繫方式文章出處:http://www.limodev.cn/blog作者聯繫方式:李先靜 <xianjimli at hotmail dot com>   按照《審死官》裏的讀法,標題可以讀着:答覆:我不會圈

原创 講講volatile的作用

轉載,原文地址是:http://blog.21ic.com/user1/2949/archives/2007/35599.html 一個定義爲volatile的變量是說這變量可能會被意想不到地改變,這樣,編譯器就不會去假設這個變量的值

原创 PKU ACM 1000~1010解題總結

1001 求高精度冪 分析: 其實也就是高精度,大數值的乘法。 方法: 實際使用的是通過字符數組來保存輸入和輸出,並利用字符數組模擬手算乘法的步奏來實現高精度的乘法。 難點: 思路需清楚,小數點的位置要處理好,可以考慮把小數和整數部分分

原创 鏈接裝載與庫《程序員的自我修養》 之 全局符號衝突問題

鏈接裝載與庫《程序員的自我修養》 之 全局符號衝突問題   1. 由強符號和弱符號引起的全局符號衝突 強符號:編譯器默認函數和初始化了的全局變量 弱符號:未初始化的全局變量爲弱符號(也可以通過gcc的__attribute__((wea

原创 Everything You Wanted to Know About Machine Learning

Everything You Wanted to Know About Machine Learning 翻譯了理解機器學習的10個重要的觀點,加入了自己的理解,這些原則在大部分情況下也許是這樣,但是具體問題具體分析纔是王道,不加思索的

原创 gbrt(gbdt)源碼分享

GBDT(Gradient Boost Decision Tree) 目前是工業界最爲流行的機器學習工具之一,我最近依據一些開源實現,寫了一個精簡版的gbrt,也就是(Gradient Boost Regression Tree),因爲

原创 Latent Semantic Analysis (LSA) Tutorial 潛語義分析LSA介紹 七

WangBen 20110916 Beijing Advantages, Disadvantages, and Applications of LSA LSA的優勢、劣勢以及應用 Latent SemanticAnalysis has

原创 機器學習特徵選擇之卡方檢驗與互信息

by wangben  @ beijing 特徵選擇的主要目的有兩點: 1.      減少特徵數量提高訓練速度,這點對於一些複雜模型來說尤其重要 2.      減少noisefeature以提高模型在測試集上的準確性。一些噪音特徵會

原创 機器學習評價方法之NRIG

by wangben 2015.11 在工業界,邏輯迴歸是很常用的模型,一般大家在用邏輯迴歸做機器學習排序或者廣告預估時常用AUC來判斷排序的效果,邏輯迴歸是概率模型,除了排序的指標之外,有時會出現AUC比較好,但是概率擬合較差(很有可能

原创 Latent Semantic Analysis (LSA) Tutorial 潛語義分析LSA介紹 六

            WangBen 20110916 Beijing Part 4 - Clustering by Color 用顏色聚類 We can also turnthe numbers into colors. Fo

原创 What is success if you don't know your main goal in life?

from James Altucher I thought I was done with the hard work of being a human being. I sold my first company for $15 mil

原创 Latent Semantic Analysis (LSA) Tutorial 潛語義分析LSA介紹 四

WangBen 20110916 Beijing Part 2 - Modify the Counts with TFIDF 計算TFIDF替代簡單計數 In sophisticated Latent Semantic Analysis

原创 如何刪除Amazon (kindle) 雲端文件

要求:使用chrome瀏覽器或者搜狗瀏覽器的“高速”模式。firefox等瀏覽器我沒有測試過,理論上適用;搜狗的“兼容”模式實測無效(應該是IE內核版本過低,對javascript的支持有問題)。另外如果有人第一次點擊書籤之後沒有出現複選

原创 weak-and算法原理演示(wand)

推薦一個在信息檢索中用到的weak-and算法,這個算法在廣告系統中有成熟的應用。   簡單來說,一般我們在計算文本相關性的時候,會通過倒排索引的方式進行查詢,通過倒排索引已經要比全量遍歷節約大量時間,但是有時候仍然很慢。 原因是很多時候