原创 搜索技術博客-淘寶

關注技術 關注搜索 關注淘寶        “機器學習”這個名詞對大家來說想必不是一個陌生的詞彙,特別對算法組的同學來說,工作中或多或少接觸使用過這種“高科技“。對於我來說,剛來淘寶工作一個月就開始接觸了機器學習,當時做主搜索功夫熊貓

原创 sscanf函數和正則表達式

此文所有的實驗都是基於下面的程序: char str[10]; for (int i = 0; i < 10; i++) str[i] = '!'; 執行完後str的值爲 str = "!!!!!!!!!!" 我們把str的每

原创 機器學習經典論文/survey合集 - 算法組

Active LearningApplicationsBiologyClassification Supervised Machine Learning: A Review of Classification Techniques, Ko

原创 梯度下降法學習速率設置技巧

轉自:http://blog.datumbox.com/tuning-the-learning-rate-in-gradient-descent/ In most Supervised Machine Learning probl

原创 從最大似然到EM算法淺解

從最大似然到EM算法淺解 [email protected] http://blog.csdn.net/zouxy09          機器學習十大算法之一:EM算法。能評得上十大之一,讓人聽起來覺得挺NB的。什麼是NB啊,我們一般

原创 談C/C++指針精髓

談C/C++指針精髓 作者簡介: 馬偉,現任大方軟件開發工程師,在C家族(C,C++,C# 呵呵,因爲都有個C,所以我習慣稱爲C家族)方面有一定的見解。 E-MAIL:[email protected] QQ:32894

原创 淺談const的使用

 在C++中經常會涉及到const的使用,而且const的使用也同樣困擾着許多剛接觸C++的程序員,現將C++中常用到的const的使用總結於下:    1.const用於各種常量定義     表示該常量在程序中是不可改變,如我們定

原创 LibSVM學習(三)——LibSVM使用規範

      其實,這部分寫也是多餘,google一下“libsvm使用”,就會N多的資源,但是,爲了讓你少費點心,在這裏就簡單的介紹一下,有不清楚的只有動動你的mouse了。需要說明的是,2.89版本以前,都是svmscale、svmt

原创 linux下Clucene-2.3.3.4安裝方法

一、安裝需要軟件 1.g++ 2.cmake 3.zlib(安裝方法apt-get insatll zlib1g-dev,使用數據源是網易的鏡像,注意zlib後是“一”不是“l”) 二、安裝步驟 1.cd到clucene目錄下

原创 讀“機器學習中的範數規則化之(一)L0、L1與L2範數”筆記

項目中遇到範數正則化問題,今天拜讀了鄒曉藝大神的博文《機器學習中的範數規則化之(一)L0、L1與L2範數》, 1)其中L0、L1主要是用來特徵選擇,能夠將含有信息量小的特徵權重優化爲0,從而降低特徵的維度 2)L2主要是來防止過擬合(其實

原创 在CLucene-2.3.3.4中加入ICTCLAS實現中文分詞

一、修改Mic中的兩個編碼轉化函數 void Misc::_cpywideToChar(const wchar_t* s, char* d, size_t len){     //size_t sLen = wcslen(s);   

原创 談一談sizeof與strlen

sizeof與strlen都可以用來測量字符數組的大小,通過一個列子來看它們的不同 例:      char *ss1 = "abcdefg";      char ss2[] = "abcdefg";      char ss

原创 函數指針的用法(C++)

轉自:http://blog.sina.com.cn/s/blog_5e71ee700100fo13.html 作者:俊傑  typedef函數指針的用法(C++)    代碼簡化, 促進跨平臺開發的目的.  typede

原创 struct和union結構體和聯合體的區別

共用體 構造數據類型,也叫聯合體 用途:使幾個不同類型的變量共佔一段內存(相互覆蓋) 結構體是一種構造數據類型 用途:把不同類型的數據組合成一個整體-------自定義數據類型 -----------------------------

原创 動態層次聚類方法示例

Connections 17(2):78-80 Copyright 1994 INSNA Stephen P. Borgatti University of South Carolina Given a set of N items