機器學習當前資料集

轉自http://blog.csdn.net/u014035838/article/details/41251975

的學習資料集

Deep Learning(深度學習)

ufldl的2個教程(這個沒得說,入門絕對的好教程,Ng的,邏輯清晰有練習):一

ufldl的2個教程(這個沒得說,入門絕對的好教程,Ng的,邏輯清晰有練習):二

Bengio團隊的deep learning教程,用的theano庫,主要是rbm系列,搞python的可以參考,很不錯。

deeplearning.net主頁,裏面包含的信息量非常多,有software, reading list, research lab, dataset, demo等,強烈推薦,自己去發現好資料。

Deep learning的toolbox,matlab實現的,對應源碼來學習一些常見的DL模型很有幫助,這個庫我主要是用來學習算法實現過程的。

2013年龍星計劃深度學習教程,鄧力大牛主講,雖然老師準備得不充分,不過還是很有收穫的。

Hinton大牛在coursera上開的神經網絡課程,DL部分有不少,非常贊,沒有廢話,課件每句話都包含了很多信息,有一定DL基礎後去聽收穫更大。

Larochelle關於DL的課件,邏輯清晰,覆蓋面廣,包含了rbm系列,autoencoder系列,sparse coding系列,還有crf,cnn,rnn等雖然網頁是法文,但是課件是英文。

CMU大學2013年的deep learning課程,有不少reading paper可以參考。

達慕思大學Lorenzo Torresani的2013Deep learning課程reading list.

Deep Learning Methods for Vision(餘凱等在cvpr2012上組織一個workshop,關於DL在視覺上的應用)。

斯坦福Ng團隊成員鏈接主頁,可以進入團隊成員的主頁,比較熟悉的有Richard Socher, Honglak Lee, Quoc Le等。

多倫多ML團隊成員鏈接主頁,可以進入團隊成員主頁,包括DL鼻祖hinton,還有Ruslan Salakhutdinov , Alex Krizhevsky等。

蒙特利爾大學機器學習團隊成員鏈接主頁,包括大牛Bengio,還有Ian Goodfellow 等。

紐約大學的機器學習團隊成員鏈接主頁,包括大牛Lecun,還有Rob Fergus等。

豆瓣上的腦與deep learning讀書會,有講義和部分視頻,主要介紹了一些於deep learning相關的生物神經網絡。

Large Scale ML的課程,由Lecun和Langford講的,能不推薦麼。

Yann Lecun的2014年Deep Learning課程主頁,強烈推薦。

一些常見的DL code列表,csdn博主zouxy09的博文,Deep Learning源代碼收集-持續更新…

Deep Learning for NLP (without Magic),由DL界5大高手之一的Richard Socher小組搞的,他主要是NLP的。

2012 Graduate Summer School: Deep Learning, Feature Learning,高手雲集,深度學習盛宴,幾乎所有的DL大牛都有參加。

matlab下的maxPooling速度優化,調用C++實現的。

2014年ACL機器學習領域主席Kevin Duh的深度學習入門講座視頻。

 

Machine Learning(機器學習):

介紹圖模型的一個ppt,非常的贊,ppt作者總結得很給力,裏面還包括了HMM,MEM, CRF等其它圖模型。反正看完挺有收穫的。

機器學習一個視頻教程,youtube上的,翻吧,內容很全面,偏概率統計模型,每一小集只有幾分鐘。 

龍星計劃2012機器學習,由余凱和張潼主講。

demonstrate 的 blog :關於PGM(概率圖模型)系列,主要按照Daphne Koller的經典PGM教程介紹的,大家依次google之

FreeMind的博客,主要關於機器學習的。

Tom Mitchell大牛的機器學習課程,他的machine learning教科書非常出名。

CS109,Data Science,用python介紹機器學習算法的課程。

 

Computer Vision(計算機視覺):

MIT2013年秋季課程:Advances in Computer Vision,有練習題,有些有code.

IPAM一個計算機視覺的短期課程,有不少牛人蔘加。

 

OpenCV相關:

http://opencv.org/

2012年7月4日隨着opencv2.4.2版本的發佈,opencv更改了其最新的官方網站地址。

http://www.opencvchina.com/

好像12年纔有這個論壇的,比較新。裏面有針對《learning opencv》這本書的視頻講解,不過視頻教學還沒出完,正在更新中。對剛入門學習opencv的人來說很不錯。

http://www.opencv.org.cn/forum/

opencv中文論壇,對於初次接觸opencv的學者來說比較不錯,入門資料多,opencv的各種英文文檔也翻譯成中文了。不足是感覺這個論壇上發帖提問很少人回答,也就是說討論不夠激烈。

http://opencv.jp/

opencv的日文網站,裏面有不少例子代碼,看不懂日文可以用網站自帶的翻譯,能看個大概。

http://code.opencv.org/projects/opencv

opencv版本bug修補,版本更新,以及各種相關大型活動安排,還包含了opencv最近幾個月內的活動路線,即未來將增加的功能等,可以掌握各種關於opencv進展情況的最新進展。

http://tech.groups.yahoo.com/group/OpenCV/

opencv雅虎郵件列表,據說是最好的opencv論壇,信息更新最新的地方。不過個人認爲要查找相關主題的內容,在郵件列表中非常不方便。

http://www.cmlab.csie.ntu.edu.tw/~jsyeh/wiki/doku.php

臺灣大學暑假集訓網站,內有鏈接到與opencv集訓相關的網頁。感覺這種教育形式還蠻不錯的。

http://sourceforge.net/projects/opencvlibrary/

opencv版本發佈地方。

http://code.opencv.org/projects/opencv/wiki/ChangeLog#241    http://opencv.willowgarage.com/wiki/OpenCV%20Change%20Logs

opencv版本內容更改日誌網頁,前面那個網頁更新最快。

http://www.opencv.org.cn/opencvdoc/2.3.2/html/doc/tutorials/tutorials.html

opencv中文教程網頁,分幾個模塊講解,有代碼有過程。內容是網友翻譯opencv自帶的doc文件裏的。

https://netfiles.uiuc.edu/jbhuang1/www/resources/vision/index.html

網友總結的常用帶有cvpr領域常見算法code鏈接的網址,感覺非常的不錯。

http://fossies.org/dox/OpenCV-2.4.2/

該網站可以查看opencv中一些函數的變量接口,還會列出函數之間的結構圖。

http://opencv.itseez.com/

opencv的函數、類等查找網頁,有導航,查起來感覺不錯。

 

優化:

http://submodularity.org/

submodual優化。

 

數學:

http://www.youku.com/playlist_show/id_19465801.html

《計算機中的數學》系列視頻,8位老師10講內容,生動介紹微積分和線性代數基本概念在計算機學科中的各種有趣應用!

 

Linux學習資料:

http://itercast.com/library/1

linux入門的基礎視頻教程,對於新手可選擇看第一部分,視頻來源於LinuxCast.net網站,還不錯。

 

OpenNI+Kinect相關:

http://1.yuhuazou.sinaapp.com/

網友晨宇思遠的博客,主攻cvpr,ai等。

http://blog.csdn.net/chenli2010/article/details/6887646

kinect和openni學習資料彙總。

http://blog.csdn.net/moc062066/article/category/871261

OpenCV 計算機視覺 kinect的博客:

http://kheresy.wordpress.com/index_of_openni_and_kinect/comment-page-5/

網友Heresy的博客,裏面有不少kinect的文章,寫的比較詳細。

http://www.cnkinect.com/

體感遊戲中文網,有不少新的kinect資訊。

http://www.kinectutorial.com/

Kinect體感開發網。

http://code.google.com/p/openni-hand-tracker

openni_hand_tracking google code項目。

http://blog.candescent.ch/

網友的kinect博客,裏面有很多手勢識別方面的文章介紹,還有源碼,不過貌似是基於c#的。

https://sites.google.com/site/colordepthfusion/

一些關於深度信息和顏色信息融合(fusion)的文章。

http://projects.ict.usc.edu/mxr/faast/

kinect新的庫,可以結合OpenNI使用。

https://sites.google.com/a/chalearn.org/gesturechallenge/

kinect手勢識別網站。

http://www.ros.org/wiki/mit-ros-pkg

mit的kinect項目,有code。主要是與手勢識別相關。

http://www.thoughtden.co.uk/blog/2012/08/kinecting-people-our-top-6-kinect-projects/

kinect 2012年度最具創新的6個項目,有視頻,確實夠創新的!

http://www.cnblogs.com/yangyangcv/archive/2011/01/07/1930349.html

kinect多點觸控的一篇博文。

http://sourceforge.net/projects/kinect-mex/

http://www.mathworks.com/matlabcentral/fileexchange/30242-kinect-matlab

有關matlab for kinect的一些接口。

http://news.9ria.com/2012/1212/25609.html

AIR和Kinect的結合,有一些手指跟蹤的code。

http://eeeweba.ntu.edu.sg/computervision/people/home/renzhou/index.htm

研究kinect手勢識別的,任洲。剛畢業不久。

 

其他網友cvpr領域的鏈接總結:

http://www.cnblogs.com/kshenf/

網友整理常用牛人鏈接總結,非常多。不過個人沒有沒有每個網站都去試過。所以本文也是我自己總結自己曾經用過的或體會過的。

 

OpenGL有關:

http://nehe.gamedev.net/

NeHe的OpenGL教程英文版。

http://www.owlei.com/DancingWind/

NeHe的OpenGL教程對應的中文版,由網友周瑋翻譯的。

http://www.qiliang.net/old/nehe_qt/

NeHe的OpengGL對應的Qt版中文教程。

http://blog.csdn.net/qp120291570

網友"左腦設計,右腦編程"的Qt_OpenGL博客,寫得還不錯。

http://guiliblearning.blogspot.com/

這個博客對opengl的機制有所剖析,貌似要翻牆才能進去。

 

cvpr綜合網站論壇博客等:

http://www.cvchina.net/

中國計算機視覺論壇

http://www.cvchina.info/

這個博客很不錯,每次看完都能讓人興奮,因爲有很多關於cv領域的科技新聞,還時不時有視頻顯示。另外這個博客裏面的資源也整理得相當不錯。中文的。

http://www.bfcat.com/

一位網友的個人計算機視覺博客,有很多關於計算機視覺前沿的東西介紹,與上面的博客一樣,看了也能讓人興奮。

http://blog.csdn.net/v_JULY_v/

牛人博客,主攻數據結構,機器學習數據挖掘算法等。

http://blog.youtueye.com/

該網友上面有一些計算機視覺方向的博客,博客中附有一些實驗的測試代碼.

http://blog.sciencenet.cn/u/jingyanwang

多看pami才扯談的博客,其中有不少pami文章的中文介紹。

http://chentingpc.me/

做網絡和自然語言處理的,有不少機器學習方面的介紹。

 

ML常用博客資料等:

http://freemind.pluskid.org/

由 pluskid 所維護的 blog,主要記錄一些機器學習、程序設計以及各種技術和非技術的相關內容,寫得很不錯。

http://datasciencemasters.org/

裏面包含學ML/DM所需要的一些知識鏈接,且有些給出了視頻教程,網頁資料,電子書,開源code等,推薦!

http://cs.nju.edu.cn/zhouzh/index.htm

周志華主頁,不用介紹了,機器學習大牛,更可貴的是他的很多文章都有源碼公佈。

http://www.eecs.berkeley.edu/~jpaisley/Papers.htm

John Paisley的個人主頁,主要研究機器學習領域,有些文章有代碼提供。

http://foreveralbum.yo2.cn/

裏面有一些常見機器學習算法的詳細推導過程。

http://blog.csdn.net/abcjennifer

浙江大學CS碩士在讀,關注計算機視覺,機器學習,算法研究,博弈, 人工智能, 移動互聯網等學科和產業。該博客中有很多機器學習算法方面的介紹。

http://www.wytk2008.net/

無垠天空的機器學習博客。

http://www.chalearn.org/index.html

機器學習挑戰賽。

http://licstar.net/

licstar的技術博客,偏自然語言處理方向。

 

國內科研團隊和牛人網頁:

http://vision.ia.ac.cn/zh/index_cn.html

中科院自動化所機器視覺課題小組,有相關數據庫、論文、課件等下載。

http://www.cbsr.ia.ac.cn/users/szli/

李子青教授個人主頁,中科院自動化所cvpr領域牛叉人!

http://www4.comp.polyu.edu.hk/~cslzhang/

香港理工大學教授lei zhang個人主頁,也是cvpr領域一大牛人啊,cvpr,iccv各種發表。更重要的是他所以牛叉論文的code全部公開,非常難得!

http://liama.ia.ac.cn/wiki/start

中法信息、自動化與應用聯合實驗室,裏面很多內容不僅限而cvpr,還有ai領域一些其他的研究。

http://www.cogsci.xmu.edu.cn/cvl/english/

廈門大學特聘教授,cv領域一位牛人。研究方向主要爲目標檢測,目標跟蹤,運動估計,三維重建,魯棒統計學,光流計算等。

http://idm.pku.edu.cn/index.aspx

北京大學數字視頻編碼技術國家實驗室。 

http://www.csie.ntu.edu.tw/~cjlin/libsvm/

libsvm項目網址,臺灣大學的,很火!

http://www.jdl.ac.cn/user/sgshan/index.htm

山世光,人臉識別研究比較牛。在中國科學院智能信息處理重點實驗室

 

國外科研團隊和牛人網頁:

https://netfiles.uiuc.edu/jbhuang1/www/resources/vision/index.html

常見計算機視覺資源整理索引,國外學者整理,全是出名的算法,並且帶有代碼的,這個非常有幫助,其鏈接都是相關領域很火的代碼。

http://www.cs.cmu.edu/afs/cs/project/cil/ftp/html/txtv-groups.html

國外學者整理的各高校研究所團隊網站

http://research.microsoft.com/en-us/groups/vision/

微軟視覺研究小組,不解釋,大家懂的,牛!

http://lear.inrialpes.fr/index.php

法國國家信息與自動化研究所,有對應牛人的鏈接,論文項目網頁鏈接,且一些code對應鏈接等。

http://www.cs.ubc.ca/~pcarbo/objrecls/

Learning to recognize objects with little supervision該篇論文的項目網頁,有對應的code下載,另附有詳細說明。

http://www.eecs.berkeley.edu/~lbourdev/poselets/

poselets相關研究界面,關於poselets的第一手資料。

http://www.cse.oulu.fi/CMV/Research

芬蘭奧盧大學計算機科學與工程學院網頁,裏面有很多cv領域相關的研究,比如說人臉,臉部表情,人體行爲識別,跟蹤,人機交互等cv基本都涉及有。

http://www.cs.cmu.edu/~cil/vision.html

卡耐基梅隆大學計算機視覺主頁,內容非常多。可惜的是該網站內容只更新到了2004年。

http://vision.stanford.edu/index.html

斯坦福大學計算機視覺主頁,裏面有非常非常多的牛人,比如說大家熟悉的lifeifei.

http://www.wavelet.org/index.php

關於wavelet研究的網頁。

http://civs.ucla.edu/

加州大學洛杉磯分校統計學院,關於統計學習方面各種資料,且有相應的網上公開課。

http://www.cs.cmu.edu/~efros/

卡耐基梅隆大學Alexei(Alyosha)Efros教授個人網站,計算機圖形學高手。

http://web.mit.edu/torralba/www//

mit牛人Associate教授個人網址,主要研究計算機視覺人體視覺感知,目標識別和場景理解等。

http://people.csail.mit.edu/billf/

mit牛人William T. Freeman教授,主要研究計算機視覺和圖像學

http://www.research.ibm.com/peoplevision/

IBM人體視覺研究中心,裏面除了有其研究小組的最新成果外,還有很多測試數據(特別是視頻)供下載。

http://www.vlfeat.org/

vlfeat主頁,vlfeat也是一個開源組織,主要定位在一些最流行的視覺算法開源上,C編寫,其很多算法效果比opencv要好,不過數量不全,但是非常有用。

http://www.robots.ox.ac.uk/~az/

Andrew Zisserman的個人主頁,這人大家應該熟悉,《計算機視覺中的多視幾何》這本神書的作者之一。

http://www.cs.utexas.edu/~grauman/

KristenGrauman教授的個人主頁,是個大美女,且是2011年“馬爾獎”獲得者,”馬爾獎“大家都懂的,計算機視覺領域的最高獎項,目前無一個國內學者獲得過。她的主要研究方法是視覺識別。

http://groups.csail.mit.edu/vision/welcome/

mit視覺實驗室主頁。

http://code.google.com/p/sixthsense/

曾經在網絡上非常出名一個視頻,一個作者研究的第六感裝置,現在這個就是其開源的主頁。

http://vision.ucsd.edu/~pdollar/research.html#BehaviorRecognitionAnimalBehavior

Piotr Dollar的個人主要,主要研究方向是人體行爲識別。

http://www.mmp.rwth-aachen.de/

移動多媒體處理,將移動設備,計算機圖像學,視覺,圖像處理等結合的領域。

http://www.di.ens.fr/~laptev/index.html

Ivan Laptev牛人主頁,主要研究人體行爲識別。有很多數據庫可以下載。

http://blogs.oregonstate.edu/hess/

Rob Hess的個人主要,裏面有源碼下載,比如說粒子濾波,他寫的粒子濾波在網上很火。

http://morethantechnical.googlecode.com/svn/trunk/

cvpr領域一些小型的開源代碼。

http://iica.de/pd/index.py

做行人檢測的一個團隊,內部有一些行人檢測的代碼下載。

http://www.cs.utexas.edu/~grauman/research/pubs.html

UT-Austin計算機視覺小組,包含的視覺研究方向比較廣,且有的文章有源碼,你只需要填一個郵箱地址,系統會自動發跟源碼相關的信息過來。

http://www.robots.ox.ac.uk/~vgg/index.html

visual geometry group

 

圖像:

http://blog.sina.com.cn/s/blog_4cccd8d301012pw5.html

交互式圖像分割代碼。

http://vision.csd.uwo.ca/code/

graphcut優化代碼。

 

語音:

http://danielpovey.com/kaldi-lectures.html

語音處理中的kaldi學習。

 

算法分析與設計(計算機領域的基礎算法):

http://www.51nod.com/focus.html

該網站主要是討論一些算法題。裏面的李陶冶是個大牛,回答了很多算法題。

 

一些綜合topic列表:

http://www.cs.cornell.edu/courses/CS7670/2011fa/

計算機視覺中的些topic(Special Topics in Computer Vision),截止到2011年爲止,其引用的文章都是非常頂級的topic。

 

書籍相關網頁:

http://www.imageprocessingplace.com/index.htm

岡薩雷斯的《數字圖像處理》一書網站,包含課程材料,matlab圖像處理工具包,課件ppt等相關素材。

Consumer Depth Cameras for Computer Vision

很優秀的一本書,不過很貴,買不起啊!做深度信息的使用這本書還不錯,google圖中可以預覽一部分。

Making.Things.See

針對Kinect寫的,主要關注深度信息,較爲基礎。書籍中有不少例子,貌似是java寫的。

 

國內一些AI相關的研討會:

http://www.iipl.fudan.edu.cn/MLA13/index.htm

中國機器學習及應用研討會(這個是2013年的)

 

期刊會議論文下載:

http://cvpapers.com/

幾個頂級會議論文公開下載界面,比如說ICCV,CVPR,ECCV,ACCV,ICPR,SIGGRAPH等。

http://www.cvpr2012.org/

cvpr2012的官方地址,裏面有各種資料和信息,其他年份的地址類似推理更改即可。

http://www.sciencedirect.com/science/journal/02628856

ICV期刊下載

http://www.computer.org/portal/web/tpami

TPAMI期刊,AI領域中可以算得上是最頂級的期刊了,裏面有不少cvpr方面的內容。

http://www.springerlink.com/content/100272/

IJCV的網址。

http://books.nips.cc/

NIPS官網,有論文下載列表。

http://graphlab.org/lsrs2013/program/

LSRS (會議)地址,大規模推薦系統,其它年份依次類推。

 

會議期刊相關信息:

http://conferences.visionbib.com/Iris-Conferences.html

該網頁列出了圖像處理,計算機視覺領域相關幾乎所有比較出名的會議時間表。

http://conferences.visionbib.com/Browse-conf.php

上面網頁的一個子網頁,列出了最近的CV領域提交paper的deadline。

 

cvpr相關數據庫下載:

http://research.microsoft.com/en-us/um/people/jckrumm/WallFlower/TestImages.htm

微軟研究院牛人Wallflower Paper的論文中用到的目標檢測等測試圖片

http://archive.ics.uci.edu/ml/

UCI數據庫列表下載,最常用的機器學習數據庫列表。

http://www.cs.rochester.edu/~rmessing/uradl/

人體行爲識別通過關鍵點的跟蹤視頻數據庫,Rochester university的

http://www.research.ibm.com/peoplevision/performanceevaluation.html

IBM人體視覺研究中心,有視頻監控等非常多的測試視頻。

http://www.cvpapers.com/datasets.html

該網站上列出了常見的cvpr研究的數據庫。

http://www.cs.washington.edu/rgbd-dataset/index.html

RGB-D Object Dataset.做目標識別的。

 

AI相關娛樂網頁:

http://en.akinator.com/

該網站很好玩,可以測試你心裏想出的一個人名(當然前提是這個人必須有一定的知名度),然後該網站會提出一系列的問題,你可以選擇yes or no,or I don’t know等等,最後系統會顯示你心中所想的那個人。

http://www.doggelganger.co.nz/

人與狗的匹配遊戲,攝像頭採集人臉,呵呵…

 

Android相關:

https://code.google.com/p/android-ui-utils/

該網站上有一些android圖標,菜單等跟界面有關的設計工具,可以用來做一些簡單的UI設計.

 

工具和code下載:

http://lear.inrialpes.fr/people/dorko/downloads.html

6種常見的圖像特徵點檢測子,linux下環境運行。不過只提供了二進制文件,不提供源碼。

http://www.cs.ubc.ca/~pcarbo/objrecls/index.html#code

ssmcmc的matlab代碼,是Learning to recognize objects with little supervision這一系列文章用的源碼,屬於目標識別方面的研究。

http://www.robots.ox.ac.uk/~timork/

仿射無關尺度特徵點檢測算子源碼,還有些其它算子的源碼或二進制文件。

http://www.vision.ee.ethz.ch/~bleibe/code/ism.html

隱式形狀模型(ISM)項目主頁,作者Bastian Leibe提供了linux下運行的二進制文件。

http://www.di.ens.fr/~laptev/download.html#stip

Ivan Laptev牛人主頁中的STIP特徵點檢測code,但是也只是有二進制文件,無源碼。該特徵點在行爲識別中該特徵點非常有名。

http://ai.stanford.edu/~quocle/

斯坦福大學Quoc V.Le主頁,上有它2011年行爲識別文章的代碼。

 

開源軟件:

http://mloss.org/software/

一些ML開源軟件在這裏基本都可以搜到,有上百個。

https://github.com/myui/hivemall

Scalable machine learning library for Hive/Hadoop.

http://scikit-learn.org/stable/

 

基於python的機器學習開源軟件,文檔寫得不錯。

 

挑戰賽:

http://www.chioka.in/kaggle-competition-solutions/

kaggle一些挑戰賽的code. 

 

公開課:

網易公開課,國內做得很不錯的公開課,翻譯了一些國外出名的公開課教程,與國外公開課平臺coursera有合作。

coursera在線教育網上公開課,很新,有個郵箱註冊即可學習,有不少課程,且有對應的練習,特別是編程練習,超讚。

斯坦福網上公開課鏈接,有統計學習,凸優化等課程。

udacity公開課程下載鏈接,其實速度還可以。裏面有不少好教程。

機器學習公開課的連接,有不少課。


 
    《Which GPU(s) to Get for Deep Learning: My Experience and Advice for Using GPUs in Deep Learning》
 
介紹:做深度學習如何選擇GPU的建議
 
    《Sparse Linear Models》
 
介紹: Stanford的Trevor Hastie教授在H2O.ai Meet-Up上的報告,講稀疏線性模型——面向“寬數據”(特徵維數超過樣本數)的線性模型,13年同主題報告 、講義.
 
    《Awesome Computer Vision》
 
介紹: 分類整理的機器視覺相關資源列表,秉承Awesome系列風格,有質有量!作者的更新頻率也很頻繁
 
    《Adam Szeidl》
 
介紹: social networks course
 
    《Building and deploying large-scale machine learning pipelines》
 
介紹: 大規模機器學習流程的構建與部署.
 
    《人臉識別開發包》
 
介紹: 人臉識別二次開發包,免費,可商用,有演示、範例、說明書.
 
    《Understanding Natural Language with Deep Neural Networks Using Torch》
 
介紹: 採用Torch用深度學習網絡理解NLP,來自Facebook 人工智能的文章.
 
    《The NLP Engine: A Universal Turing Machine for NLP》
 
介紹: 來自CMU的Ed Hovy和Stanford的Jiwei Li一篇有意思的Arxiv文章,作者用Shannon Entropy來刻畫NLP中各項任務的難度.
 
    《TThe Probabilistic Relevance Framework: BM25 and Beyond》
 
介紹: 信息檢索排序模型BM25(Besting Matching)。1)從經典概率模型演變而來 2)捕捉了向量空間模型中三個影響索引項權重的因子:IDF逆文檔頻率;TF索引項頻率;文檔長度歸一化。3)並且含有集成學習的思想:組合了BM11和BM15兩個模型。4)作者是BM25的提出者和Okapi實現者Robertson.
 
    《Introduction to ARMA Time Series Models – simplified》
 
介紹: 自迴歸滑動平均(ARMA)時間序列的簡單介紹,ARMA是研究時間序列的重要方法,由自迴歸模型(AR模型)與滑動平均模型(MA模型)爲基礎“混合”構成.
 
    《Encoding Source Language with Convolutional Neural Network for Machine Translation》
 
介紹: 把來自target的attention signal加入source encoding CNN的輸入,得到了比BBN的模型好的多neural network joint model
 
    《Spices form the basis of food pairing in Indian cuisine》
 
介紹: 揭開印度菜的美味祕訣——通過對大量食譜原料關係的挖掘,發現印度菜美味的原因之一是其中的味道互相沖突,很有趣的文本挖掘研究
 
    《HMM相關文章索引》
 
介紹: HMM相關文章
 
    《Zipf’s and Heap’s law》
 
介紹: 1)詞頻與其降序排序的關係,最著名的是語言學家齊夫(Zipf,1902-1950)1949年提出的Zipf‘s law,即二者成反比關係. 曼德勃羅(Mandelbrot,1924- 2010)引入參數修正了對甚高頻和甚低頻詞的刻畫 2)Heaps’ law: 詞彙表與語料規模的平方根(這是一個參數,英語0.4-0.6)成正比
 
    《I am Jürgen Schmidhuber, AMA》
 
介紹: Jürgen Schmidhuber在Reddit上的AMA(Ask Me Anything)主題,有不少RNN和AI、ML的乾貨內容,關於開源&思想&方法&建議……耐心閱讀,相信你也會受益匪淺.
 
    《學術種子網站:AcademicTorrents》
 
介紹: 成G上T的學術數據,HN近期熱議話題,主題涉及機器學習、NLP、SNA等。下載最簡單的方法,通過BT軟件,RSS訂閱各集合即可
 
    《機器學習交互速查表》
 
介紹: Scikit-Learn官網提供,在原有的Cheat Sheet基礎上加上了Scikit-Learn相關文檔的鏈接,方便瀏覽
 
    《A Full Hardware Guide to Deep Learning》
 
介紹: 深度學習的全面硬件指南,從GPU到RAM、CPU、SSD、PCIe
 
    《行人檢測(Pedestrian Detection)資源》
 
介紹:Pedestrian Detection paper & data
 
    《A specialized face-processing network consistent with the representational geometry of monkey face patches》
 
介紹: 【神經科學碰撞人工智能】在臉部識別上你我都是專家,即使細微的差別也能辨認。研究已證明人類和靈長類動物在面部加工上不同於其他物種,人類使用梭狀回面孔區(FFA)。Khaligh-Razavi等通過計算機模擬出人臉識別的FFA活動,堪稱神經科學與人工智能的完美結合。
 
    《Neural Net in C++ Tutorial》
 
介紹: 神經網絡C++教程,本文介紹了用可調節梯度下降和可調節動量法設計和編碼經典BP神經網絡,網絡經過訓練可以做出驚人和美妙的東西出來。此外作者博客的其他文章也很不錯。
 
    《How to Choose a Neural Network》
 
介紹:deeplearning4j官網提供的實際應用場景NN選擇參考表,列舉了一些典型問題建議使用的神經網絡
 
    《Deep Learning (Python, C/C++, Java, Scala, Go)》
 
介紹:一個深度學習項目,提供了Python, C/C++, Java, Scala, Go多個版本的代碼
 
    《Deep Learning Tutorials》
 
介紹:深度學習教程
 
    《自然語言處理的發展趨勢——訪卡內基梅隆大學愛德華·霍威教授》
 
介紹:自然語言處理的發展趨勢——訪卡內基梅隆大學愛德華·霍威教授.
 
    《FaceNet: A Unified Embedding for Face Recognition and Clustering》
 
介紹:Google對Facebook DeepFace的有力回擊—— FaceNet,在LFW(Labeled Faces in the Wild)上達到99.63%準確率(新紀錄),FaceNet embeddings可用於人臉識別、鑑別和聚類.
 
    《MLlib中的Random Forests和Boosting》
 
介紹:本文來自Databricks公司網站的一篇博客文章,由Joseph Bradley和Manish Amde撰寫,文章主要介紹了Random Forests和Gradient-Boosted Trees(GBTs)算法和他們在MLlib中的分佈式實現,以及展示一些簡單的例子並建議該從何處上手.中文版.
 
    《Sum-Product Networks(SPN) 》
 
介紹:華盛頓大學Pedro Domingos團隊的DNN,提供論文和實現代碼.
 
    《Neural Network Dependency Parser》
 
介紹:基於神經網絡的自然語言依存關係解析器(已集成至Stanford CoreNLP),特點是超快、準確,目前可處理中英文語料,基於《A Fast and Accurate Dependency Parser Using Neural Networks》 思路實現.
 
    《神經網絡語言模型》
 
介紹:本文根據神經網絡的發展歷程,詳細講解神經網絡語言模型在各個階段的形式,其中的模型包含NNLM[Bengio,2003]、Hierarchical NNLM[Bengio, 2005], Log-Bilinear[Hinton, 2007],SENNA等重要變形,總結的特別好.
 
    《Classifying Spam Emails using Text and Readability Features》
 
介紹:經典問題的新研究:利用文本和可讀性特徵分類垃圾郵件。
 
    《BCI Challenge @ NER 2015》
 
介紹:Kaggle腦控計算機交互(BCI)競賽優勝方案源碼及文檔,包括完整的數據處理流程,是學習Python數據處理和Kaggle經典參賽框架的絕佳實例
 
    《IPOL Journal · Image Processing On Line》
 
介紹:IPOL(在線圖像處理)是圖像處理和圖像分析的研究期刊,每篇文章都包含一個算法及相應的代碼、Demo和實驗文檔。文本和源碼是經過了同行評審的。IPOL是開放的科學和可重複的研究期刊。我一直想做點類似的工作,拉近產品和技術之間的距離.
 
    《Machine learning classification over encrypted data》
 
介紹:出自MIT,研究加密數據高效分類問題.
 
    《purine2》
 
介紹:新加坡LV實驗室的神經網絡並行框架Purine: A bi-graph based deep learning framework,支持構建各種並行的架構,在多機多卡,同步更新參數的情況下基本達到線性加速。12塊Titan 20小時可以完成Googlenet的訓練。
 
    《Machine Learning Resources》
 
介紹:這是一個機器學習資源庫,雖然比較少.但蚊子再小也是肉.有突出部分.此外還有一個由zheng Rui整理的機器學習資源.
 
    《Hands-on with machine learning》
 
介紹:Chase Davis在NICAR15上的主題報告材料,用Scikit-Learn做監督學習的入門例子.
 
    《The Natural Language Processing Dictionary》
 
介紹:這是一本自然語言處理的詞典,從1998年開始到目前積累了成千上萬的專業詞語解釋,如果你是一位剛入門的朋友.可以借這本詞典讓自己成長更快.
 
    《PageRank Approach to Ranking National Football Teams》
 
介紹:通過分析1930年至今的比賽數據,用PageRank計算世界盃參賽球隊排行榜.
 
    《R Tutorial》
 
介紹:R語言教程,此外還推薦一個R語言教程An Introduction to R.
 
    《Fast unfolding of communities in large networks》
 
介紹:經典老文,複雜網絡社區發現的高效算法,Gephi中的Community detection即基於此.
 
    《NUML》
 
介紹: 一個面向 .net 的開源機器學習庫,github地址
 
    《synaptic.Js》
 
介紹: 支持node.js的JS神經網絡庫,可在客戶端瀏覽器中運行,支持LSTM等 github地址
 
    《Machine learning for package users with R (1): Decision Tree》
 
介紹: 決策樹
 
    《Deep Learning, The Curse of Dimensionality, and Autoencoders》
 
介紹: 討論深度學習自動編碼器如何有效應對維數災難,國內翻譯
 
    《Advanced Optimization and Randomized Methods》
 
介紹: CMU的優化與隨機方法課程,由A. Smola和S. Sra主講,優化理論是機器學習的基石,值得深入學習 國內雲(視頻)
 
    《CS231n: Convolutional Neural Networks for Visual Recognition》
 
介紹: “面向視覺識別的CNN”課程設計報告集錦.近百篇,內容涉及圖像識別應用的各個方面
 
    《Topic modeling with LDA: MLlib meets GraphX》
 
介紹:用Spark的MLlib+GraphX做大規模LDA主題抽取.
 
    《Deep Learning for Multi-label Classification》
 
介紹: 基於深度學習的多標籤分類,用基於RBM的DBN解決多標籤分類(特徵)問題
 
    《Google DeepMind publications》
 
介紹: DeepMind論文集錦
 
    《kaldi》
 
介紹: 一個開源語音識別工具包,它目前託管在sourceforge上面
 
    《Data Journalism Handbook》
 
介紹: 免費電子書《數據新聞手冊》, 國內有熱心的朋友翻譯了中文版,大家也可以在線閱讀
 
    《Data Mining Problems in Retail》
 
介紹: 零售領域的數據挖掘文章.
 
    《Understanding Convolution in Deep Learning》
 
介紹: 深度學習卷積概念詳解,深入淺出.
 
    《pandas: powerful Python data analysis toolkit》
 
介紹: 非常強大的Python的數據分析工具包.
 
    《Text Analytics 2015》
 
介紹: 2015文本分析(商業)應用綜述.
 
    《Deep Learning libraries and first experiments with Theano》
 
介紹: 深度學習框架、庫調研及Theano的初步測試體會報告.
 
    《DEEP learning》
 
介紹: MIT的Yoshua Bengio等人講深度學習的新書,還未定稿,線上提供Draft chapters收集反饋,超讚!強烈推薦.
 
    《simplebayes》
 
介紹: Python下開源可持久化樸素貝葉斯分類庫.
 
    《Paracel》
 
介紹:Paracel is a distributed computational framework designed for machine learning problems, graph algorithms and scientific computing in C++.
 
    《HanLP:Han Language processing》
 
介紹: 開源漢語言處理包.
 
    《Simple Neural Network implementation in Ruby》
 
介紹: 使用Ruby實現簡單的神經網絡例子.
 
    《Hacker’s guide to Neural Networks》
 
介紹:神經網絡黑客入門.
 
    《The Open-Source Data Science Masters》
 
介紹:好多數據科學家名人推薦,還有資料.
 
    《Text Understanding from Scratch》
 
介紹:實現項目已經開源在github上面Crepe
 
    《 Improving Distributional Similarity with Lessons Learned from Word Embeddings》
 
介紹:作者發現,經過調參,傳統的方法也能和word2vec取得差不多的效果。另外,無論作者怎麼試,GloVe都比不過word2vec.
 
    《CS224d: Deep Learning for Natural Language Processing》
 
介紹:Stanford深度學習與自然語言處理課程,Richard Socher主講.
 
    《Math Essentials in Machine Learning》
 
介紹:機器學習中的重要數學概念.
 
    《Improved Semantic Representations From Tree-Structured Long Short-Term Memory Networks》
 
介紹:用於改進語義表示的樹型LSTM遞歸神經網絡,句子級相關性判斷和情感分類效果很好.實現代碼.
 
    《Statistical Machine Learning》
 
介紹:卡耐基梅隆Ryan Tibshirani和Larry Wasserman開設的機器學習課程,先修課程爲機器學習(10-715)和中級統計學(36-705),聚焦統計理論和方法在機器學習領域應用.
 
    《AM207: Monte Carlo Methods, Stochastic Optimization》
 
介紹:《哈佛大學蒙特卡洛方法與隨機優化課程》是哈佛應用數學研究生課程,由V Kaynig-Fittkau、P Protopapas主講,Python程序示例,對貝葉斯推理感興趣的朋友一定要看看,提供授課視頻及課上IPN講義.
 
    《生物醫學的SPARK大數據應用》
 
介紹:生物醫學的SPARK大數據應用.並且伯克利開源了他們的big data genomics系統ADAM,其他的內容可以關注一下官方主頁.
 
    《ACL Anthology》
 
介紹:對自然語言處理技術或者機器翻譯技術感興趣的親們,請在提出自己牛逼到無以倫比的idea(自動歸納翻譯規律、自動理解語境、自動識別語義等等)之前,請通過谷歌學術簡單搜一下,如果谷歌不可用,這個網址有這個領域幾大頂會的論文列表,切不可斷章取義,胡亂假設.
 
    《Twitter Sentiment Detection via Ensemble Classification Using Averaged Confidence Scores》
 
介紹:論文+代碼:基於集成方法的Twitter情感分類,實現代碼.
 
    《NIPS 2014 CIML workshop》
 
介紹:NIPS CiML 2014的PPT,NIPS是神經信息處理系統進展大會的英文簡稱.
 
    《CS231n: Convolutional Neural Networks for Visual Recognition》
 
介紹:斯坦福的深度學習課程的Projects 每個人都要寫一個論文級別的報告 裏面有一些很有意思的應用 大家可以看看 .
 
    《A Speed Comparison Between Flexible Linear Regression Alternatives in R》
 
介紹:R語言線性迴歸多方案速度比較具體方案包括lm()、nls()、glm()、bayesglm()、nls()、mle2()、optim()和Stan’s optimizing()等


轉自博客:http://blog.csdn.net/GrazyThinking/article/details/40687421

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章