原创 海量數據面試題整理

zz http://kb.cnblogs.com/page/68772/ 1. 給定a、b兩個文件,各存放50億個url,每個url各佔64字節,內存限制是4G,讓你找出a、b文件共同的url? 方案1:可以估計每個文件安的大小爲5

原创 linux下vi中批量刪除空行的方法:

zz http://www.phpzixue.cn/detail944.shtml linux下vi中批量刪除空行的方法:  可以直接使用linux的grep命令來刪除,如下:  grep -v ^$ oldfilename > newf

原创 POJ 1743 Musical Theme 後綴數組

http://hi.baidu.com/drcrow/blog/item/bcfd8890c2af3a7754fb9640.html 題意:在一個序列中求兩個子序列,使得它們相應位置上的每對元素之差相等。 很容易想到對原序列做差。但是與各

原创 代碼編輯神器VIM(附我寫acm程序時的配置)

zz http://blog.csdn.net/dinosoft/article/details/6330121    有些牛X的人性格會比較古怪,VIM就是這麼一位特立獨行,難以琢磨的怪客。但如果熟悉了,你就會發現他的好。

原创 各種背景音樂,以後公司的頒獎、簽約儀式不怕找不到背景配樂了!

轉自 http://blog.renren.com/GetEntry.do?id=491267088&owner=259791652 電臺電視臺頻率最高的經典背景音樂51首 1.豪勇七蛟龍(The Magnificent Seven)

原创 Linux內核源碼分析-鏈表代碼分析

zz http://www.linuxforum.net/forum/showthreaded.php?Cat=&Board=linuxK&Number=587376&page=0&view=collapsed&sb=5&vc=1 Lin

原创 2014-7 Andrew Ng 自動化所報告聽後感-樑斌

百度首席科學家 Andrew Ng談深度學習的挑戰和未來   一早出發,8點20就趕到現場, 人越聚越多,Ng提前幾分鐘到達現場,掌聲一片。    Ng的報告總體上提到了五個方向。    1)Deep Learning相比於傳統方法的優

原创 POJ 3667 Hotel (線段樹區間最大連續長度)

求長度爲K的連續區間的左端點的最小值 check in 的時候,先查尋出左端點r,然後插入線段[r, r+D-1] check out 的時候,直接刪除線段[X, X+D-1] 要使用lazy標記,否則TLE 代碼寫的有點。。。。 /*

原创 一些推薦系統包的推薦

zz http://somemory.com/myblog/?post=24 一些推薦系統包的推薦 作者:阿俊 發佈於:2011-12-12 21:05 Monday 分類:推薦系統 下面是一些開源的推薦系統的包,希望對大家有用。

原创 CVPR 2013 Short Courses and Tutorials

CVPR 2013 Short Courses and Tutorials   Date Tutorial Title / Organizers 6/23/13(AM Only) Foundations of Spatial Spectr

原创 Caltech關於機器學習的介紹性課程

zz:http://www.bfcat.com/index.php/2013/06/caltech-ml-course/#609096-tsina-1-25495-664964b7cb7b56e927fedca44cbe8c7d 這是

原创 數據可視化是怎樣創造出來的

zz :http://blog.renren.com/blog/66748535/740531935 我多次被炫目的數據可視化或信息可視化震驚,在我知道這些圖片背後的數據來源和創造歷程後,更是爲之詫異不止。它涉足製圖學、圖形繪

原创 知乎上關於電子商務話題的精彩問答

知乎上關於電子商務話題的精彩問答 zz http://www.douban.com/group/topic/22418888/ 電商本質:  電子商務公司究竟應該是互聯網基因,還是零售基因的改良?爲什麼?http://www

原创 大數據在醫療行業應用的15個場景

http://www.medicalsystem.com.cn/tabid/179/InfoID/146/frtid/70/Default.aspx   1989年,Gartner提出BI概念。2008年,Gartner將BI概念進

原创 介紹幾個圖論和複雜網絡的程序庫 —— BGL,QuickGraph,igraph和NetworkX

剛加入複雜網絡圈子,暫時還沒有成熟的研究內容,先發個資料性的東西佔坑:)作複雜網絡研究離不開對各種實際或模擬網絡的統計、計算、繪圖等工作。對於一般性的工作,我們可以用Pajek、Netdraw和Ucinet等軟件完成。但對一些特殊應用(比