原创 pcap(Packet capture library)的簡單應用

pcap目前是一個應用廣泛的針對網絡接口數據包抓取的共享庫。 該系統對數據抓取提供一個高層的接口,獲得指定網絡的全部 數據包,包括那些目的地址不是本機的數據包。 下面的程序是一個簡單的實驗用例。它只是使用了pcap的一小 部分主要功能,實

原创 數學家和程序員

前日在CSDN上看到早些時候對STL之父的一篇專訪, http://dev.csdn.net/htmls/11/11440.html 由此想到了數學家和程序員思考問題出發點的差異。 雖然亞歷山大說自己是程序員,但我從他的言語之 間還是看到

原创 最佳適配內存分配

下面的代碼採用了最佳適配內存分配算法。 有128個槽。將不同大小的內存塊散列在相應的槽中。 這些槽存放的內存塊的大小是有序的。 前64個槽用於存放小

原创 R語言中使用tensorflow

1  TensorFlow TensorFlow是一個使用數據流圖(data flow graphs)進行數值計算的的開源軟件庫。圖的節點代表數學計 算,圖的邊代表與之對應的多維數組(tensor)。這個思路正好與我設計的一個系統相反。t

原创 hash表C++實現

仿照SGI擴展中的hash_set和hash_map實現了下面兩個簡化的模板類。 她們的使用方法與stl中的容器類相似,支持插入,查找,刪除,遍歷等。 成員函數名稱和語義基本與stl中的容器類一致。 迭代

原创 拓撲分析用於空間聚類

拓撲分析用於空間聚類 在工作中我會遇到這樣的問題: 有一個城市中某種實體的地理位置信息,需要根據這些 實體的不同分佈密度,來對這個城市進行區域劃分。 那我們首先就要根據這些實體的位置進行聚類, 以便得到不

原创 Boyer-Moore模式匹配算法

BM算法是由Robert S. Boyer和J Strother Moore在1977年 開發的一種快速字符串匹配算法。當然這裏說的字符串 不全指'abcd'這樣的可讀字符組成的串,它可以是一片連續的內存

原创 貝葉斯分類:Common Lisp實現

最近利用閒暇時間學習Common Lisp,作爲編程實踐,我實現了一個簡陋的 貝葉斯分類器(bayesian)。這只是一個代碼玩具,沒有實際的工程價值。文章最後我貼了這個貝葉斯的代碼。 貝葉斯公式如下:

原创 使用R語言進行圖像分類

使用R語言進行圖像分類 本文使用R語言,應用SVM(高斯核)[3]算法對JPEG圖片進行二類分。 SVM使用e1071包, 圖像處理用imager包[1]。 數據使用的是Caltech 101中的Face

原创 一個玩具—自制人臉識別

自己動手OpenCV提供了一些人臉識別的工具, 比如FaceRecognizer。但自制一個人臉識別器是件挺好玩的事情,我用kNN實現了一個。 三步實現 • 數據預處理 • train• predict 數據來源 數據使用AT&T F

原创 使用pagerank計算商業服務網絡中節點的重要性

     現實世界中有很多商業服務,在服務中消費者和服務提供者構成了一個 網絡(圖)。大部分的服務網絡都是無尺度網絡,節點的degree是 冪律分佈這樣的無尺度分佈。也就是說,很少部分服務商向大量的消費者 提供了大部分服務。在這樣的無尺

原创 R 與 LaTeX

R 與 LaTeX     R 是一種編程語言,廣泛的用於數據挖掘和統計分析中。 她有很多實用的特性,比如她對LaTeX的支持。通過一些技術手段, R語言可以生成LaTeX腳本,並把計算結果和可視化圖形信

原创 tcpdump抓取指定ip地址範圍內的報文

用tcpdump可以抓取某個ip地址範圍內的報文。例如: 抓取目的地址範圍是192.168.1.10 ~ 192.168.1.100 的報文使用命令:     tcpdump -n -nn 'ip[16]

原创 R語言中文情感分析包:cnSentimentR

R語言中文情感分析. 該包使用jiebaR分詞, svm[e1071]進行分類; 主要的函數:cnsr.predict, cnsr.train, cnsr.prepare, cnsr.topic.word

原创 數據挖掘:id3 算法

1 簡述 1.1     id3是一種基於決策樹的分類算法,由J.Ross Quinlan 在1986年開發。id3根據信息增益,運用自頂向下的貪心策略 建立決策樹。信息增益用於度量某個屬性對樣本集合分類的好壞程度。 由於採用了信息增益