原创 networkx使用筆記(三)之好漢篇Matplotlib(4)

     0.Matplotlib小記       Matplotlib的筆記一直拖着,最近發現自己從圖書館借來的書要到期了,還是做個筆記,免得到時候要查閱又麻煩了。      import matplotlib.pyplot as pl

原创 算法設計與分析課程Part1筆記(6)

6. 哈希表與平衡二叉樹 6.1 全域散列(UniversalHashing)         根據假設可知,有邊爲0,那麼求碰撞的概率轉化爲求左邊等式等於0的概率,可以證明左邊等式是集合中的一個隨機元素。 可以舉例子n=7, x4-

原创 windows下python 2.7與mysqldb之間的折騰(registry_key/vsvarsall==)

     之前轉載了一篇python2.6+mysqldb安裝時的問題,今天準備升級爲python2.7,這也是一頓折騰。      各種錯誤接踵而至:              1. serverKey = _winreg.OpenKe

原创 算法設計與分析課程Part1筆記(1)

所有筆記PDF版本,外加一些習題和基本答案,已經上傳至http://ishare.iask.sina.com.cn/f/25611722.html ---------------------------------------------

原创 算法設計與分析課程Part1筆記(4)

4. 圖搜索及其連通性 對於圖來說,考慮的幾個比較重要的因素就是連通性和路徑;連通性關注的有強連通分量和特殊結構(例如web中的蝴蝶結構),路徑關注的有兩個節點間的最短路徑和任意節點間的所有簡單路徑。 連通性和路徑其實都是關於圖中的搜索,

原创 networkx使用筆記(四)之實戰篇--數據的獲取

公開的數據集         網絡上針對網絡的公開數據集較多,可以google斯坦福的SNAP,裏面有分類的數據集         這裏我用了張華平老師公佈的微博數據中的關注語料庫         其爲xml格式,記錄方式如下:     

原创 Lucence3.0的Analyzer備忘

          問題:一連串的字符串如何進行分詞,例如“onlyLoveforYouYEAH”           想着lucence自帶一些analyzer,沒有仔細看裏面的功能,就開始用了,發現效果並不太好。後來發現需要處理的字符

原创 關於dom4j讀取xml文件的null Nested exception備忘

          由於最近需要針對xml做一些解析工作,決定使用dom4j進行解析,其中碰到了org.dom4j.DocumentException: null Nested exception: null的問題,明顯是因爲找不到文件路

原创 利用matlab進行簡單的貝葉斯網絡構建

matlab的安裝        第一次裝matlab,裝好後發現沒有在桌面生成圖標,還以爲是最後提示的編譯器沒有安裝。結果發現,matlab的圖標在其安裝的bin目錄下面,進行初始化就能開始使用了 關於貝葉斯網絡       1.簡單的

原创 一致性終極解決方案Paxos

相關名詞:提案者(Proposers)、決策者(Acceptors)和學習者(或者說書記Learners) 基本說明:提案者可以提相應的法案給各個決

原创 R的基本使用(1)

R簡介       R是一個開源的語言,提供了用來進行統計計算和可視化的軟件工具環境。R語言被廣泛的用來開發統計軟件和數據分析中。R語言來自S,S來自貝爾實驗室(1976)。(貝爾好牛)       R的下載,去cran官網即可http:

原创 error 2003: cann't connect to mysql server & MySQL Command Line Client一閃而過

     今天將python和相關庫重新進行了2.7版本的所有安裝,但是安裝mysql中遇到了小問題。      安裝過程很正常,爲了避免5.5.21版本需要安裝Framework 4.0的事情,下載了5.5.17版本進行安裝。    

原创 octopy的MapReduce編程實例

1.簡單介紹           MR編程模式因爲雲計算的興趣而火了起來,但是分佈的雲計算環境個人很難搭建,爲了便於大家學習MR編程模式,這裏介紹一個給力的python工具octo.py。           它只是一個小小的python

原创 mysql命令行下的數據導入與導出

  由於機器龜速運行,決定分開跑,然後把數據合併,需要將mysql中的數據倒來倒去,沒想到其中過程還蠻亂的,這裏做個筆記,Mark一下。 命令行 1.數據庫字符集問題    爲了避免亂碼的問題,先確定下database的編碼是何種。  

原创 python encode和decode函數說明

字符串編碼常用類型:utf-8,gb2312,cp936,gbk等。 python中,我們使用decode()和encode()來進行解碼和編碼 在python中,使用unicode類型作爲編碼的基礎類型。即      decod