原创 折半查找、插值查找以及斐波那契查找

1. 折半查找         關鍵公式: mid = (low + high)/2 = low + 1/2(high - low).         其時間複雜度爲O(logn),因爲n個節點的完全二叉樹的深度爲[log2n]+1. [

原创 P,NP,NPC,NP-hard問題簡述

P類問題:    即可以找到多項式級別的算法來解決它。 NP類問題: 不能找到多項式級別或者不知道能否找到多項式級別的算法來解決它,但是可以對其一個問題的解在多項 式時間內進行驗證,此類問題稱爲NP類問題。顯然,P類問題屬於NP類問題,

原创 Python中文件讀取方法read(),readline(),readlines()的區別

Python中文件讀取方法read(), readline()以及readlines()的區別:     1. read()方法        >>> file = open('filename')         # filename:

原创 Python列表中append()方法與extend()方法的區別

Python列表中append()與extend()方法的區別     兩者在很多情況下可以通用,但是一個大的區別在處理列表元素時:     示例:     >>> a = [1,2,3]; b=[4,5,6]     >>> a.ap

原创 Python中對字典按其鍵值進行排序

在用Python進行文本數據處理時,經常會用到字典結構,並對其中關鍵詞出現頻率進行排序。此時,可以用下列固定的 代碼進行排序。        >>> import operator        >>> sortedFreq = sort

原创 Python利用igraph繪製複雜網絡聚類(社區檢測)結果圖

        前言:研究生期間主要做複雜網絡聚類,也稱爲社區檢測。臨畢業前,老師讓之前發表的論文裏的算法代碼C化,並寫出界面進行可視化。由於之前雖然做過可視化,但基本上都是將聚類結果導入到pajek或者gephi這類專門的軟件裏進行繪製

原创 機器學習算法6-AdaBoost元算法

本文來自<machine learning in action>一書的讀書筆記 一. 什麼是元算法(meta-algorithm) 元算法就是對其他算法進行組合的一種方式。也稱爲集成算法(ensemble method),例如baggi

原创 機器學習算法4——Logistic迴歸

本文總結與<machine learning in action>一書 一. Logistic迴歸簡介     1. 迴歸:         假設現在有一些數據點,我們用一條直線對這些點進行擬合(最佳擬合直線),這個擬合過程成爲迴歸。“

原创 機器學習算法3——樸素貝葉斯

本文總結於《Machine Learning in Action》一書 機器學習算法3——樸素貝葉斯 一. 樸素貝葉斯介紹:      1. 簡介        樸素貝葉斯是貝葉斯分類器的一個擴展,是用於文檔分類的常用算法。樸素貝葉斯

原创 C++多文件中全局變量的聲明與定義

本文轉載自http://blog.csdn.net/sanlei1616/article/details/3882846: 1. 編譯單元(模塊):     在IDE開發工具大行其道的今天,對於編譯的一些概念很多人已經不再清楚了,很多

原创 複雜網絡數據網站+程序代碼網站

1.http://snap.stanford.edu/index.html。  ====  Stanford Network Analysis Project(SNAP). 各種大規模網絡數據集,包括一些圖形可視化軟件以及一些代碼,都可以

原创 隱馬爾科夫模型

馬爾科夫模型在《隨機過程》課程中有過系統學習,這裏不再介紹。 本文爲讀書筆記,主要參考《模式分類》第二版。 /*===============================================================

原创 機器學習數據集網站

1. http://archive.ics.uci.edu/ml/ —— 來自美國加州大學歐文分校最有名的機器學習數據資源。 2. https://aws.amazon.com/cn/public-data-sets/ —— 大數據愛好

原创 Windows7-64位python2.7、NumPy以及matplotlib的安裝

1.python2安裝 本人安裝的python2.7.11版本,安裝過程比較簡單。這裏說一下在cmd命令行下運行python。cmd命令行下輸入 python,如果提示找不到命令說明python並沒有加入到環境變量中。此時只需要將pyth

原创 機器學習算法2——決策樹

本文總結於《machine learning in action》一書 一. 決策樹的一般流程     1. 收集數據:可以使用任何方法     2. 準備數據:數構造算法只適應於標稱型數據,因此數值型數據必須離散。     3. 分析