原创 Python正則表達式指南

本文介紹了Python對於正則表達式的支持,包括正則表達式基礎以及Python正則表達式標準庫的完整介紹及使用示例。本文的內容不包括如何編寫高效的正則表達式、如何優化正則表達式,這些主題請查看其他教程。 注意:本文基於Python2.4

原创 Python Version 2.7 required which was not found in the registry

在安裝Twisted時候,不能再註冊表中識別出來python2.7,但已經安裝了 在網上找了方法,僅作筆記,供下次使用  方法:  新建一個register.py 文件,把一下代碼貼進去  # # script to reg

原创 python Scrapy 框架做爬蟲 ——很好的教程

寫在前面: 因爲網絡上關於Scrapy的使用經驗已經非常多,本文無意重複或複製,只做思路導引和資源索引之用。如果你一頭扎進來正毫無頭緒,那麼恭喜你,你找到了路標! 非常感謝Young-hz所寫的Scrapy框架探索系列博客,在這裏主

原创 機器學習中的數學-模型組合(Model Combining)之Boosting與Gradient Boosting

文章出處:http://leftnoteasy.cnblogs.com。關於機器學習的博文都很不錯 Boosting方法:     Boosting這其實思想相當的簡單,大概是,對一份數據,建立M個模型(比如分類),一般這種模型比較

原创 VS 2010下 LINK : fatal error LNK1123: 轉換到 COFF 期間失敗: 文件無效或損壞,終極解決辦法

VS2010在經歷一些更新後,建立Win32 Console Project時會出“error LNK1123” 錯誤,解決方案爲將 項目|項目屬性

原创 Lubuntu14.04(Ubuntu)安裝爬蟲框架Scrapy

Scrapy,Python開發的一個快速,高層次的屏幕抓取和web抓取框架,用於抓取web站點並從頁面中提取結 Scrapy Pthyon爬蟲框架

原创 64位win7系統下面安裝pyOpenSSL一直報錯找不到openssl/aes.h解決方法

最近想裝一個scrapy玩下爬蟲,虛擬機Linux下面倒是很好安裝,但在windows下要安裝各種依賴包,最坑爹的是安裝pyOpenSSL時一直報錯。 不管是直接下載exe文件,還是下載egg文件用easy_install來安裝都失敗了,

原创 KMP算法求next數組和nextval數組的簡單方法

next數組的求解方法是: next數組的求解方法是:第一位的next值爲0,第二位的next值爲1,後面求解每一位的next值時,根據前一位進行比較。首先將前一位與其next值對應的內容進行比較,如果相等,則該位的next值就是前一位的

原创 SAE+wordpress郵箱問題,WP MAIL STMP插件配置但無效解決辦法

我在SAE上面部署的WordPress是3.9版本的,而非SAE應用商店裏WordPress4sae是3.4的,儘管3.9版本的確有很多改進但在部署在SAE上面時需要做很多修改,而且有些插件也需要修改,今天遇到一個網友問到之前遇到的一個郵

原创 機器學習實戰之決策樹(1)---ID3算法與信息熵,基尼不純度

機器學習實戰之決策樹(1)---ID3算法與信息熵,基尼不純度 2014-12-2閱讀552 評論0 (1)關於ID3算法百度文庫有一篇十分詳細的文章,介紹看一個例子,給出了具體的計算過程。 文章鏈接:http://wenk

原创 簡單調試 Python 程序

在 Python 中也可以像 gcc/gdb 那樣調試程序,只要在運行 Python 程序時引入 pdb 模塊(假設要調試的程序名爲 d.py): $ vi d.py #!/usr/bin/python def main():

原创 機器學習有很多關於核函數的說法,什麼是核函數?核函數的作用是什麼?

轉自知乎 詳細的公式什麼的,網絡上搜索kernel function, kernel methods 有很多,我就不仔細說了,簡單地說說背後的intuition。 intuition也很簡單,比如我們有一個一維的數據分佈是如下圖的樣子,你

原创 gcc下fflush(stdin)失效

今天編譯一程序涉及到了鍵盤緩衝區的清除問題,在VC下完全沒問題的代碼卻不能在gcc下運行成功,作此筆記以留念:  VC下代碼:  #include<

原创 在MFC中類內部建立線程處理函數以便調用類的成員函數和變量

在用MFC做開發時,有時遇到些工作線程中有些狀態需要在界面上顯示,最直觀的就是工作線程處理函數的進度顯示。這時候我們就需要在線程內部調用類的成員函數和變量了。下面給出一種最直觀,最簡單的一種處理方法。 類中聲明線程函數: class C

原创 hadoop2.4.1集羣環境搭建

歡迎光臨我的博客:http://www.poryfly.com/hadoop2-4-1-clustering-environment-setup/ 週末折騰了兩天,終於把集羣環境給搭好了。走了不少彎路,但最終還是成功了,記錄下以便以後參考