原创 python模塊chardet下載及介紹

在處理字符串時,常常會遇到不知道字符串是何種編碼,如果不知道字符串的編碼就不能將字符串轉換成需要的編碼。面對多種不同編碼的輸入方式,是否會有一種有效的編碼方式?chardet是一個非常優秀的編碼識別模塊。 chardet 是python

原创 理解vc維

Vapnik書上的定義寫得很晦澀,就寫一點簡單的 什麼叫做VC維大於等於d? 就是存在d筆資料,可以被分類函數shatter 什麼叫做VC維小於等於d? 就是任何d+1比資料都不能被分類函數shatter 所以VC維等於d是啥意思呢? 就

原创 win10操作點點滴滴

剛剛換了win10,各種不熟悉 這篇博客準備把我碰到的win10操作記下 1.win10下開控制檯: win鍵 + R 2.添加刪除程序: 右鍵點擊開始圖標,在菜單裏找 “程序和功能” ##########未完待續########

原创 ROC 和 AUC

 AUC是一種用來度量分類模型好壞的一個標準。         ROC分析是從醫療分析領域引入了一種新的分類模型performance評判方法。         ROC的全名叫做Receiver Operating Characte

原创 理解語義網

      剛開始瞭解語義網的時候,我有很多困惑。除了有許多生澀的專業術語橫亙在我面前,語義網的數理邏輯基礎也給初探這個的我造成了困擾。 藉着鄒磊老師“知識圖譜數據管理”這門課交大作業的機會,我想好好花一點時間,把我這一年所瞭解的有關語

原创 關於 極大似然估計 和 EM算法 最好的博文

http://blog.csdn.net/zouxy09/article/details/8537620

原创 Java增強for循環 (java中的冒號)

Java5引入了一種主要用於數組的增強型for循環。 Java增強for循環語法格式如下: for(聲明語句 : 表達式) { //代碼句子 } 示例如下 public class Test { public

原创 零基礎學Google Freebase API(python版)

出處 : http://www.stephensem.com/archives/318 首先要思考下爲什麼google要開發api呢,因爲google的產品用戶很多,他們的需求也是各種各樣的,打個比方adwords,用戶可以下載g

原创 OAuth的機制原理講解及開發流程

原文出處 : http://kb.cnblogs.com/page/189153/ 本想前段時間就把自己通過QQ OAuth1.0、OAuth2.0協議進行驗證而實現QQ登錄的心得及Demo實例分享給大家,可一直很忙,今天抽點時間

原创 關於Python線程

Python中操縱線程的類叫做Threading,和線程最相關的對象包括Lock & RLock,Semaphore以及Event 這三個對象的作用非別是: Lock & RLock:用於只允許一個線程同時訪問資源 Semaphore:允

原创 python 點滴

1、assert語句用來聲明某個條件是真的。 2、如果你非常確信某個你使用的列表中至少有一個元素,而你想要檢驗這一點,並且在它非真的時候引發一個錯誤,那麼assert語句是應用在這種情形下的理想語句。 3、當assert語句失敗的時候

原创 理解回調函數

知乎上一段經典的回答 你到一個商店買東西,剛好你要的東西沒有貨,於是你在店員那裏留下了你的電話,過了幾天店裏有貨了,店員就打了你的電話,然後你接到電話後就到店裏去取了貨。在這個例子裏,你的電話號碼就叫回調函數,你把電話留給店員就叫登記回

原创 Python如何解析動態網頁

用Python實現常規的靜態網頁抓取時,往往是用urllib2來獲取整個HTML頁面,然後從HTML文件中逐字查找對應的關鍵字。如下所示: import urllib2 url="http://mm.taobao.com/

原创 pthon編碼問題

1.關於編碼種類的簡介 http://www.cnblogs.com/huxi/archive/2010/12/05/1897271.html 2.關於中文編碼 http://www.cnblogs.com/ymy124/archive

原创 Python中編碼的問題超簡潔介紹

明明很簡單的問題,搞得那麼複雜作甚? 首先,無論是網頁上讀取的文本還是從文件裏獲得的文本,都有多種編碼方式:Unicode,utf-8,gbk,gb2312...... Python選擇了Unicode作爲其默認編碼   (要是想改pyt