原创 python模塊chardet下載及介紹
在處理字符串時,常常會遇到不知道字符串是何種編碼,如果不知道字符串的編碼就不能將字符串轉換成需要的編碼。面對多種不同編碼的輸入方式,是否會有一種有效的編碼方式?chardet是一個非常優秀的編碼識別模塊。 chardet 是python
原创 理解vc維
Vapnik書上的定義寫得很晦澀,就寫一點簡單的 什麼叫做VC維大於等於d? 就是存在d筆資料,可以被分類函數shatter 什麼叫做VC維小於等於d? 就是任何d+1比資料都不能被分類函數shatter 所以VC維等於d是啥意思呢? 就
原创 win10操作點點滴滴
剛剛換了win10,各種不熟悉 這篇博客準備把我碰到的win10操作記下 1.win10下開控制檯: win鍵 + R 2.添加刪除程序: 右鍵點擊開始圖標,在菜單裏找 “程序和功能” ##########未完待續########
原创 ROC 和 AUC
AUC是一種用來度量分類模型好壞的一個標準。 ROC分析是從醫療分析領域引入了一種新的分類模型performance評判方法。 ROC的全名叫做Receiver Operating Characte
原创 理解語義網
剛開始瞭解語義網的時候,我有很多困惑。除了有許多生澀的專業術語橫亙在我面前,語義網的數理邏輯基礎也給初探這個的我造成了困擾。 藉着鄒磊老師“知識圖譜數據管理”這門課交大作業的機會,我想好好花一點時間,把我這一年所瞭解的有關語
原创 關於 極大似然估計 和 EM算法 最好的博文
http://blog.csdn.net/zouxy09/article/details/8537620
原创 Java增強for循環 (java中的冒號)
Java5引入了一種主要用於數組的增強型for循環。 Java增強for循環語法格式如下: for(聲明語句 : 表達式) { //代碼句子 } 示例如下 public class Test { public
原创 零基礎學Google Freebase API(python版)
出處 : http://www.stephensem.com/archives/318 首先要思考下爲什麼google要開發api呢,因爲google的產品用戶很多,他們的需求也是各種各樣的,打個比方adwords,用戶可以下載g
原创 OAuth的機制原理講解及開發流程
原文出處 : http://kb.cnblogs.com/page/189153/ 本想前段時間就把自己通過QQ OAuth1.0、OAuth2.0協議進行驗證而實現QQ登錄的心得及Demo實例分享給大家,可一直很忙,今天抽點時間
原创 關於Python線程
Python中操縱線程的類叫做Threading,和線程最相關的對象包括Lock & RLock,Semaphore以及Event 這三個對象的作用非別是: Lock & RLock:用於只允許一個線程同時訪問資源 Semaphore:允
原创 python 點滴
1、assert語句用來聲明某個條件是真的。 2、如果你非常確信某個你使用的列表中至少有一個元素,而你想要檢驗這一點,並且在它非真的時候引發一個錯誤,那麼assert語句是應用在這種情形下的理想語句。 3、當assert語句失敗的時候
原创 理解回調函數
知乎上一段經典的回答 你到一個商店買東西,剛好你要的東西沒有貨,於是你在店員那裏留下了你的電話,過了幾天店裏有貨了,店員就打了你的電話,然後你接到電話後就到店裏去取了貨。在這個例子裏,你的電話號碼就叫回調函數,你把電話留給店員就叫登記回
原创 Python如何解析動態網頁
用Python實現常規的靜態網頁抓取時,往往是用urllib2來獲取整個HTML頁面,然後從HTML文件中逐字查找對應的關鍵字。如下所示: import urllib2 url="http://mm.taobao.com/
原创 pthon編碼問題
1.關於編碼種類的簡介 http://www.cnblogs.com/huxi/archive/2010/12/05/1897271.html 2.關於中文編碼 http://www.cnblogs.com/ymy124/archive
原创 Python中編碼的問題超簡潔介紹
明明很簡單的問題,搞得那麼複雜作甚? 首先,無論是網頁上讀取的文本還是從文件裏獲得的文本,都有多種編碼方式:Unicode,utf-8,gbk,gb2312...... Python選擇了Unicode作爲其默認編碼 (要是想改pyt