原创 [學習]用python的BeautifulSoup分析html

序言   之前用python爬取網頁的時候,一直用的是regex或者自帶的庫sgmllib裏的SGMLParser。但是遇到複雜一點的情況時,SGMLParser往往就不那麼給力了!(哈,難道說我 too native了?畢竟beau

原创 python判斷兩個文件是否相同

import hashlib def getHash(f): line=f.readline() hash=hashlib.md5() while(line): hash.update(line)

原创 C++中有哪些類型轉換方式

C++中四種類型轉換運算符的使用方法 reinterpret_cast 該函數將一個類型的指針轉換爲另一個類型的指針. 這種轉換不用修改指針變量值存放格式(不改變指針變量值),只需在編譯時重新解釋指針的類型就可做到. reinterpre

原创 數據庫隔離級別

read uncommited  (讀未提交)       最低級別,可讀取未提交事物的數據,這會導致髒讀,比如:某時刻會話a修改了一個數據,但還未提交,此時會話b,讀取了該數據,這是,會話a回滾了事物,這就導致數據出現了不一致狀態,這

原创 python 字典方法

1.clear   清除字典中所有的項。原地操作,無返回值(或說返回值爲None)。 >>> d = {} >>> d['name'] = 'Gumby' >>> d['age'] = 42 >>> d {'age':42, 'na

原创 python中的set操作

[python] view plaincopy python的set和其他語言類似, 是一個無序不重複元素集, 基本功能包括關係測試和消除重複元素. 集合對象還支持union(聯合), intersection(交), d

原创 python 列表函數

list函數:   功能:將字符創轉化爲列表,例:                列表基本函數:    1.元素賦值,例:                        注意:通過list[0]= 'hel',如果原來位置上

原创 C編譯: 動態連接庫 (.so文件)

在“紙上談兵: 算法與數據結構”中,我在每一篇都會有一個C程序,用於實現算法和數據結構 (比如棧和相關的操作)。在同一個程序中,還有用於測試的main()函數,結構體定義,函數原型,typedef等等。 這樣的做法非常不“環保”

原创 Redis的持久化機制

定時快照方式(snapshot): 該持久化方式實際是在Redis內部一個定時器事件,每隔固定時間去檢查當前數據發生的改變次數與時間是否滿足配置的持久化觸發的條件,如果滿足則通過操作系統fork調用來創建出一個子進程,這個子進程默認會

原创 MySQL索引背後的數據結構及算法原理

MySQL索引背後的數據結構及算法原理   張洋,發佈於2011-07-14, 張洋的Blog   寫在前面的話 在編程領域有一句人盡皆知的法則“程序 = 數據結構 + 算法”,我個人是不太贊同這句話(因爲我覺得程序不

原创 Redis 在新浪微博中的應用

內容目錄: Redis簡介Redis基本原理新浪Redis使用歷程Redis應用場景遇到的問題及解決辦法經驗總結 Redis 在新浪微博中的應用 Redis簡介 1. 支持5種數據結構 支持strings, hashes, lis

原创 vector詳解

C++內置的數組支持容器的機制,但是它不支持容器抽象的語義。要解決此問題我們自己實現這樣的類。在標準C++中,用容器向量(vector)實現。容器向量也是一個類模板。 標準庫vector類型使用需要的頭文件:#include <vect

原创 Python的內存管理

作者:Vamei 出處:http://www.cnblogs.com/vamei 歡迎轉載,也請保留這段聲明。謝謝!   語言的內存管理是語言設計的一個重要方面。它是決定語言性能的重要因素。無論是C語言的手工管理,還是Java的

原创 c++對象內存模型【內存佈局】

#類中的元素 0. 成員變量   1. 成員函數   2. 靜態成員變量   3. 靜態成員函數   4. 虛函數   5. 純虛函數 #影響對象大小的因素 0. 成員變量     1. 虛函數表指針(_vftptr)   2.

原创 各大型網站架構分析收集

1. PlentyOfFish 網站架構學習http://www.dbanotes.net/arch/plentyoffish_arch.html採取 Windows 技術路線的 Web 2.0 站點並不多,除了 MySpace ,另外就