原创 Issure: Windows 80 端口被佔用

0.首先: netstat -ano | findstr “80” 查看佔用端口的進程 1.一般應用程序佔用, 直接 taskkill /pid xxx /f 結束進程即可 2. system 的 service佔用

原创 tesseract-ocr 使用筆記

1. -psm 指定識別模式 -psm 10 單個字符 -psm 8 單個單詞 -psm 7 一行 其餘可以-h 查看幫助 2. -l (-langs) 指定待識別語言(更準確說是字符集) -l eng 純英語 2.

原创 PyQt5(>= 5.4) 設置cookie

1. 得到 cooieStore (QWebEngineCookieStore) browser = QWebEngineView() cookieStore = browser.page().profile().cookieSt

原创 First, Follow 集

參考 http://www.cppblog.com/woaidongmao/archive/2010/02/22/108242.html First集: 1. 非終結符(表達式左側的大寫字母)的推導式如果含有終結符(小寫字母、運算

原创 python 數字的四捨五入的問題

python3 以及python2.7 使用 round或者format進行浮點數的四捨五入問題 由於 python3 包括python2.7 以後的round策略使用的是decimal.ROUND_HALF_EVEN 即Rou

原创 Python 自帶小工具

1. exec 將.py文件加載, 包括各種定義 #python裏運行python文件 exec(open(test.py).read()) 2. zipapp >= python3.5 ,製作簡單的pyz 文件包 python

原创 爬蟲, 從python2 到 python3

我也是納悶, python3 出好些年了, 各種主要的解析庫、爬蟲框架等相關庫也早就支持python3, 爲啥網上一搜爬蟲的文章(2015年寫)用的還是python2.7 , 又沒有啥好處, 早晚免不了要遷移到python3, 爲

原创 Python 屬性管理(整理轉自《Python學習手冊》)

插入在屬性訪問時運行的代碼 1.__getattr__ 和 __setattr__ 方法,把未定義的屬性獲取和所有的屬性賦值指向通用 的處理器方法。 2.__getattribute__ 方法,把所有屬性獲取都指向Python

原创 doctest -- 註釋裏的單元測試

doctest 是python自帶的模塊, 通過在註釋裏寫代碼,以及結果來進行簡單的測試 def square(x): """Squares x. >>> square(2) 4 >>> squa

原创 NightCode

直到寫這篇文以前,見過的最好用、最輕量級的Clojure編輯器 說它好用: 1.基於leiningen開發的GUI編輯器, 括號的自動匹配比emacs上的智能多了 2.簡潔的界面就是1.項目 2.編輯

原创 Issure: LookupError: unknown encoding: cp65001

1. python 不能識別Windows關於UTF-8的編號, 參見http://stackoverflow.com/questions/878972/windows-cmd-encoding-change-causes-pyt

原创 Issure: Thunderbird Win10 左上角空白塊

實際上是功能塊,只是沒有顯示內容 1.空白塊中間區域點擊可以啓動應用 2.大概空白塊右上角點擊可以關閉

原创 關於Python的配置文件

1.最常用的Plain text形式的配置文件 1.1首選 .init 文件 標準庫 configparser 1.2次選 csv文件 與 Unix/Linux 下常用的 xx = xxx形式的配置文件 分別是標準庫csv 與

原创 tesseract 訓練 + 識別

1. 聯合語言訓練庫 tesseract也提出,通過使用多個語言訓練庫聯合使用。如此,新的語言訓練庫也可以與原有的數據訓練庫聯合使用。如參數 -l 之後 tesseract input.tif output -l eng+newl

原创 Python 運算符重載

常見的運算符重載方法 在類中,對內置對象(例如,整數和列表)所能做的事,幾乎都有相應的特殊名稱的重載方法。下表列出其中一些最常用的重載方法。參見http://blog.csdn.net/gavin_john/article/det