原创 利用PhantomJS插件爬取SSCI目錄的幾點收穫

0 前言        我們打算構建一個有關ssci中收錄的期刊信息的數據庫,但是官網上並沒有提供可以直接下載的目錄信息,所以着手對其目錄網頁(http://mjl.clarivate.com/cgi-bin/jrnlst/jlsubc

原创 python3下使用openpyxl對xlsx進行寫入操作

   筆者之前都是用xlwt進行excel文件寫入的,直到今天要處理長語料的時候發生了報錯: Exception: string longer than 32767 characters.     大意就是你要插入的數據太長,xlwt愛

原创 WinXp下的PyQt5與PyInstaller的使用實現

這幾天老闆讓做一個實現數據導入的小程序,在win10上用pyqt5+pyinstaller行雲流水編好了,結果老師說他同事的電腦不能用。。一看,XP??32位??fine,生活還是要繼續的。裝了個虛擬機後就開始了填坑之路。。。坑1:XP下

原创 Python 最大逆向匹配算法

第三次重新寫這個算法,每次寫都有新的體會。這次最大的感受是把訪問文件夾的包都熟悉了一下,os和shutil。後者用來刪除整個文件,這種破壞力還是慎用吧。def mk_new_dir(filename): # 新建一個文件夾,如果存在,則

原创 挑戰實現P、R、F(精準率、召回率和調和數)的python程序

—————————————— 王老師就留了課後作業,讓算一下訓練出來結果的P(精準率)、R(召回率)、F(調和數),以展示我們所應用CRF機器學習的顯著效果。 1.模板 首先模板是最簡單的模板,沒有加入什麼特徵。所以訓練出來能達到70

原创 python學習筆記002

哈哈一晃就是一個學期。 開始使用python做一些小玩意,比如寫了爬蟲,寫了文本處理的小腳本(文本預處理,詞頻統計,實體抽取,,tfidf的計算……),但還是有點疑惑,爲什麼我所應用到python文本處理的程序,都沒有使用面向對象呢?這可

原创 一種MSSQLDatabaseException:18456的解決方案

連接sql server數據庫時使用下列語句:from pymssql import connect conn = connect(host="localhost", user="sa",password="123456", databa

原创 Python學習筆記001

爲了學好python這門語言,立下這個flag,多看多寫,多練習,多創作。 專業要求,興趣使然。 加油。 ———————————分割線——————————— Java我邊學邊用了一年,因爲我學的專業是信息管理與信息系統,所以一直用Jav