原创 機器學習數據集pima-indians-diabetes.data 及R語言讀入命令

這個數據集是機器學習常用練習集,包括768個observation,原鏈接如下 https://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes

原创 Editplus 裏面的正則表達式

Editplus 是windows平臺裏常用的多功能編輯器,本人認爲最喜聞樂見的功能是支持多文件查找。 一直不忍放棄。其實它也支持RE,只是功能有限。 參考博文 http://www.williamlong.info/archives/4

原创 NCBI genebank refseq 編號意義

最近在做virus detection 用到NCBI genebank的病毒庫,發現gene bank refseq裏面編號很多,貼在下面,有助記憶。 genebank的病毒參考序列庫,最近一次更新去掉了GI號,只保留NC或AC號,可以看

原创 linux 命令備忘隨筆

開博僅僅是記錄學習工作中某些(用到過,但不容易記住的)命令, 方便自己查找。 如果你恰好也在找這些命令並對你有些許幫助,那真是緣分啊,歡迎拍磚! linux命令總寶典 技巧a  用 --help 查看自帶的葵花寶典,指定錯不了。 技巧b 

原创 editplus 裏面的正則表達式

Editplus 是windows平臺裏常用的多功能編輯器,一直不忍放棄。其實它也支持RE,只是功能有限。 參考博文 http://www.williamlong.info/archives/4448.html 總結如下: 1.