原创 遷移學習資料

https://github.com/jindongwang/transferlearning 上面鏈接是關於遷移學習的相關資料,僅供參考 希望研究遷移學習的小夥伴們能夠一起交流哦

原创 關於punkt下載的問題

鏈接:https://pan.baidu.com/s/1vvNMuoROUYNrkgyusSvqOA  提取碼:w3sm 關鍵在於解壓縮

原创 文本分類預處理

https://github.com/hundredblocks/concrete_NLP_tutorial/blob/master/NLP_notebook.ipynb   清洗數據   https://blog.csdn.net/er

原创 python讀取文檔順序問題

file_list = os.listdir(small_class_path) 採用上述代碼時可能會出現亂序 此時在這段代碼的下面加上 file_list.sort(key=lambda x: int(x[:-1])) 然後運行程序

原创 中文分詞過程

import sys import os import jieba def savefile(savepath,content):     fp = open(savepath,"wb")     fp.write(content)  

原创 python文本分類方法總結

8種傳統算法:        k近鄰算法、決策樹、多層感知器、樸素貝葉斯(包括伯努利貝葉斯、高斯貝葉斯和多項式貝葉斯)、邏輯迴歸和支持向量機; 4種集成學習算法:       隨機森林、AdaBoost、lightGBM和xgBoost;

原创 python 花括號、中括號以及小括號的區別

原文鏈接:https://blog.csdn.net/tycoon1988/article/details/38404885 字典:dic={'a':12,'b':34} 列表:list=[1

原创 使用python生成曲線圖

原文鏈接:https://blog.csdn.net/oxuzhenyi/article/details/72528561 import matplotlib.pyplot as plt im