原创 遷移學習資料
https://github.com/jindongwang/transferlearning 上面鏈接是關於遷移學習的相關資料,僅供參考 希望研究遷移學習的小夥伴們能夠一起交流哦
原创 關於punkt下載的問題
鏈接:https://pan.baidu.com/s/1vvNMuoROUYNrkgyusSvqOA 提取碼:w3sm 關鍵在於解壓縮
原创 文本分類預處理
https://github.com/hundredblocks/concrete_NLP_tutorial/blob/master/NLP_notebook.ipynb 清洗數據 https://blog.csdn.net/er
原创 python讀取文檔順序問題
file_list = os.listdir(small_class_path) 採用上述代碼時可能會出現亂序 此時在這段代碼的下面加上 file_list.sort(key=lambda x: int(x[:-1])) 然後運行程序
原创 中文分詞過程
import sys import os import jieba def savefile(savepath,content): fp = open(savepath,"wb") fp.write(content)
原创 python文本分類方法總結
8種傳統算法: k近鄰算法、決策樹、多層感知器、樸素貝葉斯(包括伯努利貝葉斯、高斯貝葉斯和多項式貝葉斯)、邏輯迴歸和支持向量機; 4種集成學習算法: 隨機森林、AdaBoost、lightGBM和xgBoost;
原创 python 花括號、中括號以及小括號的區別
原文鏈接:https://blog.csdn.net/tycoon1988/article/details/38404885 字典:dic={'a':12,'b':34} 列表:list=[1
原创 使用python生成曲線圖
原文鏈接:https://blog.csdn.net/oxuzhenyi/article/details/72528561 import matplotlib.pyplot as plt im