原创 【Python】100基礎例(1-50)+數據分析例

1:1、2、3、4,能組成多少個互不相同且無重複數字的三位數?各是多少? #題目:有四個數字:1、2、3、4,能組成多少個互不相同且無重複數字的三位數?各是多少? #程序分析:可填在百位、十位、個位的數字都是1、2、3、4。組成所有的排

原创 【NLP】預訓練詞向量

玩轉詞向量:用fastText預訓練向量做個智能小程序  我沒有訓練任何機器學習模型,而是下載了使用 fastText 庫創造的預訓練英語詞向量:https://fasttext.cc/docs/en/english-vectors.ht

原创 【NLP】LDA2Vec筆記(基於cemoody/lda2vec 未實現)

學習鏈接:https://blog.csdn.net/u010161379/article/details/51250109 目錄 說明 理論 __init__.py 簡介 修改+註釋後代碼 corpus.py 簡介 preprocess

原创 【Python】面向對象_菜鳥教程

  目錄 理論 面嚮對象語言的基本特徵 名詞解釋 實踐 創建類的一般形式 簡例引入 __init__() self 創建實例對象(類的實例化) 訪問對象的屬性 簡例完整代碼 Python內置類屬性 類的繼承 類屬性與方法 類的私有屬性 類

原创 【NLP】英文數據預處理___詞幹/詞元處理

目錄 簡介 異同 相同點 不同點 代碼 詞形還原 詞幹提取 Gensim_詞形還原 說明 簡介 詞形還原(Lemmatization):把一個任何形式的語言詞彙還原爲基本形式(能表達完整語義); 詞幹提取(Stemming):抽取詞的詞幹

原创 【課程筆記】空間數據挖掘方法(機器學習)

一、緒論 機器學習VS數據挖掘 分類的過程   二、模型評估 評估方法 評估模型之留出法:簡單粗暴,直接按2:1~4:1將數據集分爲訓練集:測試集。 評估模型之交叉驗證法:將數據集分爲k個互斥子集,一部分作爲訓練集,另一部分作爲

原创 【NLP】LDA筆記

參考 【NLP】LDA主題模型詳解 【NLP】LDA主題模型的簡單應用     主題模型簡介        主題模型(Topic Model)是用來在一系列文檔中發現 抽象主題 的一種統計模型(自動分析每個文檔,統計文檔中的詞語,根據統計

原创 【Python庫】Numpy(較完整)

目錄 參考 簡介 詳介 Ndarray 對象 NumPy 數據類型 NumPy 數組屬性 Numpy的數組類ndarray的重要函數 NumPy 創建數組 numpy.empty numpy.zeros numpy.ones NumPy

原创 【Python】像計算機科學家一樣思考Python_筆記(上)

目錄 (一)程序之道 (二)變量、表達式和語句 (三)函數 例:turtle模塊,畫正方形 有返回值的函數 重構 (四)函數接口 文檔字符串 (五)條件和遞歸 pass 嵌套條件 遞歸recursion 鍵盤輸入 (八)字符串序列(seq

原创 【Python】菜鳥自編代碼之旅

合併不同文件夾的同名.csv文件 bb 1)懵:舍友求助,我的第一反應是——同不會(不是經常學Python嗎?這麼簡單的問題,你怎麼好意思說不會?)。最後達成共識:第二天思考思考,試着實現。2)搜:作爲一名伸手黨,第一步當然是上網搜,最好

原创 【NLP】LDA2Vec筆記(基於Lda2vec-Tensorflow-master 可實現)(實踐)

  數據 源代碼所用數據:20_newsgroups.txt,大小几十MB。 文件開頭:以texts 換行,作爲Key 源代碼所用的20個新聞組數據(據觀察,數據無特殊格式) 個人嘗試之Japan.txt,成功。 所用Japan.tx

原创 【Python庫】Pandas(部分)

目錄 參考 簡介 Numpy 和 Pandas 有什麼不同 詳介 Pandas數據結構之Series 從ndarray創建一個系列Series 從字典創建一個系列 從標量創建一個系列 使用標籤檢索數據(索引) 使用索引標籤值列表檢索多個元

原创 【NLP】LDA筆記之模型評估

Reference   Number of topics Plexity  OR  maximum likelihood estimation 使用R語言進行主題發現:https://www.cnblogs.com/deeplearnin

原创 【Python】異常/斷言_菜鳥教程

Python3 assert(斷言)|菜鳥教程:https://www.runoob.com/python3/python3-assert.html assert(斷言)用於判斷一個表達式,在表達式條件爲 false 的時候觸發異常

原创 【前端JS】網頁折線圖數據下載——EChart.js初涉

  網站一 任務描述 下載網頁折線圖中的數據 注:這並非普通的靜態圖表,像是傳說中的Echart——基於JavaScript語言編寫的前端數據可視化插件。 網頁Echart圖表截圖     思考嘗試 手動整理:對於我等懶人來說,能動手就