原创 python 格式化字符串

格式化字符串 待編輯

原创 python 標準庫 random

random.shuffle(list) 打亂list的行(第一個維度)順序,默認inplace=True效果 >>> ll=[[1,2],[3,4],[5,6]] >>> random.shuffle(ll) >>> ll [[5,

原创 python 擴展庫 sklearn

文章目錄基礎sklearn.feature_extraction.DictVectorizer(sparse=True) 字典形式樣本的特徵化處理sklearn.model_selection.train_test_split(arr

原创 python 擴展庫 wordcloud

wordcloud庫可以將單詞以單詞雲形式在畫布上展現 WordCloud().generate_from_frequencies(freq_dict) 可將單詞隨機置於畫布上生成單詞雲,同時每個單詞字號大小取決於相應頻率的高低。 >

原创 python 標準庫 re

原创 python 擴展庫 nltk

tokenization stemming stop word removal

原创 nlp 基礎

text corpus,corpus (pl. corpora) 語料,語料庫 大量的文本數據的集合就是語料庫,語料庫可以包含一個或者多個文檔,也可以是一種或多種語言,甚至可以是錄音。針對不同的應用,語料庫也可能會依據段、句或詞等維度

原创 python 標準庫 itertools

itertools.combinations(iterables,r) 所有組合可能 返回iterables中所有可能的長度爲r的子序列,返回的子序列中的項按輸入iterable中的順序排序 (不帶重複)

原创 數學 基礎

文章目錄柯西分佈,Cauchy distribution 柯西分佈,Cauchy distribution  柯西也叫作柯西-洛倫茲分佈,其概率密度函數爲f(x;x0,γ)=1π[γ(x−x0)2+γ2]f(x;x_0,\gamma)

原创 markdown 基礎

文章目錄結構根據標題生成目錄格式標題段首空格段落結束換行項目編號表格標識加粗引用代碼舉例數學公式 結構 根據標題生成目錄 @[TOC](目錄標題) 格式 標題 # 開始,每增加一個 # 降一級標題 段首空格   長空格 &e

原创 貝葉斯塊算法 Bayesian Blocks Algorithm

文章目錄目標定義塊評價函數 fitness of block基本思路算法 目標 定義 值或數據點(cell, data cell):變量的取值。 塊(block of cells):分箱,即排序後臨近cell組成的塊。 分組(par

原创 python 擴展庫 scipy

文章目錄scipy.stats連續隨機變量 scipy.stats scipy的stats模塊包含了多種概率分佈的隨機變量。隨機變量分爲連續和離散兩種。所有的連續隨機變量都是stats.rv_continuous的派生類的對象,而所有

原创 markdown默認模板

這裏寫自定義目錄標題歡迎使用Markdown編輯器新的改變功能快捷鍵合理的創建標題,有助於目錄的生成如何改變文本的樣式插入鏈接與圖片如何插入一段漂亮的代碼片生成一個適合你的列表創建一個表格設定內容居中、居左、居右SmartyPants

原创 LaTeX

文章目錄框架及格式:數學符號及公式加粗大號字無縮進,頂頭垂直行間距另起一行,置於句尾文字加粗(非符號加粗)行內插入公式,在文字內容中插入公式單起一行居中展示公式最短間隔距離標識下劃線頭上向右指的箭頭右上標右下標左下標左上標頭上長波浪線