台部落皮的开心

原创 Tensorflow(二)之基礎知識初探

Tensorflow兩個重要的概念，Tensor和flow。Tensor是張量，可以簡單的理解爲多維數組，表明了Tensorflow的數據結構。Flow是“流”，表達了張量之間通過計算相互轉化的過程，表明了Tensorflow的計算模型。

2019-01-25 21:58:03

原创 Tensorflow(一)window+Anaconda+tensorflow搭建

先在這吐槽一句，使用docker安裝tensorflow有個大坑，安裝tensorflow-gpu需要nvidia-docker，但是截至到目前官方還沒有windows版。所以想在window上使用tensorflow-gpu的

2019-01-25 21:58:02

原创 github的三種使用方式

一、CSDN博客註冊及使用 1.搜索CSDN，進入首頁，選擇右上角註冊。 2.手機號綁定：掃描進入之後，需要你關注任何一個公衆號，從公衆號發送自己的手機號獲取短信驗證碼，輸入驗證碼即可註冊成功，此手機號會默認綁定該賬號

2019-01-21 20:59:57

原创 gensim基礎學習（一）

最近參加了個長文本分類的比賽，然後開始使用gensim，一個很強大的NLP神器，用於從原始的非結構化的文本中，無監督地學習到文本隱層的主題向量表達，在此記錄一下使用心得。目錄基本概念 1.語料的處理 2.生成詞典和向量轉

2018-12-23 21:42:29

20

原创從Word Embedding到Bert模型—自然語言處理中的預訓練技術發展史

2018年作爲 NLP的轉折年，真的出現了很多優秀的模型，發現了大佬的一篇文章，對word embedding、ELMO、GPT、BERT之間的發展和聯繫進行了系統的分析和對比，讀完以後大徹大悟，學到了很多，趕緊關注粉一波。轉載

2018-12-23 21:42:29

9

原创 skelarn算法學習（一）

Sklearn，是一個python庫，專門用於機器學習的模塊。包括了分類，迴歸，無監督，數據降維，數據預處理等常見的機器學習算法。推薦使用Anaconda，本身自帶了很多常用的庫，而且安裝庫也特別的方便。本次學習主要了爲了進行長文本的分類

2018-12-23 21:42:29

2

原创 Matplotlib學習(一)

Matplotlib對象簡介 FigureCanvas 畫布 Figure 圖 Axes 座標軸(實際畫圖的地方) matplotlib畫圖的流程調用figure()得到figu

2018-12-23 21:42:29

原创機器學習之路(二)之樸素貝葉斯

目錄 1. 基本概念（統計學習方法）： 2.對於重複的詞 3.平滑技術 4.樸素貝葉斯法的侷限性 5.代碼實現 1. 基本概念（統計學習方法）：樸素貝葉斯法是基於貝葉斯定理與特

2018-12-23 21:42:29

原创自然語言處理學習（一）之概述小結

一．概述現狀現代nlp的主要任務已經跨越對詞的研究，發展到了對句子研究，即句法、句義及句子生成的研究，已經能較好的解決句子層面的問題，但是尚未達到完全解決篇章層面的問題，尚不足以達到較爲自由的人機交互。專業技術：完全句法分析、淺層句

2018-12-23 21:42:29

原创 java實現網格法、KDTree空間檢索

Spatial Query 一、介紹二、問題描述 2.1具體任務 2.2程序輸入 2.3 程序輸出三、問題解答 3.1 數據預處理 3.2 G

2018-12-23 21:42:29

21

原创機器學習之路（八）隨機森林

1. 集成學習概念， 2. 個體學習器， 3. boosting ， bagging 4. 結合策略(平均法，投票法，學習法) 5. 隨機森林思想 6. 隨機森林的推廣 7. 優缺點 8. sklearn參數 1.集成學習概念

2018-12-23 21:42:29

1

原创機器學習之路-最小二乘法、梯度下降法

最小二乘法基本思想：最小二乘法則是一種統計學習優化技術，它的目標是最小化誤差平方之和來作爲目標，從而找到最優模型，這個模型可以擬合觀察數據。迴歸學習最常用的損失函數是平方損失函數，在此情況下，迴歸問

2018-12-23 21:42:29

原创機器學習之路(一)之KNN

基本概念： k近鄰法是一種基本分類與迴歸方法，屬於判別模型。k值的選擇、距離度量及分類決策規則是k近鄰法的三個基本要素。 k近鄰法的特殊情況是k=1的情形，稱爲最近鄰算法，對於輸入的實例，將最鄰近的點的類作爲x的類別。

2018-12-23 21:42:29

原创機器學習之路(四)之感知機算法PLA

基本介紹：如果訓練集數據是兩個互不相交的凸集的子集，那麼可以找到一個支撐超平面將兩個子集分開。那麼，如果這個超平面是一個n維的線性方程，就稱之爲線性分類器。線性分類器是最簡單和最基本的分類器，也是最早的神經網絡模型，稱爲感知

2018-12-23 21:42:29

1

原创 Matplotlib學習(二)各種圖

目錄 1.條形圖（用於比較不同實體） 2.直方圖（用於顯示分佈） 3.散點圖（變量比較） 4.面積圖 5.餅圖 1.條形圖（用於比較不同實體）參數說明 bar(left, height, width=0.8, bottom=No

2018-12-23 21:42:29