原创 Tensorflow(二)之基礎知識初探

Tensorflow兩個重要的概念,Tensor和flow。Tensor是張量,可以簡單的理解爲多維數組,表明了Tensorflow的數據結構。Flow是“流”,表達了張量之間通過計算相互轉化的過程,表明了Tensorflow的計算模型。

原创 Tensorflow(一)window+Anaconda+tensorflow搭建

     先在這吐槽一句,使用docker安裝tensorflow有個大坑,安裝tensorflow-gpu需要nvidia-docker,但是截至到目前官方還沒有windows版。所以想在window上使用tensorflow-gpu的

原创 github的三種使用方式

一、CSDN博客註冊及使用 1.搜索CSDN,進入首頁,選擇右上角註冊。 2.手機號綁定:        掃描進入之後,需要你關注任何一個公衆號,從公衆號發送自己的手機號獲取短信驗證碼,輸入驗證碼即可註冊成功,此手機號會默認綁定該賬號

原创 gensim基礎學習(一)

       最近參加了個長文本分類的比賽,然後開始使用gensim,一個很強大的NLP神器,用於從原始的非結構化的文本中,無監督地學習到文本隱層的主題向量表達,在此記錄一下使用心得。 目錄 基本概念 1.語料的處理 2.生成詞典和向量轉

原创 從Word Embedding到Bert模型—自然語言處理中的預訓練技術發展史

     2018年作爲 NLP的轉折年,真的出現了很多優秀的模型,發現了大佬的一篇文章,對word embedding、ELMO、GPT、BERT之間的發展和聯繫進行了系統的分析和對比,讀完以後大徹大悟,學到了很多,趕緊關注粉一波。轉載

原创 skelarn算法學習(一)

Sklearn,是一個python庫,專門用於機器學習的模塊。包括了分類,迴歸,無監督,數據降維,數據預處理等常見的機器學習算法。推薦使用Anaconda,本身自帶了很多常用的庫,而且安裝庫也特別的方便。本次學習主要了爲了進行長文本的分類

原创 Matplotlib學習(一)

Matplotlib對象簡介    FigureCanvas  畫布    Figure        圖    Axes          座標軸(實際畫圖的地方) matplotlib畫圖的流程 調用figure()得到figu

原创 機器學習之路(二)之樸素貝葉斯

   目錄    1. 基本概念(統計學習方法):    2.對於重複的詞    3.平滑技術       4.樸素貝葉斯法的侷限性    5.代碼實現    1.   基本概念(統計學習方法):     樸素貝葉斯法是基於貝葉斯定理與特

原创 自然語言處理學習(一)之概述小結

一.概述 現狀 現代nlp的主要任務已經跨越對詞的研究,發展到了對句子研究,即句法、句義及句子生成的研究,已經能較好的解決句子層面的問題,但是尚未達到完全解決篇章層面的問題,尚不足以達到較爲自由的人機交互。 專業技術:完全句法分析、淺層句

原创 java實現網格法、KDTree空間檢索

                                              Spatial Query 一、介紹 二、問題描述 2.1具體任務 2.2程序輸入 2.3 程序輸出 三、問題解答 3.1 數據預處理 3.2 G

原创 機器學習之路(八)隨機森林

1. 集成學習概念, 2. 個體學習器, 3. boosting , bagging 4. 結合策略(平均法,投票法,學習法) 5. 隨機森林思想 6. 隨機森林的推廣 7. 優缺點 8. sklearn參數 1.集成學習概念      

原创 機器學習之路-最小二乘法、梯度下降法

最小二乘法     基本思想:              最小二乘法則是一種統計學習優化技術,它的目標是最小化誤差平方之和來作爲目標,從而找到最優模型,這個模型可以擬合觀察數據。 迴歸學習最常用的損失函數是平方損失函數,在此情況下,迴歸問

原创 機器學習之路(一)之KNN

基本概念:        k近鄰法是一種基本分類與迴歸方法,屬於判別模型。k值的選擇、距離度量及分類決策規則是k近鄰法的三個基本要素。 k近鄰法的特殊情況是k=1的情形,稱爲最近鄰算法,對於輸入的實例,將最鄰近的點的類作爲x的類別。  

原创 機器學習之路(四)之感知機算法PLA

   基本介紹:    如果訓練集數據是兩個互不相交的凸集的子集,那麼可以找到一個支撐超平面將兩個子集分開。那麼,如果這個超平面是一個n維的線性方程,就稱之爲線性分類器。線性分類器是最簡單和最基本的分類器,也是最早的神經網絡模型,稱爲感知

原创 Matplotlib學習(二)各種圖

目錄 1.條形圖(用於比較不同實體) 2.直方圖(用於顯示分佈) 3.散點圖(變量比較) 4.面積圖 5.餅圖  1.條形圖(用於比較不同實體)  參數說明  bar(left, height, width=0.8, bottom=No