原创 Tensorflow(二)之基礎知識初探
Tensorflow兩個重要的概念,Tensor和flow。Tensor是張量,可以簡單的理解爲多維數組,表明了Tensorflow的數據結構。Flow是“流”,表達了張量之間通過計算相互轉化的過程,表明了Tensorflow的計算模型。
原创 Tensorflow(一)window+Anaconda+tensorflow搭建
先在這吐槽一句,使用docker安裝tensorflow有個大坑,安裝tensorflow-gpu需要nvidia-docker,但是截至到目前官方還沒有windows版。所以想在window上使用tensorflow-gpu的
原创 github的三種使用方式
一、CSDN博客註冊及使用 1.搜索CSDN,進入首頁,選擇右上角註冊。 2.手機號綁定: 掃描進入之後,需要你關注任何一個公衆號,從公衆號發送自己的手機號獲取短信驗證碼,輸入驗證碼即可註冊成功,此手機號會默認綁定該賬號
原创 gensim基礎學習(一)
最近參加了個長文本分類的比賽,然後開始使用gensim,一個很強大的NLP神器,用於從原始的非結構化的文本中,無監督地學習到文本隱層的主題向量表達,在此記錄一下使用心得。 目錄 基本概念 1.語料的處理 2.生成詞典和向量轉
原创 從Word Embedding到Bert模型—自然語言處理中的預訓練技術發展史
2018年作爲 NLP的轉折年,真的出現了很多優秀的模型,發現了大佬的一篇文章,對word embedding、ELMO、GPT、BERT之間的發展和聯繫進行了系統的分析和對比,讀完以後大徹大悟,學到了很多,趕緊關注粉一波。轉載
原创 skelarn算法學習(一)
Sklearn,是一個python庫,專門用於機器學習的模塊。包括了分類,迴歸,無監督,數據降維,數據預處理等常見的機器學習算法。推薦使用Anaconda,本身自帶了很多常用的庫,而且安裝庫也特別的方便。本次學習主要了爲了進行長文本的分類
原创 Matplotlib學習(一)
Matplotlib對象簡介 FigureCanvas 畫布 Figure 圖 Axes 座標軸(實際畫圖的地方) matplotlib畫圖的流程 調用figure()得到figu
原创 機器學習之路(二)之樸素貝葉斯
目錄 1. 基本概念(統計學習方法): 2.對於重複的詞 3.平滑技術 4.樸素貝葉斯法的侷限性 5.代碼實現 1. 基本概念(統計學習方法): 樸素貝葉斯法是基於貝葉斯定理與特
原创 自然語言處理學習(一)之概述小結
一.概述 現狀 現代nlp的主要任務已經跨越對詞的研究,發展到了對句子研究,即句法、句義及句子生成的研究,已經能較好的解決句子層面的問題,但是尚未達到完全解決篇章層面的問題,尚不足以達到較爲自由的人機交互。 專業技術:完全句法分析、淺層句
原创 java實現網格法、KDTree空間檢索
Spatial Query 一、介紹 二、問題描述 2.1具體任務 2.2程序輸入 2.3 程序輸出 三、問題解答 3.1 數據預處理 3.2 G
原创 機器學習之路(八)隨機森林
1. 集成學習概念, 2. 個體學習器, 3. boosting , bagging 4. 結合策略(平均法,投票法,學習法) 5. 隨機森林思想 6. 隨機森林的推廣 7. 優缺點 8. sklearn參數 1.集成學習概念
原创 機器學習之路-最小二乘法、梯度下降法
最小二乘法 基本思想: 最小二乘法則是一種統計學習優化技術,它的目標是最小化誤差平方之和來作爲目標,從而找到最優模型,這個模型可以擬合觀察數據。 迴歸學習最常用的損失函數是平方損失函數,在此情況下,迴歸問
原创 機器學習之路(一)之KNN
基本概念: k近鄰法是一種基本分類與迴歸方法,屬於判別模型。k值的選擇、距離度量及分類決策規則是k近鄰法的三個基本要素。 k近鄰法的特殊情況是k=1的情形,稱爲最近鄰算法,對於輸入的實例,將最鄰近的點的類作爲x的類別。
原创 機器學習之路(四)之感知機算法PLA
基本介紹: 如果訓練集數據是兩個互不相交的凸集的子集,那麼可以找到一個支撐超平面將兩個子集分開。那麼,如果這個超平面是一個n維的線性方程,就稱之爲線性分類器。線性分類器是最簡單和最基本的分類器,也是最早的神經網絡模型,稱爲感知
原创 Matplotlib學習(二)各種圖
目錄 1.條形圖(用於比較不同實體) 2.直方圖(用於顯示分佈) 3.散點圖(變量比較) 4.面積圖 5.餅圖 1.條形圖(用於比較不同實體) 參數說明 bar(left, height, width=0.8, bottom=No