原创 Centos6.8上安裝與配置Mongo

Centos6.8上安裝與配置Mongo 一 配置Mongo的yum源 # 編輯文件 vim /etc/yum.repos.d/mongodb-org-3.6.repo # 添加以下內容 [mongodb-org-3.6] n

原创 centos安裝python3與python2共存

centos安裝python3與python2共存 網上的教程一搜很多,質量參差不齊,好多都是直接轉發的,自己都沒試試(導致一個錯誤的方法傳的到處都是,無力吐槽),這裏我給出一個我自己安裝成功的例子。系統是centos6.8,py

原创 機器學習模型的性能度量方法

       對機器學習模型進行評估,不僅需要有效的實驗評估方法,還需要有衡量模型泛化能力的評價指標,在這裏總結一下常用的機器學習模型的性能度量方法,總結不完善的地方歡迎大家留言補充。        以二分類爲例,首先給出分類結果

原创 文本表示

文本表示就是將文本轉化成數學上的向量表示,怎麼把字符串轉化爲向量,就是文本表示的核心問題。 一、離散表示 1、詞袋模型(Bag of Words) 詞袋模型就是將字符串看成一個裝滿詞的袋子,詞是在袋子裏隨機放着的。 假設語料庫爲:    

原创 線性迴歸

線性迴歸是一種有監督學習方法,本質上是學習到的一種映射關係。對於給定的,預測其輸出。 一、對線性迴歸的認識 1、假設房子的價格只和房子的面子有關,那麼:                                          

原创 Python3中的命名規範大全---基於PEP8標準

前言 Python 學習之旅,先來看看 Python 的代碼規範,讓自己先有個意識,而且在往後的學習中慢慢養成習慣 目錄 Python代碼規範 一、簡明概述 1、編碼 如無特殊情況, 文件一律使用 UTF-8 編碼

原创 Centos7上Redis安裝與配置以及使用方法

在這裏總結記錄一下redis的安裝與配置以及使用手冊: 一、redis安裝與配置 https://blog.csdn.net/a575553272/article/details/79743802 二、redis使用 http://red

原创 Centos上uwsgi+flask項目部署

最近需要提供服務給後臺,決定採用flask加載模型提供服務,網上查到的資料大多都是nginx+uwsgi+flask的方式,個人需求demo級別的,因此只用了uwsgi+flask。 一、安裝 pip install uwsgi  (好像

原创 分享記錄兩個英文自然語言處理的工具包

在這裏總結、記錄兩個英文自然語言處理的工具包,具體怎麼使用可以看文檔。 一、NLTK http://www.nltk.org/ 二、spaCy https://spacy.io/

原创 正則表達式

在自然語言處理任務中,會經常用到正則表達式,在數據預處理部分對數據清洗。提取到“乾淨”的數據用於後續的建模,平時都是用到正則表達式直接查詢,在這裏總結一下正則表達式的內容,方便記憶和查詢。 一、常見的正則表達式 常見的正則表達式大家可以自

原创 貝葉斯算法

樸素貝葉斯算法及其在文本分類中的應用 在這裏只要給出樸素貝葉斯算法原理,並給出其在文本分類中的應用,詳細代碼在我的github上,https://github.com/duguiming111/Text_Classification/

原创 邏輯迴歸算法及其在文本分類中的應用

總結一下工作學習中的算法,如有紕漏,請大家多多指教,一起探討共同進步! 這裏首先講解一下邏輯迴歸算法,並給出其在文本分類中的應用。 相關代碼見我的github,地址爲:https://github.com/duguiming111/Tex