原创 【Python+中文自然語言處理】(一) NLTK庫

一、nltk庫         nltk是一個python工具包, 用來處理與自然語言相關的東西. 包括分詞(tokenize), 詞性標註(POS), 文本分類等,是較爲好用的現成工具。但是目前該工具包的分詞模塊,只支持英文分詞,而不支

原创 Tensorflow入門筆記(一) Anaconda3如何切換Python3.5並安裝TensorFlow(包括安裝Spyder 與Jupyter notebook)

一、前言:       題主配置: Win10、Anaconda3 (對應Python 3.6.5) 二、Anaconda切換Python版本 【注】(Anaconda2跟3其實是一樣的操作) 1.創建Python的新版本環境 【注】進入

原创 解決Windows下access denied for user 'root'@'localhost'(using password:YES)的mysql啓動問題

C:\AppServ\MySQL> mysql -u root -p Enter password: ERROR 1045 (28000): Access denied for user 'root'@'localhost'

原创 大數據處理(一)如何處理數據集中的缺失值

目錄 引言 一、可選處理方法 二、Python中Pandas庫處理缺失值 1.查看數據缺失值得分佈情況 2.刪除包含缺失值的數據    2.1. 刪除包含缺失值的行或列     2.2. 根據條件刪除包含缺失值的數據 三、Python中其

原创 【Python+中文自然語言處理】(二) 中文分詞工具包:jieba

前言          目前中文分詞算法可分爲三大類:基於字符串匹配的分詞方法、基於理解的分詞方法和基於統計的分詞方法 。隨着大規模語料庫的建立,統計機器學習方法的研究和發展,基於統計的中文分詞方法漸漸成爲了主流方法,主要方法爲:給出大量

原创 【Python+中文自然語言處理】實踐篇 ——用戶評論文本分類:從中文csv處理到分類

本文耗費博主較長時間,如有不足之處,還望包容,代碼部分見下方鏈接。 一、中文CSV處理     1.Excel的中文表格文件,直接另存爲.csv文件     2.解決各種csv用各種代碼編輯器出現error的一勞永逸的方法:把.csv文件

原创 【機器學習+sklearn框架】(一) 線性模型之Linear Regression

前言 一、原理    1.算法含義    2.算法特點 二、實現   1.sklearn中的線性迴歸   2.用Python自己實現算法 三、思考(面試常問) 參考 前言        線性迴歸(Linear Regression)基本上

原创 解決anaconda安裝出現CondaHTTPError問題

Step 1  :在命令行中輸入並運行:(清華大學鏡像) conda config --add channels https://mirrors.ustc.edu.cn/anaconda/pkgs/free/ conda config

原创 Tensorflow學習(一) Anaconda3如何切換Python3.5並安裝TensorFlow(包括安裝Spyder 與Jupyter notebook)

一、前言:       題主配置: Win10、Anaconda3 (對應Python 3.6.5)      說明:由於Tensorflow在Windows上只支持64位Python3.5.x,故而安裝Python3.5版本於Anaco