原创 NumPy 學習一

一、NumPy數組對象 NumPy中的多維數組稱爲ndarray,其主要有兩個部分組成 1.數據本身 2.描述數據的元數據 在數組的處理過程中,原始信息不受影響,變化只是元數據而已 np.arange()函數可以產生數組,主要用來存放一組

原创 Ubuntu18.04更換國內源

Ubuntu18.04更換國內源 轉:https://blog.csdn.net/Dolphinsz/article/details/81217424 Ubuntu本身的源使用的是國內的源,下載速度比較慢,不像CentOS一樣yum安裝的

原创 【思考】tf/idf之於文本分類

轉自:https://blog.csdn.net/xceman1997/article/details/8029888因爲工作中需要用到計算詞語權重,進而作詞與選擇,思考了一下tf/idf。首先還是簡單介紹一下tf/idf。這個概念最開始

原创 python3爬蟲實戰一: 爬取豆瓣最新上映電影及畫出詞雲分佈

參考:http://python.jobbole.com/88325/任務:1. 豆瓣電影主頁抓取最新上映的全部電影id號與電影名2. 進入每部電影具體詳情頁面提取首頁熱門短評3. 對每部電影短評進行詞雲分佈畫圖    python 版本

原创 統計學習方法之_kd_tree算法理解

k-d樹(k-dimensional樹的簡稱),是一種分割k維數據空間的數據結構。主要應用於多維空間關鍵數據的搜索(如:範圍搜索和最近鄰搜索)。 應用背景   SIFT算法中做特徵點匹配的時候就會利用到k-d樹。而特徵點匹配實際上就是一個

原创 統計學習方法_2感知機_學習筆記_python實現

一、感知機模型 感知機由輸入到輸出(+1,-1)空間的模型爲:                                                                               其中w、b均爲感知

原创 jupyter notebook 快捷鍵

轉自:https://blog.csdn.net/ydmichelle/article/details/78069280         :https://blog.csdn.net/qq_35423500/article/details

原创 Anaconda裏的jupyter notebook如何修改默認打開目錄與及默認打開瀏覽器

  問題:當我們安裝默認條件下安裝好Anaconda,當launch裏面的 jupyter notebook 時候,會默認一個瀏覽器打開一個網頁:如我的是 http://localhost:8981/tree,裏面的內容類似文件夾內容,其

原创 python3爬蟲實戰二:股票信息抓取及存儲

參考:http://python.jobbole.com/88350/?utm_source=blog.jobbole.com&utm_medium=relatedPosts#article-comment任務:1. 從東方財富網獲取所有

原创 SVM----支持向量機算法理解【轉】

【轉自]:  https://blog.csdn.net/alwaystry/article/details/60957096 前言     動筆寫這個支持向量機(support vector machine)是費了不少勁和困難的,原因很

原创 正則表達式之匹配中文字符串:[/u4e00-/u9fa5]

轉載之:https://blog.csdn.net/ye1992/article/details/25286539這裏是幾個主要非英文語系字符範圍(google上找到的):2E80~33FFh:中日韓符號區。收容康熙字典部首、中日韓輔助部