原创 利用fillder進行app爬蟲

配置環境 按照這個裝好filddler。然後可以觀察你電腦和手機訪問的所有url的請求。 https://jingyan.baidu.com/article/3a2f7c2e0d5f2126aed61175.html?qq-pf

原创 Beta-Binomial共軛和Dirichlet-Multionmail共軛(LDA基礎知識視頻)

#Beta-Binomial共軛和Dirichlet-Multionmail共軛 視頻連接優酷:# http://v.youku.com/v_show/id_XMzI4NzI4MjkwOA==.htm height="498"

原创 正則學習

正則使用當中用到的一些筆記: 匹配base64url的代碼: a='/item/%E4%BA%92%E8%81%94%E7%BD%91' import re b=re.match("/item/(%[A-Za-z0-9]{2})+

原创 GMM-HMM在語音識別中的應用

1.語音識別系統的基本結構 2.涉及算法 3.GMM高斯混合模型 3.1高斯混合模型的基本概念   高斯混合模型是指具有如下形式的概率分佈模型: p(y⏐θ)=∑k=1kαkϕ(y⏐θk) 其中,αk 是係數,αk≥0 ,

原创 kk錄屏軟件破解版(無官方水印、高清)和Camtasia9.0錄屏軟件及漢化補丁下載

一、Camtasia9.0錄屏軟件及漢化補丁下載 鏈接:https://pan.baidu.com/s/1boEJB47 密碼:o6eb 二、kk錄屏軟件破解版(無官方水印、高清)下載 鏈接:https://pan.baidu.c

原创 Windows中以Anaconda搭建虛擬環境,安裝tensorflow(CPU版本)、keras教程

目錄 目錄 1.啓動命令提示符 2.建立TensorFlow的Anaconda虛擬環境 3.可能遇到的各種坑~~ 4.啓動jupyter notebook查看下載好的tensorFlow和Keras版本 本文演示環

原创 git和碼雲使用教程(Windows二方法)

  本Git和碼雲入門操作 一方面 簡潔明瞭,忽略對簡單的碼雲註冊的演示,只做文字引導;另一方面,重點突出,對git鏈接碼雲容易採坑的地方,詳細步驟。且本文有兩種Git軟件鏈接碼雲的方法,一種是窗口也代碼輸入;另一種是界面操作,各

原创 Python刪除指定行數據

Python小點點兒 按列條件篩選、刪除DataFrame的行 遇到清洗數據的問題,需要把某一列中爲指定元素的數據,整行去除 嘗試了drop卻不能到達理想的效果, isin效果理想。 import pandas as pd df = p

原创 Python 對數據one-hot編碼

目錄 離散特徵的編碼分爲2種情況: 連續變量的離散化處理 法1.標籤的處理: 法2.計算指標/啞變量one-hot編碼 結合pd.cut,處理連續變量 合併():要注意使用merge還是join 離散特徵的編碼分爲2種情況: 1.我們在進

原创 廣義線性模型(GLMs)及算法介紹

  一般我們瞭解的線性模型是針對連續性變量,並且服從正態分佈的,但是在實際應用上顯得非常的侷限。因爲我們我看到的數據很多都是離散的,而且不是服從正態分佈的。針對這種情況,對傳統線性模型進行推廣,行成了現在的廣義線性模型。廣義線性模型使得變

原创 XGBoost——機器學習(理論+圖解+python代碼)

目錄 前言 一、集成算法思想 二、XGBoost基本思想 三、MacOS安裝XGBoost 四、用python實現XGBoost算法 前言 在競賽題中經常會用到XGBoost算法,用這個算法通常會使我們模型的準確率有一個較大的提升。既然它

原创 Python2.7爬蟲——爬取微信公衆號文章

今天跟着這篇博客抓取微信公衆號文章練習了一下爬蟲,運行成功。想和大家分享一下過程中出現的問題和解決方法。 運行環境 windows 7 + Pycharm2018 + Python 2.7 目錄 目錄 1.安裝必要的Pyth

原创 python學習 文本特徵提取(三) CountVectorizer TfidfVectorizer 樸素貝葉斯分類性能測試

系列目錄 - python學習 文本特徵提取(一) DictVectorizer shuihupo python學習 文本特徵提取(二) CountVectorizer TfidfVectorizer 中文處理 python學習文本

原创 python學習 文本特徵提取(一) DictVectorizer

文章系列: python學習 文本特徵提取(一) DictVectorizer shuihupo python學習 文本特徵提取(二) CountVectorizer TfidfVectorizer 中文處理 python學習文本特徵提

原创 決策樹算法——機器學習(理論+圖解+python代碼)

目錄 前言 一、基本流程 二、劃分選擇 1、信息增益 2、增益率 3、基尼指數 三、剪枝處理 1、預剪枝  2、後剪枝 四、連續與缺失值 1、連續值處理 2、缺失值處理 五、多變量決策樹(*拓展) 前言 暑假打算吃透一本書叫《機器學習》,