原创 MCMC抽樣與LDA參數求解

一、 MCMC抽樣 也許讀者會覺得詫異,爲什麼在一本介紹主題模型的書中卻看到了抽樣的知識?作者是不是偏題了? 答案當然是沒有。 相信你應該聽說過有一門課程叫做統計學,在這門課程中,抽樣佔據着舉足輕重的地位。當統計學的研究者們想要了

原创 在jupeyter_notebook中編寫內容教程

1.將文件解壓放入C:\Users\renjiantao目錄下,按照自己電腦實際情況放入 2.Windows—所有程序—Anaconda2—Anaconda Prompt 3.在cmd黑窗口輸入:ipython noteboo

原创 windows10 安裝mysql 以及遇到的各種問題解決方案

安裝教程 我是按照這個教程來的,步驟很詳細: http://blog.csdn.net/anndy_/article/details/51093326 但是在這個過程中遇到了各種問題,問題及其解決方案如下: msvcr120.

原创 美團點評2018春招自然語言處理方向

寶寶參加了2018美團的線上筆試,現改編題目一道: 美團編程題目簡化版 小豬佩奇在探尋數字的奧祕,想要知道1到n的正整數排列起來一共有多少位數字。 例如:n爲11的時候,1234567891011,一共13位,則輸出13。n的

原创 神經網絡實現連續型變量的迴歸預測(python)

最近寫論文時用到一個方法,是基於神經網絡的最優組合預測,主要思想如下:在建立由迴歸模型、灰色預測模型、BP神經網絡預測模型組成的組合預測模型庫的基礎上,利用以上三種單一預測模型的組合構成BP神經網絡組合預測模型。(我是參考的參考這

原创 typora+pandoc:markdown文本轉換成word(也可把word轉換成markdown哦)

因爲想把自己寫的博客轉換成word,博客是markdown格式,公式什麼的又懶得在word裏面敲第二遍。於是就找了個方法讓.md文本與.doc文本轉換。反之也可把word轉換成markdown哦。教程附後。 markdown文本轉

原创 基於隱語義模型的推薦系統

如何根據上邊兩位豆瓣用戶的圖書列表做出推薦? 傳統的推薦方法 UserCF,首先需要找到和他們看了同樣書的其他用戶,然後給他們推薦那些用戶喜歡的其他書。 ItemCF,需要給他們推薦和他們已經看的書相似的書。 基於隱語義模型 通

原创 主題模型簡介視頻----白錦

主題模型簡介視頻 height="498" width="510" src="http://v.youku.com/v_show/id_XMzM2MjM5NDMwNA==.html">

原创 主成分分析的方差最大,解析主成份爲什麼可以(二)

PCA最大方差理論+幾何意義 轉載請註明:雲南省高校數據化運營管理工程研究中心博客http://write.blog.csdn.net/mdeditor#!postId=78932615 主成份爲什麼可以   經過主成分在壓縮數據

原创 語音識別中GMM-HMM的相關知識

  本文講闡述在語音識別中GMM-HMM的知識。其中包括了對GMM(Gauss Mixture Model)和HMM(Hidden Markov Model)的定義、原理及其算法的介紹。 GMM(高斯混合模型)   設有隨機變量X

原创 win10下MYSQL的下載、安裝以及配置超詳解教程~~小白入

下載MYSQL 官網下載MYSQL5.7.21版本,鏈接地址https://www.mysql.com/downloads/。下載流程圖如下: 進入官網點擊Community,下載社區版。 找到MYSQL Commu

原创 LDA前言知識

  在 2003 年(準確地說應該是 2002 年)D. M. Blei1 提出的 LDA(Latent Dirichlet Allocation2)模型(翻譯成中文就是——潛在狄利克雷分配模型),讓主題模型火了起來。   L

原创 百度AI 開放平臺API調用

近來要了解自然語言處理方面的技術,拿百度API做個實驗對,進行多次編碼嘗試最終成功調用。在本人博客百度API使用系列,使用python代碼實現。涉及內容如下:1.    (一)百度AI 開放平臺API調用之AccessToken獲取2. 

原创 LDA基礎知識系列 ----(1)共軛先驗分佈

  理解LDA,可以分爲下述5個步驟: 一個函數:gamma函數 四個分佈:二項分佈、多項分佈、beta分佈、Dirichlet分佈 一個概念和一個理念:共軛先驗和貝葉斯框架 兩個模型:pLSA、LDA 一個採樣:Gib

原创 LDA基礎知識系列 ---- (2)Dirichlet 分佈

  本節將從Beta分佈出發,水到渠成的講述Dirichlet 分佈和Dirichlet-Multinomial共軛,對稱Dirichlet 分佈的相關內容。   理解LDA,可以分爲下述5個步驟: 一個函數:gamma函數