原创 LTM(Lifelong Topic Modeling)介紹

LTM(Lifelong Topic Modeling)介紹 論文題目是《Topic Modeling using Topics from Many Domains, Lifelong Learning and Big Data》

原创 分別使用sk-learn和mllib進行文本情感分類

總體思路 文本預處理 提取特徵 特徵選擇 選擇分類算法 訓練和評估 預處理 包括分句、分詞和詞幹化,使用nltk可以實現。 實現分兩個版本:1. scikit-learn版本 2. MLLIB版本 主要是因爲運行效率的問題,

原创 LML(Lifelong Machine Learning)介紹

最近做評論分析碰到一些瓶頸,閱讀了衆多論文,還是覺得劉兵老師靠譜,實用派的翹楚。於是瞭解了他近年來發的論文,發現了一個很新穎的詞”lifelong”,而且還在KDD 2016做tutorial,題爲《Lifelong Machin

原创 Redis安裝和遠程訪問

Redis安裝和遠程訪問 安裝 下載地址: redis下載地址 下面是官方的編譯安裝方法: $ wget http://download.redis.io/releases/redis-3.2.5.tar.gz $ tar xz

原创 卷積神經網絡反向傳播推導

以TensorFlow的卷積神經網絡爲例 卷積-池-卷積-池-全連接-softmax 前向傳導 C1層:卷積神經網絡的輸入是28×28的矩陣A ,經過F1 個5×5的卷積核K1i(i=1,2,...,F1) 的卷積生成F1 個24×2

原创 RBM(Restricted Bolzmann Machines)原理

玻爾茲曼機是一種隨機網絡,它基於能量模型進行建模。 能量模型 我們一般認爲物體的能量越高越不穩定,能量越低越趨於穩定。比如說,斜坡上的一個箱子,它位於越高的位置,則擁有更高的重力勢能。能量模型把箱子停在哪個位置定義爲一種狀態,每個狀態對應

原创 神經網絡推導

首先介紹一個學習DL4NLP的一個網站WildML,英文的,有空我也整理一下中文版。 這篇講的是神經網絡的基礎,沒有RNN、CNN等結構。廢話少說,直接上要推導的一個簡單的神經網絡結構圖。 例子:三層神經網絡 這個神經網絡包含一個輸入層

原创 TensorFlow的卷積神經網絡例子解析

TensorFlow教程地址:https://www.tensorflow.org/tutorials/mnist/pros/ 講的是經典的機器學習問題MNIST。 使用卷積神經網絡進行訓練。 載入MNIST數據 MNIST數據可以從

原创 使用JSONRPC 2.0規範解決多語言RPC交互的方案

動機 最近做的一個項目比較大,分了許多模塊,但是由於不同的開源技術使用的語言不同,不同模塊使用的語言可能不同,但基本上是使用Java和Python實現的。當各模塊需要進行交互的時候,問題就出現了,模塊不能像Jar包或者Python模塊那樣

原创 一個監控iPhone7p港行預約貨存的腳本

一個監控iPhone7p港行預約貨存的腳本 github地址:Apple_Monitor 主要技術 Python urllib2、json庫 Server醬的微信提醒功能 流程 使用chrome瀏覽器的開發者工具監控iphone預約

原创 使用Flask快速搭建前端

使用Flask快速搭建前端 Flask介紹 Flask是一個使用 Python 編寫的輕量級 Web 應用框架。其 WSGI 工具箱採用 Werkzeug ,模板引擎則使用 Jinja2。 Flask也被成爲『微框架』。因爲它使用簡單的

原创 循環神經網絡(一般RNN)推導

本文章的例子來自於WILDML vanillaRNN是相比於LSTMs和GRUs簡單的循環神經網絡,可以說是最簡單的RNN。 RNN結構 RNN的一個特點是所有的隱層共享參數(U,V,W) ,整個網絡只用這一套參數。 RNN前向傳導 s

原创 中心極限定理的一個例子:大小醫院的新生兒

一個問題 在複習概率論與數理統計的時候,發現一個有趣的例子: 兩家醫院,大醫院每天新生兒45個,小醫院新生兒15個,問一年內哪家醫院男新生兒比例超過60%的天數多的可能性大? 乍眼一看,直覺告訴我新生兒的自然男女比例應該固定在50%左右

原创 在我的Macbook Pro上安裝能使用GPU加速的Theano

在我的Macbook Pro上安裝能使用GPU加速的Theano 目的 最近深度學習的應用非常火爆,有意向要在NLP上應用深度學習的我要對各種開源的深度學習庫進行探索,目前比較流行的Python語言的深度學習庫有Theano、Google

原创 通過word embedding和關聯規則改進Aspect提取效果

思路來源於論文《Improving Opinion Aspect Extraction Using Semantic Similarity and Aspect Association》(Liu, Zhang et al.,2016)