原创 RNN 中學習長期依賴的三種機制

【轉自知乎:https://zhuanlan.zhihu.com/p/34490114】 目前大約有三類機制解決長期依賴的學習問題,分別是門機制、跨尺度連接和特殊初始化(及其維持)。 【門機制】 代表作 LSTM: Long Short

原创 關於基於檢索的聊天機器人實現(具參考價值)

目前網上能找到的關於基於檢索的聊天機器人開源代碼基本上都是chatbot-retrieval這個項目,其餘一些都是在基於這個版本的代碼,大家修修改改換了個名字而已,參考意義不大,並且連博客文章都是翻譯複製粘貼的。 實際上按照他們博客內容和

原创 BP(反向傳播)算法

最近在看深度學習的東西,一開始看的吳恩達的UFLDL教程,有中文版就直接看了,後來發現有些地方總是不是很明確,又去看英文版,然後又找了些資料看,才發現,中文版的譯者在翻譯的時候會對省略的公式推導過程進行補充,但是補充的又是錯的,難怪覺得有

原创 幾種常用的激活函數

1. 激活函數 如下圖,在神經元中,輸入的 inputs 通過加權,求和後,還被作用了一個函數,這個函數就是激活函數 Activation Function。 1.1 激活函數的作用: 如果不用激活函數,每一層輸出都是上層輸入的線性函數

原创 自然語言處理--基於規則(AIML)的問答機器人

基於規則(AIML)的問答機器人 一個完整的智能應答語音機器人可以大致分成幾個組成部分,以下爲一個簡單的流程,後續每個過程的細節可以拓展。 首先我們需要接受到用戶的語音; 通過第三方的接口將語音轉爲文本; 對文本分詞和糾錯; 基於規則(正

原创 Deep Learning in NLP (一)詞向量和語言模型

這篇博客是我看了半年的論文後,自己對 Deep Learning 在 NLP 領域中應用的理解和總結,在此分享。其中必然有侷限性,歡迎各種交流,隨便拍。   Deep Learning 算法已經在圖像和音頻領域取得了驚人的成果,但是在 N

原创 用Python連接HDFS

如果各位目前有用到大數據技術,相信很多的結果寫在hdfs是最方便也最快速的。 本篇博客就主要講一下怎麼利用python直接去連接HDFS文件系統,並對文件進行操作。 Python連接hbase需要一個三方庫(這裏python版本2.7)h

原创 GraphX社區發現----PageRank算法原理

本文將介紹PageRank算法的相關內容,具體如下:1.算法來源2.算法原理3.算法證明4.PR值計算方法4.1 冪迭代法4.2 特徵值法4.3 代數法5.算法實現5.1 基於迭代法的簡單實現5.2 MapReduce實現6.PageRa

原创 SQuirrel SQL Client數據庫連接工具的配置與使用

SQuirrel SQL Client介紹:SQuirrel SQL Client是一個用Java寫的數據庫客戶端,用JDBC統一數據庫訪問接口以後,可以通過一個統一的用戶界面來操作MySQL PostgreSQL MSSQL Oracl

原创 推薦系統----第一章(推薦系統基礎概念)

推薦系統評價指標2.1 覆蓋率覆蓋率描述了一個推薦系統對物品長尾的發掘能力,最簡單的覆蓋率的定義爲推薦系統能夠推薦出來的物品佔總物品集合的比列。假設系統用戶的集合爲U,推薦系統爲每個用戶推薦一個長度爲N的物品列表R(u)。那麼推薦系統的覆

原创 自然語言處理中的N-Gram模型詳解

N-Gram(有時也稱爲N元模型)是自然語言處理中一個非常重要的概念,通常在NLP中,人們基於一定的語料庫,可以利用N-Gram來預計或者評估一個句子是否合理。另外一方面,N-Gram的另外一個作用是用來評估兩個字符串之間的差異程度。這是

原创 層次聚類詳解(附代碼)

本篇博客主要介紹機器學習算法中的層次聚類,層次聚類不同於傳統的K-Means聚類算法,它在初始K值和初始聚類中心點的選擇問題上會存在優勢。  層次聚類 層次聚類就是一層一層的進行聚類,可以由下向上,或由上向下進行聚類。先計算樣本之間的距離

原创 詞向量模型(1)

詞向量模型 one-hot Vector one-hot vector 最簡單的編碼方式:假設我們的詞庫總共有n個詞,那我們開一個1*n的高維向量,而每個詞都會在某個索引index下取到1,其餘位置全部都取值爲0。 問題 這種詞向量編碼方

原创 詞向量學習總結

詞向量又稱詞嵌入,是自然語言處理過程中對“基本單位”詞的一種數學化表示,生成詞向量的方法有神經網絡,單詞共生矩陣的降維,語言概率模型等。 詞向量的表示 離散表示(one-hot representation) 傳統的基於規則或基於統計的自

原创 IntelliJ IDEA如何導入和運行Gradle項目

最近學習Gradle,本文來重點介紹一下,如何使用IntelliJ IDEA導入`Gradle項目的一種方法。選擇菜單欄的File->Open。在打開的窗口選擇對應Gradle項目的build.gradle文件,然後點擊OK。 在Open