原创 Maven的鏡像地址彙總

#阿里雲的鏡像 <mirror>         <id>alimaven</id>         <name>aliyun maven</name>         <url>http://maven.aliyun.com/nexu

原创 bp算法python實現(bpnn.py)

import math import random random.seed(0) def rand(a, b): return (b - a) * random.random() + a def make_matrix

原创 聊天機器人開發實戰

聊天機器人開發實戰[持續更新。。。] 由於最近在做智能客服,聊天機器人方面的工作,在工作工程中查閱了很多資料,也看了很多的paper,現在將整理的筆記和經驗整理成文,寫成一個聊天機器人開發實戰的系列博客。希望讀者們可以持續關注。

原创 NLP系列博客

最近在整理一些NLP相關的知識,所以計劃將一系列筆記整理成文,完成一個NLP和chatbot(人機對話)的系列博客。 主要內容包括機器學習算法推導,個人理解,代碼實現(以python爲主,少量java),論文筆記等內容。

原创 機器學習基礎之----感知機----

寫在前面的話 由於博主最近在某國企工作,業餘時間較多,於是蒙生寫博客的想法,一來是做讀書筆記,二來也希望可以和更多熱愛ML和DL的人一起交流學習。 本文將從四個方面介紹感知機的內容: 1,感知機總體介紹

原创 雙向GRU加字級別attention的模型論文筆記

雙向GRU加Dual Attention模型 論文名稱:”Attention-Based Bidirectional Long Short-Term Memory Networks for Relation Classificat

原创 最新整理停用詞表(中文)

停用詞表(中文) ! ” $ % & ’ ( ) * + , – . .. … …… ………………. ./ .一 .數 .日 / // 0 1 2 3 4 5 6 7 8 9 :// :: ;

原创 ACL 2016收錄paper集合

ACL 2016收錄paper集合 Long Papers A CALL system for learning preposition usage John Lee A Character-level Decoder wit

原创 知識抽取-1

用Bi-GRU和字向量做端到端的中文關係抽取 代碼在 https://github.com/crownpku/Information-Extraction-Chinese/tree/master/RE_BGRU_2ATT 實體識別

原创 Python : open函數

open/文件操作 f = open(‘/tmp/hello’, ‘w’) // open(路徑+文件名,讀寫模式) 讀寫模式:r只讀, r+讀寫, w新建(會覆蓋原有文件),a追加,b二進制文件。 讀寫模式的類型有: rU

原创 知識抽取之關係抽取[2]

《End-to-End Relation Extraction using LSTMs on Sequences and Tree Structures》閱讀筆記 來源:ACL2016 解決問題:使用LSTM基於序列結構,結合實體

原创 支持向量機通俗導論(理解SVM的三層境界)

前言     動筆寫這個支持向量機(support vector machine)是費了不少勁和困難的,原因很簡單,一者這個東西本身就並不好懂,要深入學習和研究下去需花費不少時間和精力,二者這個東西也不好講清楚,儘管網上已經有朋友寫得不錯

原创 (EM算法)The EM Algorithm

EM是我一直想深入學習的算法之一,第一次聽說是在NLP課中的HMM那一節,爲了解決HMM的參數估計問題,使用了EM算法。在之後的MT中的詞對齊中也用

原创 深度解密天貓精靈對話系統

深度解密天貓精靈對話系統 一、序 天貓精靈音箱是阿里巴巴人工智能實驗室出品的智能音箱,在推出不久就迅速佔領國內市場,將人工智能以開口即得的方式帶入千家萬戶。對話智能是天貓精靈智能的重要體現,它一部分來自於強大的算法,一部分來自於

原创 spark性能優化-數據傾斜調優

調優概述 有的時候,我們可能會遇到大數據計算中一個最棘手的問題——數據傾斜,此時Spark作業的性能會比期望差很多。數據傾斜調優,就是使用各種技術方案解決不同類型的數據傾斜問題,以保證Spark作業的性能。 數據傾斜發生時的現象