原创 大廠對話系統實踐文章鏈接

阿里: 大中臺、小前臺,阿里小蜜這樣突破對話機器人發展瓶頸 https://www.infoq.cn/article/8cN5eZ6Bgg*CWM5z5jYr 機器如何猜你所想?阿里小蜜預測平臺揭祕 https://mp.weixin.

原创 rasa的component,policy,action的自定義開發

rasa是我去年的時候學習使用的,但是後面沒怎麼用了。如今已經過去一年了,rasa代碼的變化已經很大了,比如原來使用flask作爲網絡框架,現在已經換成性能更高的sanic了(https://www.jianshu.com/p/63683

原创 生成式對話seq2seq:從rnn到transformer

一、前言 最近因爲做對話機器人的原因,看了一下seq2seq。不禁感慨,自由對話機器人的水好深呀。 查閱了一些市面上能看到資料,工業上的做法,普遍是 基礎模板(例如 aiml)+IR閒聊庫(例如 小黃雞語料QA)+爬蟲(百度、搜狗)+知識

原创 NLP中一些簡單的數據增強技術

ICLR 2019 workshop 論文《EDA: Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks》介紹了幾

原创 NLP預訓練模型:從transformer到albert

轉載自:《NLP預訓練模型:從transformer到albert》(https://zhuanlan.zhihu.com/p/85221503) 背景 語言模型是機器理解人類語言的途徑,17年的transformer是語言模型擺脫rnn

原创 智能客服FAQ知識點挖掘一般方法

一般來說,智能客服有3個功能實現:QABot,TaskBot,ChatBot。其中QAbot中包括FAQ,KBQA。 這裏我來談一下FAQ中知識點的一般方法吧。 一般來說,最開始產品經理會結合業務知識和經驗,人工的總結出一些常見的標準問題

原创 信息檢索(IR)常用評價指標計算方式(AUC,MAP,NDCG,MRR,Precision、Recall、F-score)

1.AUC(Area Under Curve) ROC曲線下方的面積大小,由於ROC曲線一般都處於y=x這條直線的上方,所以AUC的取值範圍在0.5和1之間。使用AUC值作爲評價標準是因爲很多時候ROC曲線並不能清晰的說明哪個分類器的效果

原创 nlp年度論文總結

這個縮寫,代表“通用語言模型的微調”,出自ACL 2018論文:Universal Language Model Fine-tuning for Text Classification。 詳細的說明可以讀他們的論文: https://ar

原创 NLP學習筆記

計算相似度的方法   度量文本相似度包括如下三種方法: 一是基於關鍵詞匹配的傳統方法,如N-gram相似度; 二是將文本映射到向量空間,再利用餘弦相似度等方法; 三是深度學習的方法,如基於用戶點擊數據的深度學習語義匹配模型DSSM,基於卷

原创 rasa安裝和測試

rasa core:對話管理 rasa nlu :語義理解,意圖識別和實體識別   git源地址參考:https://github.com/tedljw/rasa_test_ch   1. 安裝相關組件包 pip install ras

原创 智能客服FAQ問答任務的技術選型探討

引子 在智能客服的業務場景中,對於用戶頻繁會問到的業務知識類問題的自動解答(以下簡稱爲FAQ)是一個非常關鍵的需求,可以說是智能客服最爲核心的用戶場景,可以最爲顯著地降低人工客服的數量與成本。 比如10086的在線智能客服,用戶提問“如何

原创 智能問答中Answer seletcion的一些總結

傳統做法: 1.直接根據關鍵詞檢索或 BM25 等算法計算相關性排序 缺點: 需要維護大量的同義詞典庫和匹配規則   機器學習做法: 1.潛在語義分析技術(Latent Semantic Analysis,LSA):將詞句映射到低維連續空

原创 CRF與LSTM在序列標註問題上的不同

標註跟分類最大的區別就是:標註採的特徵裏面有上下文分類結果,這個結果你是不知道的,他在“分類”的時候是跟上下文一起"分類的"。因爲你要確定這個詞的分類得先知道上一個詞的分類,所以這個得整句話的所有詞一起解,沒法一個詞一個詞解。 而分類是根

原创 centos7安裝NVIDIA driver,cuda,cudnn,anaconda

系統版本 系統版本​​​ 可能需要: yum install kernel-devel yum install kernel-headers yum install gcc yum install gcc-c++   一、安裝英偉達顯卡

原创 C++ 用libcurl庫進行http通訊網絡編程

文章出處:http://www.cnblogs.com/moodlxs/archive/2012/10/15/2724318.html 一、LibCurl基本編程框架libcurl是一個跨平臺的網絡協議庫,支持http, htt