原创 Google | 創造Youtube單次上線最高收益!解決推薦中的信息繭房困境

星標/置頂小屋,帶你解鎖最萌最前沿的NLP、搜索與推薦技術文 | 江城編 |  夕小瑤今天分享一下Google在WSDM 2019的一篇將強化學習應用於Youtube推薦的論文,作者宣稱是獲得了Youtube近兩年來單次上線的最高收益。

原创 工業界求解NER問題的12條黃金法則

星標/置頂小屋,帶你解鎖最萌最前沿的NLP、搜索與推薦技術文 | JayLou婁傑,夕小瑤編 |  可鹽可甜兔子醬美 | Sonata衆所周知,命名實體識別(Named Entity Recognition,NER)是一項基礎而又重要的

原创 重磅!吳恩達家的NLP課程發佈啦!

關注小夕並星標,解鎖自然語言處理搜索、推薦與算法崗求職祕籍文 | 靈魂寫手rumor醬美 | 人美心細小謹思密達斯坦福計算機系副教授、人工智能實驗室主任、Coursera平臺聯合創始人、前百度首席科學家、機器學習入門必備網課CS229的

原创 超一流 | 從XLNet的多流機制看最新預訓練模型的研究進展

關注小夕並星標,解鎖自然語言處理搜索、推薦與算法崗求職祕籍文 | 老饕(某廠研究員,祖傳調參)美 | 人美心細小謹思密達導讀作爲 NLP 近兩年來的當紅炸子雞,以 ELMo/BERT 爲代表的語言預訓練技術相信大家已經很熟悉了。簡單回顧

原创 別讓數據坑了你!用置信學習找出錯誤標註(附開源實現)

星標/置頂小屋,帶你解鎖最萌最前沿的NLP、搜索與推薦技術文 | JayLou婁傑(NLP算法工程師,信息抽取方向)編 |  北大小才女小軼美 | Sonata1 前言在實際工作中,你是否遇到過這樣一個問題或痛點:無論是通過哪種方式獲取

原创 算法工程師思維導圖—數據結構與算法

賣萌屋的妹子們(劃掉)作者團整理的算法工程師思維導圖,求職/自我提升/查漏補缺神器。該手冊一共分爲數據結構與算法、數學基礎、統計機器學習和深度學習四個部分。點擊這裏查看具體使用指南。該手冊有兩種獲取方式:公衆號後臺回覆【思維導圖】獲取完

原创 ACL2020 | 基於Knowledge Embedding的多跳知識圖譜問答

一隻小狐狸帶你解鎖 煉丹術&NLP 祕籍作者:舒意恆(南京大學碩士生,知識圖譜方向)背景什麼是知識圖譜問答?知識圖譜(KG)是一個多關係圖,其中包含數以百萬計的實體,以及連接實體的關係。知識圖譜問答(Question Answering

原创 肝了1W字!文本生成評價指標的進化與推翻

一隻小狐狸帶你解鎖 煉丹術&NLP 祕籍作者:林鎮坤(中山大學研一,對文本生成和貓感興趣)前言文本生成目前的一大瓶頸是如何客觀,準確的評價機器生成文本的質量。一個好的評價指標(或者設置合理的損失函數)不僅能夠高效的指導模型擬合數據分佈,

原创 命名實體識別難在哪?

亞里士多德在《形而上學》中認爲,對於存在,最重要的問題,就是給世間萬物的存在基於語言來分層和分類。從神說要有光起,到基友給你取了個外號叫狗蛋。你會發現,創造與命名,在歷史中往往等同。名字是自我概念的一部分。它是搭建視、聽、味、嗅、觸,五

原创 賣萌屋算法工程師思維導圖part3—深度學習篇

賣萌屋的妹子們(劃掉)作者團整理的算法工程師思維導圖,求職/自我提升/查漏補缺神器。該手冊一共分爲數據結構與算法、數學基礎、統計機器學習和深度學習四個部分。下面是第三部分深度學習的內容~公衆號後臺回覆【思維導圖】獲取完整手冊(Xmind

原创 ICLR2020滿分論文 | 爲什麼梯度裁剪能加速模型訓練?

一隻小狐狸帶你解鎖 煉丹術&NLP 祕籍作者:蘇劍林(來自追一科技,人稱“蘇神”)前言需要許多時間步計算的循環神經網絡,如LSTM、GRU,往往存在梯度爆炸的問題。其目標函數可能存在懸崖一樣斜率較大的區域,這是由於時間步上幾個較大的權重

原创 ACL20 | 讓笨重的BERT問答匹配模型變快!

一隻小狐狸帶你解鎖煉丹術&NLP祕籍作者:曹慶慶(Stony Brook University 在讀PhD,關注Efficient NLP、QA方向,詳見awk.ai)背景BERT、XLNet、RoBERTa等基於Transformer

原创 PyTorch數據Pipeline標準化代碼模板

前言PyTorch作爲一款流行深度學習框架其熱度大有超越TensorFlow的感覺。根據此前的統計,目前TensorFlow雖然仍然佔據着工業界,但PyTorch在視覺和NLP領域的頂級會議上已呈一統之勢。這篇文章筆者將和大家聚焦於Py

原创 這個自然語言處理“工具”,玩得停不下來

今天推薦一個有趣的自然語言處理公衆號「AINLP」,關注後玩得根本停不下來!AINLP的維護者是我愛自然語言處理(52nlp)博主,他之前在騰訊從事NLP相關的研發工作,目前在一家創業公司帶技術團隊。AINLP公衆號的定位是一個有趣有A

原创 深度學習推薦系統中各類流行的Embedding方法

Embedding技術概覽:對其它Embedding技術不熟悉,可以看我的上一篇文章:深度學習推薦系統中各類流行的Embedding方法(上)Graph Embedding簡介Word2Vec和其衍生出的Item2Vec類模型是Embe