台部落上杉翔二

何向南老師組的又兩大必讀論文，分別發在SIGIR19’和SIGIR20’。 Neural Graph Collaborative Filtering 協同過濾（collaborative filtering）的基本假設是相似的用

2020-06-27 08:00:31

Memory Networks 正如該方法名：memory，關於神經網絡的以及功能LSTM，GRU等方法能夠實現一部分記憶功能了，但大量的實驗和研究者們都證明了LSTM在更長時間內在處理數據的時間結構方面不夠有效，並不能達到記錄

2020-06-24 21:52:42

圖像中的Pretraning往往是在大規模圖像集上進行訓練後，再在特定的任務上進行fine-turning。而nlp領域的fine-turning就是word embedding了。而詞嵌入（例如word2vec，GloVe）通

2020-06-24 21:52:42

NLP(Natural Language Processing) NLP主要是關注計算機和人類(自然)語言之間的相互作用的領域。如果要想實現人機間自然語言通信意味着要使計算機既能理解自然語言文本的意義，也能以自然語言文本來表達給

2020-06-24 21:52:42

BERT以及BERT後時代在NLP各項任務上都是強勢刷榜，多模態領域也不遑多讓…僅在2019 年就有8+篇的跨模態預訓練的論文掛到了arxiv上…上圖是多篇跨模態論文中比較稍遲的VL-BERT論文中的比較圖，就按這個表格的分類（

2020-06-24 21:52:42

Attention出自NMT（神經網絡機器翻譯）以處理文本對齊問題，目前已經在各個領域發光發彩，玩出各種花樣帶出多少文章。而Attention的本質其實就是–加權重。通用的NMT的架構如上圖所示，其中會由兩個Deep LSTM

2020-06-24 21:52:42

CV領域圖像已經登天很難逐漸完善，視頻也開始蓬勃發展。由於早期限制於數據集和計算設備，多是從圖像的2D模型直接轉換成3D版本，如SIFT 3D，3D HOG，或者Dense Trajectory這種統治了很久的模型等，等到深度學

2020-06-24 21:52:42

Jeff Dean：我認爲，2020年在多任務學習和多模態學習方面會有很大進展，解決更多的問題。我覺得那會很有趣。多模態學習爲了使人工智能進一步加強對我們周邊事物的理解，它需要具備解釋多模態信號的能力。一般多模態需要處理的任

2020-06-24 21:52:42

405