原创 ELMO,GPT &BERT

ELMO word2vec無法解決一詞多義的問題,比如‘apple’這個詞在不同的上下文中語義是不同的: Jobs was the CEO of apple. He ate the apple. 而ELMO能夠對多義詞進行

原创 [CS224n] n gram & FastText

n gram N-Gram是一種基於統計語言模型的算法。它的基本思想是將文本里面的內容按照字節進行大小爲N的滑動窗口操作,形成了長度是N的字節片段序列。 每一個字節片段稱爲gram,對所有gram的出現頻度進行統計,並且按照事先設

原创 [CS224n] word2vector & glove

Glove 首先是兩種方法: 一個是基於奇異值分解(SVD)的LSA算法,該方法對term-document矩陣(矩陣的每個元素爲tf-idf)進行奇異值分解,從而得到term的向量表示和document的向量表示。此處使用的t

原创 [CS224n]Word Vectors

爲什麼用word vectors? 開始時使用one-hot編碼,其中一位爲1,其餘全爲0,向量長度和詞表等長。 motel = [0 0 0 0 0 0 0 0 0 0 1 0 0 0 0] hot

原创 [CS224n]第一講 NLP和深度學習入門

一 、什麼是自然語言處理(NLP)? 1.NLP是一門橫跨了計算機科學、人工智能以及語言學的學科,是人工智能的核心技術之一。目標是讓計算機處理和理解自然語言從而可以處理一些實際任務。 2.對語言層次的傳統描述: 重點放在句法分析(syn

原创 [轉載]Android Studio 安裝與配置

https://www.cnblogs.com/xiadewang/p/7820377.html

原创 跑模型的問題總結(一)

剛開始跑模型遇到了很多問題,感謝大神們的博客,自己對遇到的問題做個小總結~ 一、tmux的使用: 1.新開一個會話---tmux new -s session_name 2.會話裏啓動進程後,回到原本界面的方法----先按下ctrl+b,

原创 pandas set_index() 及reset_index()用法

原文鏈接:https://www.cnblogs.com/Allen-rg/p/9694979.html https://www.cnblogs.com/Allen-rg/p/9694979.h

原创 np.linalg.norm() 用法

原文鏈接:https://yq.aliyun.com/articles/597888 https://yq.aliyun.com/articles/597888

原创 python collections模塊詳解

原文鏈接:https://www.cnblogs.com/dahu-daqing/p/7040490.html https://www.cnblogs.com/dahu-daqing/p/704

原创 [CS224n]第二講 詞向量表示:word2vec

一、Distributional similarity(分佈相似性) 詞語的符號表示獨熱碼(如下圖)當詞彙量極大時,向量會變得非常長,同時,無法表示詞語內在的聯繫,體現不出詞語意義上的相似性。 分佈相似性指根據理解詞語所在的上下文來推理

原创 [CS224n]NLP和深度學習入門

一 、什麼是自然語言處理(NLP)? 1.NLP是一門橫跨了計算機科學、人工智能以及語言學的學科,是人工智能的核心技術之一。目標是讓計算機處理和理解自然語言從而可以處理一些實際任務。 2.對語言層次的傳統描述: 重點放在句法分析(syn

原创 Android 學習筆記(第一行代碼)

Incompatible types: Required:com.example.UIWidget.Fruit Found:java.lang.Object import Fruit類依然報錯,同一個包裏的類不需要import,加一個強

原创 KNN算法小結

參考資料: 李航《統計學習方法》 Peter Harrington《機器學習實戰》 yshujuan 博客:https://blog.csdn.net/yshujuan/article/details/72991212 一、KNN算法原理

原创 win10 下更改jupyter notebook 默認啓動目錄

轉自https://www.cnblogs.com/Xieyang-blog/p/8542210.html