原创 ELMO,GPT &BERT
ELMO word2vec無法解決一詞多義的問題,比如‘apple’這個詞在不同的上下文中語義是不同的: Jobs was the CEO of apple. He ate the apple. 而ELMO能夠對多義詞進行
原创 [CS224n] n gram & FastText
n gram N-Gram是一種基於統計語言模型的算法。它的基本思想是將文本里面的內容按照字節進行大小爲N的滑動窗口操作,形成了長度是N的字節片段序列。 每一個字節片段稱爲gram,對所有gram的出現頻度進行統計,並且按照事先設
原创 [CS224n] word2vector & glove
Glove 首先是兩種方法: 一個是基於奇異值分解(SVD)的LSA算法,該方法對term-document矩陣(矩陣的每個元素爲tf-idf)進行奇異值分解,從而得到term的向量表示和document的向量表示。此處使用的t
原创 [CS224n]Word Vectors
爲什麼用word vectors? 開始時使用one-hot編碼,其中一位爲1,其餘全爲0,向量長度和詞表等長。 motel = [0 0 0 0 0 0 0 0 0 0 1 0 0 0 0] hot
原创 [CS224n]第一講 NLP和深度學習入門
一 、什麼是自然語言處理(NLP)? 1.NLP是一門橫跨了計算機科學、人工智能以及語言學的學科,是人工智能的核心技術之一。目標是讓計算機處理和理解自然語言從而可以處理一些實際任務。 2.對語言層次的傳統描述: 重點放在句法分析(syn
原创 [轉載]Android Studio 安裝與配置
https://www.cnblogs.com/xiadewang/p/7820377.html
原创 跑模型的問題總結(一)
剛開始跑模型遇到了很多問題,感謝大神們的博客,自己對遇到的問題做個小總結~ 一、tmux的使用: 1.新開一個會話---tmux new -s session_name 2.會話裏啓動進程後,回到原本界面的方法----先按下ctrl+b,
原创 pandas set_index() 及reset_index()用法
原文鏈接:https://www.cnblogs.com/Allen-rg/p/9694979.html https://www.cnblogs.com/Allen-rg/p/9694979.h
原创 np.linalg.norm() 用法
原文鏈接:https://yq.aliyun.com/articles/597888 https://yq.aliyun.com/articles/597888
原创 python collections模塊詳解
原文鏈接:https://www.cnblogs.com/dahu-daqing/p/7040490.html https://www.cnblogs.com/dahu-daqing/p/704
原创 [CS224n]第二講 詞向量表示:word2vec
一、Distributional similarity(分佈相似性) 詞語的符號表示獨熱碼(如下圖)當詞彙量極大時,向量會變得非常長,同時,無法表示詞語內在的聯繫,體現不出詞語意義上的相似性。 分佈相似性指根據理解詞語所在的上下文來推理
原创 [CS224n]NLP和深度學習入門
一 、什麼是自然語言處理(NLP)? 1.NLP是一門橫跨了計算機科學、人工智能以及語言學的學科,是人工智能的核心技術之一。目標是讓計算機處理和理解自然語言從而可以處理一些實際任務。 2.對語言層次的傳統描述: 重點放在句法分析(syn
原创 Android 學習筆記(第一行代碼)
Incompatible types: Required:com.example.UIWidget.Fruit Found:java.lang.Object import Fruit類依然報錯,同一個包裏的類不需要import,加一個強
原创 KNN算法小結
參考資料: 李航《統計學習方法》 Peter Harrington《機器學習實戰》 yshujuan 博客:https://blog.csdn.net/yshujuan/article/details/72991212 一、KNN算法原理
原创 win10 下更改jupyter notebook 默認啓動目錄
轉自https://www.cnblogs.com/Xieyang-blog/p/8542210.html