原创 【學習筆記】BERT
BERT問答 BERT分爲哪兩種任務,各自的作用是什麼; 在計算MLM預訓練任務的損失函數的時候,參與計算的Tokens有哪些?是全部的15%的詞彙還是15%詞彙中真正被Mask的那些tokens? 在實現損失函數的時候,怎麼確保沒有被
原创 【算法】棧與隊列
1 棧與隊列理論基礎 隊列先進先出,棧先進後出;不允許有遍歷行爲,不提供迭代器 2 用棧實現隊列 題目:請你僅使用兩個棧實現先入先出隊列。隊列應當支持一般隊列支持的所有操作(push、pop、peek、empty): 實現 MyQueue
原创 【算法】哈希表
1 哈希表理論基礎 1.1 哈希表 哈希表是根據關鍵碼的值而直接進行訪問的數據結構。一般哈希表都是用來快速判斷一個元素是否出現集合裏。 1.2 哈希函數 哈希函數如下圖所示,通過hashCode把名字轉化爲數值,一般hashcode是通過
原创 【算法】算法性能分析
1 時間複雜度 1.1 知識點 時間複雜度是一個函數,它定性描述該算法的運行時間。 通常會估算算法的操作單元數量來代表程序消耗的時間。假設算法的問題規模爲n,那麼操作單元數量便用函數f(n)來表示,隨着數據規模n的增大,算法執行時間的增長率
原创 【算法】數組
1 數組理論基礎 數組是存放在連續內存空間上的相同類型數據的集合。 數組下標都是從0開始的 數組內存空間的地址是連續的 在刪除或者增添元素時,需要移動其他元素的地址: C++要注意vector 和 array的區別,vector的底層
原创 【學習筆記】Transformer (2)
Attention Is All You Need 摘要 針對序列轉錄模型,提出一個新的簡單網絡結構Transformer,基於純注意力機制構造的encoder-decoder,不用卷積和RNN,並行度更高訓練更快。 導言 當前(2017
原创 【學習筆記】Transformer (1)
在看Transformer之前,建議先學習一下Self-attention。 同樣,這邊筆記是參考李宏毅老師的課程和ppt,感興趣的可以去看原視頻~ 補充了Transformer論文精讀筆記,建議結合本文食用: ) Sequence-to-
原创 【學習筆記】Self-attention
最近想學點NLP的東西,開始看BERT,看了發現transformer知識丟光了,又來看self-attention;看完self-attention發現還得再去學學word embedding... 推薦學習順序是:word embedd
原创 算法單元重啓啦!
開始跟着代碼隨想錄重新學算法了,計劃是按照它的目錄一個專題一個專題地刷。 我的文章目錄會放在下面,按照自己的進度更新,整理出來一些有價值的基礎知識和題解代碼。使用語言是python,但知識點部分也會涉及C++。 歡迎閱讀點贊~ 目錄 數組
原创 向量化 Vectorization
在將數據的運算轉化爲向量化運算時,有種快捷方法: 根據想要得到的結果的維數,和當前數據矩陣/向量的維數來構建關係式。 比如結果是一個n*1的向量h,現在有的數據是一個m*n的矩陣X和一個m*1的向量theta,那麼很有可能: h = X'
原创 [轉]Windows visio2019破解激活
原帖戳這裏 最近學軟件工程,除了寫文檔還要畫很多圖就下了visio,但是不會激活啊~~搜了半天終於搜到一個簡單又靠譜的,親測有效! 下面是轉發的內容: 複製下面代碼:@echo offtitle Activate Microsoft V
原创 KMP模式匹配算法
看了好久纔看懂。。學校教材還有錯誤,看了別人的博客+別的學校的教材纔看懂。。 下面是孤~影的博客內容,最後還會放教材上的圖和自己寫的代碼實現。其實本來是想自己寫一篇博客的,奈何最近事情實在是太多了。。以後有時間複習到這邊的時候自己寫一篇吧~
原创 【藍橋杯2016_C++】t3:方格填數
如下的10個格子 填入0~9的數字。要求:連續的兩個數字不能相鄰。(左右、上下、對角都算相鄰) 一共有多少種可能的填數方案? 請填寫表示方案數目的整數。 法一 全排列+check,可以把這個格子當成一個存放0~9的一維數組再進行全排列,把每
原创 【藍橋杯2015_C++】t4:格子中輸出
這題考冷門知識點,提前科普: 下面這段來自C++ reference的printf(),*可作爲一個設置輸出寬度的佔位符: 翻譯了一下: (number) 要打印的最小字符數。如果要打印的值小於此數字,則結果將用空格填充。即使結
原创 【藍橋杯2015_C++】t3:奇妙的數字
題意:一個數字的平方和立方剛好把0~9的10個數字每個用且只用了一次,問這個數字是多少。 題目不難,看到的方法覺得挺巧妙的,用了set不會加入重複元素的特點,把數的平方和立方轉成字符串後拼接,按字符放進set中,若拼接後的字符串長度和set