原创 【問題解決】前端學習踩坑記錄

  最近在學做前端,小白一枚,做個踩坑記錄 20191021 更新: 此網站似乎使用 scroll-linked 定位效果。這可能無法與異步平移一起使用; <script> $(function(){ $(window).

原创 【學習筆記】1707.07435基於深度學習的推薦系統:調查與新視角(中文提綱)

最近在看論文,看到一篇關於推薦系統方面不錯的一篇入門綜述,CSDN博客上也有幾個人做了譯文,大都只翻譯了很少的一部分。筆者雖然沒有進行翻譯,但是在閱讀的過程中對全文做了提綱以及進行要點記錄,各位朋友覺得可以也可以參考一二,但是就一些好論文

原创 【日常】手寫卷積神經網絡(conv+relu+maxpooling+linear+relu+linear+softmax+交叉熵損失+正則)

第二次課程作業,手寫CNN進行手寫數字識別。據說還要手寫一次RNN(這酸爽還有誰)。 作業坑點在於Assignment給定的這個架構與默認參數效果非常差,結果怎麼調都調不好,一開始一直是以爲寫錯了,但是檢查了很久都發現不了哪裏寫錯了。後來

原创 【日常】手寫三層反向傳播神經網絡(損失函數交叉熵+正則項+反向求導)

課程的一次作業,雖然沒什麼用,但是手寫一遍dense確實能加深對神經網絡的理解,尤其是反向傳播求導這一塊。 資源已經上傳,不過最近CSDN犯病不能改資源積分了。留個BDY鏈接了? #-*- coding:UTF-8 -*- import

原创 【項目小結】某B視頻網站的爬蟲實踐

最近忽來興致,準備做評論數據的NLP項目。選定了某B視頻網站的評論數據,順帶準備把某B視頻網站的數據爬蟲也一起做了。關於登錄驗證的問題可以看我的博客https://blog.csdn.net/CY19980216/article/deta

原创 【問題解決】BERT模型使用及一個問題:NotFoundError: Key bert_1/embeddings/LayerNorm/beta not found in checkpoint

關於BERT模型的調用,這幾天基本上是摸得比較清楚了。 模型源碼在https://github.com/google-research/bert,截至本文發佈,該項目的Readme.md文件中提供瞭如下圖所示的9個模型的下載鏈接。前兩個是

原创 【論文閱讀】W19-4423——預訓練與遷移學習在GEC的應用

本文依然在CONLL2014的最新進展網站上可以下載獲得https://nlpprogress.com/english/grammatical_error_correction.html 與以前的方法有所創新的地方在於,本文着重使用了預訓

原创 【問題解決】Selenium——NoSuchWindowException: Browsing context has been discarded

昨天上服務器檢查了一下小程序後端運行是否良好,發現與selenium有關的模塊的進程全掛了。驚慌失措之下重試了爬蟲模塊的代碼,發現本機上正常運行的代碼,在ubuntu上運行時出現報錯: NoSuchWindowException: Br

原创 【日常】寫給媽媽的微信機器人(用於知網論文下載)

最近媽媽工作需求突然要寫論文,我長這麼大第一次聽說就她還能寫論文。可惜我不是學醫的,這方面跨得太大基本上無能爲力,最多給她潤色一下。她那邊下論文又不方便,我當天連夜趕了一份微信機器人出來,供她下載論文。 實現邏輯非常簡單,微信端用itch

原创 【坑】python新建二維列表的一個小坑

今天覆寫PIE架構的代碼,寫完覺得沒什麼問題,結果怎麼跑也跑不通。本來決定跑通就回寢睡覺,一路弄到十二點多,終於地毯式的debug終於找到了問題所在。反正現在精神狀態良好,順便水一篇博客。 我們常常遇到需要初始化一個空的二維列表來存儲矩陣

原创 【日常】python站長素材網免費模板下載(以PPT模板爲例)

近期疲於論文和別人給我挖的坑,可能很長一段時間不會更新博客了。 之前在尋找模板時發現了挺好的網站http://sc.chinaz.com/,上面有PPT,CSS,Bootstrap等許多種類的模板,並且有很多是可以免費獲取。雖然免費的模板

原创 【項目小結】python讀取arpa數據文件(arpa庫使用)

arpa庫是用於讀取arpa數據文件的python包,由於涉及領域很小,截至本文發佈,筆者尚未搜索到有關詳盡的教程,因此初次接觸arpa數據文件後,沒有意識到數據格式問題,單純通過統計分析得到了一些規律特徵,希望能轉爲常見的csv格式數據

原创 【項目小結】GEC模型中的難點:分詞(Tokenizer)與回譯(Backtranslation)

前排提示本文涉及的數據集及外部文件在以下鏈接共享。包括 Lang-8 語料庫,詞形轉換表(涉及79024組變換)與一些有用的pickle文件。 鏈接:https://pan.baidu.com/s/1fW266ZSLoZeEaRCl2y

原创 【日常】PySpark坑位盤點之 —— 令人窒息的 “循環連接BUG”,“正則替換BUG” 與 “DataFrame拼接BUG”

序言 —— 有的事情不去嘗試,就永遠無法探知自我能力的極限將能觸碰到何處。 —— 有的事情不去嘗試,也永遠無法知悉“糟粕污穢”究竟能噁心到什麼境地。 —— 顯然PySpark不能是前者【Facepalm】 自從勁松加入了小米項目的團隊後,

原创 【Share & Backup】FreeCrawl

分享個一份臨時寫的代碼,感興趣的朋友可以自取,出於一些原因不多作解釋,權當自娛。近期限於各種原因的制約暫時擱置,以後有條件再繼續完善這個項目。 代碼文件結構如下所示👇 ../ > FC_crawl.py > FC_hparams