博客配套視頻鏈接: https://space.bilibili.com/383551518?spm_id_from=333.1007.0.0 b 站直接看
配套 github 鏈接:https://github.com/nickchen121/shui-water--paper
配套博客鏈接:https://www.cnblogs.com/nickchen121/p/16470443.html
多頭默認 8 頭(改改參數性能就好了的)
我用 16 頭,然後性能好了,我能發篇論文嗎?
bs,32,64
一定不行
比如有人用 elmo 做了詞向量,然後我用 bert 做詞向量去做下游任務
如果你是第一個,大概率可以,(水一篇水刊水文)
然後就編故事:這個領域有了什麼問題,然後我用 bert 解決了這個問題(AI偏應用的領域,交叉學科)
千萬不能是:bert 好,我用 bert
我用自己的電腦跑,原模型性能變差了,我自己改進後,性能好,但是沒有原模型好
原模型: 50
我拿自己電腦跑(原模型):48(保留這個模型)
我做了個改進,我自己電腦跑我的代碼:49
毫無問題
性能好就可以了嗎?
最重要的是:你加去的東西,能夠編個故事
新興領域:50,你做的對這個領域有貢獻,別人能夠借鑑,或者說你能編個好故事
老領域:99%,99.2%
論文
最重要的一點,編故事
這個領域有什麼問題,我通過這個解決了
而不是我用了這個模塊, 性能變好了
搞代碼的時候:我用了這個模塊,性能變好了
一定要有繼承