03 导师不敢和你说的水论文隐藏技巧,模型复现后,性能低了怎么办?

博客配套视频链接: https://www.bilibili.com/video/BV1CP411G7VX/?spm_id_from=333.788 b 站直接看

0:10

这只是其中一种解释:

对于 AI 模型,用不同的显卡跑,结果很大可能不一样

求偏导的结果一定是不准确的,有有限循环小数

然后由于每个显卡精度不一样

导致反向传播和梯度下降的精度不一样

一个不一样,微乎其微,但是 1000 多万个参数,都有一点区别,一点点小小的变化会导致最后发生一个很大的变化

我和他的显卡一样,但是性能还是和原作者不一样:

第二个解释(可能造假了):

卖论文,卖论文的人大都掌握了写论文的精髓(花里胡哨即可)

有能力的人基本不会做这种事

这个时候你需要叫他给你一份他保存的模型文件,然后用相同的代码(一模一样)跑

或者作者上传的代码最后进行了一种微调。

因为我有一行代码(看起来不重要的代码),没有注释

这也是一种解释

一个模型没有设定随机数种子,导致模型参数初始化的时候,每次结果不一致()

解决方案

用复现的结果,一定要记住,保存证据,保存你跑出来的模型文件,然后写论文的时候记住,标明一下

你还可以做一件什么事情呢?????

原论文91

复现后 89(它的模型,他论文标明的参数,最好是相同的显卡)

那你只要达到 90 就行了。这个 90 不需要你和他的参数一致,

调参

它的 bs32,你的可以是 16,它的 lr 是 0.05,你的可以是,0.005

调到最优值后,你是 90

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章