摸魚一年半,我終於摸出了一篇頂會論文

就在今天中午,在我失眠了兩個晚上之後,ACL 2020 終於發送了錄取通知郵件。慶幸的是,我這篇水文竟然也中了。

v2-7c796fbee4d23c0949f20dd57531bda9_b.jpg
第一篇論文中啦,過程很驚險刺激

其實這篇能中我是根本沒想到的,在經歷了一年多的摸魚失敗之後,在去年最後一個季度我才拍腦袋想了這個詭異的 idea 。然後搞了一兩個月交了論文,苦苦等到二月份,沒想到 review 評分還可以(4、3.5、2.5)。不過說實話,我感覺 4 分的那個沒有 2.5 分的那個看的透徹。最後和老闆一頓 rebuttal ,就只能求佛指望 2.5 分的那個提一提分了。最後感謝 2.5 分的評審仔細閱讀了我的回覆,提了 1 分,但是詭異的是 4 分的評審給我降到了 3.5 分,估計是之前也沒仔細看懂細節吧。不過結局是好的,這三位應該都是這個領域很權威的大佬,不然不會看的這麼透徹的。最後三個評審和 meta-review 都給出了一些批評性的意見,這也讓我又想起了導師在上次碰壁後說過的一句話:他們能認真看並且提出批評意見,說明這個方向還沒死掉,還是有人關注的。

v2-536d1ca9ab939ac385e75e40814e903e_b.jpg

我的科(mo)研(yu)生涯還得從保完研開始說起。很多人都問過我爲啥不保研去清北復交呢?每次我的回答都差不多吧。一是當時確實懶,嫌夏令營啥的好麻煩,保本校舒舒服服啥都不用幹。二是當時不知道看了哪裏說研究生導師大於學校,而且確實現在的導師超級 nice ,於是我就留下了。三是心想着早半年進實驗室不香嗎?能多做些科研。事實證明,早進沒啥用,都被我打遊戲摸魚耗光了。

v2-135b0af3f8b6e3c786b250af976363b7_b.jpg
我普陀區第一蓋倫豈是跟你開玩笑的?

遙想兩年前的寒假,那時候剛剛保研不久。進了實驗室第一件事就是做畢業設計了,那時候就給我定下了現在的方向——成分句法分析。不過那時候真是啥都不懂,深度學習也剛入門,句法分析看的幾篇論文(還是導師丟給我的)竟然都是傳統方法的經典論文。於是畢業論文做的就是傳統方法夾雜着深度學習,現在看來就是一坨 shi ,效果差到離譜,數據都沒處理好,吹的倒是天花亂墜,還混了個優秀畢業論文。早知如此,當初就應該直接看最新的前沿論文,這樣不僅畢業論文好寫,也能更早的爲現在打下堅實的基礎。不過像下面這種經典論文還是必看的,雖然方法現在過時了,但是思想有些還是可以借鑑的。

v2-eeaa400131e1d9fd83a5e9f1cc92e0cc_b.jpg
我的啓蒙論文

然後就開始第一次頂會投稿了,上來就給我整了個 ACL 2019 。那時候我還沒什麼想法,論文倒是看了差不多了,然後拍腦袋想了個改編的點子。其實本質上方法沒啥大差別,但是當時啥也不懂啊,覺得挺有新意,就愣愣地拿別人的代碼改改跑起來了。最後效果也是難以言盡,就高了一丟丟,估計還是實現上的影響或者多次跑取了個最好的。然後憨憨地寫了篇論文,導師還給我認真從頭到尾修改了好幾遍,最後提交了。第一次出結果也慌的很啊,半夜醒來一直看手機郵箱。然後凌晨兩點收到的郵件,睡意朦朧中看了眼第一句寫着 we are sorry (當時沒有 rebuttal)。評分也不高,只有 3.5、2.5、2.5 ,現在看來 3.5 的那個評審還是給足面子了,要我說 2.5 都高了。當時導師就說下了那句讓我印象深刻的話:不要怕,應該感到高興,他們能認真看並且提出批評意見,說明這個方向還沒死掉,還是有人關注的。

這時候應該才二三月份吧,你要問我這還有大半年呢,你幹嘛了?是的,我幹嘛了呢?我什麼都沒幹,我直接把這篇一個字沒改轉投了 CoNLL ,心想一個 CCF C 類會議,總能碰碰運氣吧?結果還是低分被拒,事實證明這篇果然是坨 shi ,這時候我自己都已經不想看了,索性丟在了一邊再也不管它了。而導師這時候安慰我說,CoNLL 別看是個 C 會,不水的,不要氣餒。一直到下半年開學,我基本上沒有任何新的 idea ,一直都在召喚師峽谷放縱,然後順帶看完了這個方向幾乎所有的論文,但是依舊沒有任何 idea 。

v2-cba1a482539660c626cf9c77d74ec2eb_b.jpeg

直到有一天,我看着師兄的 ACL 2019 論文,用 GNN 來做依存句法分析。我就想好像還沒人用 GNN 來做過成分句法分析,可是哪來的圖呢?依存樹可以轉變成一張圖,結點數量是確定的,在完全圖上跑 GAT 可以生成出依存樹。但是成分樹還有中間結點啊,似乎不好辦,於是那段時間我一直在想有沒有其他的表示方法,可以把成分樹也表示成 GAT 可以處理的形式。

那段時間真的特別迷茫,不知道這條路走不走得下去。每天跟導師聊天都會抱怨,有監督確實做不下去了,這次投完我一定要轉無監督了。然後終於有了這篇論文 idea 的雛形,把句法樹轉成了線性序列,也有辦法跑 GAT 了。但是在代碼實現上,我這次學乖了,之前一整年我都是在一份效果不是那麼好的代碼基礎上修改的,用的是 DyNet 深度學習框架。但是這次我決定直接在 SOTA 代碼,也就是 ACL 2019 交大同學那篇論文代碼基礎上進行修改。老話說的對的,確實要站在巨人的肩膀上,會少走很多彎路,自己實現確實鍛鍊代碼能力,但是實在是太耗時間了,當時來不及了。

v2-5771afd53132078bfe24e536176f63a5_b.jpg
實驗室打掃的很乾淨,煩躁的心情也會好點

那一個多月,我再也沒有出現在召喚師峽谷過(可能出現過一兩次嘻嘻),每天晚上都熬到了凌晨一兩點才走。調參確實辛苦,嘗試了各種參數想把效果再調高一點,但是確實已經差不多到頂了,很難上去了。後來討論中經師兄提醒又加了 dropout ,效果一下子又上去了很多,那時候纔看到了一絲希望。做完了各種實驗之後,就順帶着開始寫論文了。論文寫起來其實挺快的,一個星期就能差不多有了初稿。

不得不說,導師對我的幫助實在是太大了。跑實驗那段時間,每天下午都要和我討論半天模型細節。剛開始他也不是很懂我的 idea,講了很久他才明白個大概。等論文寫完,他改我的初稿,把我一整頁的囉嗦證明濃縮成了很精簡的幾段話。又把我的 introduction 完全重寫了一遍,基本上實驗之前的部分全都是他撰寫和修改的。後來苦等了兩個多月,rebuttal 出來了,因爲疫情在家只能遠程和導師交流。老闆又把我的回覆完全重寫了一遍,真的看起來讀起來完全不同了,rebuttal 確實得找有經驗的好好寫!

v2-24a59bf85d4739e6a523e9e552699765_b.jpg
非常感謝敬愛的我導

現在總算鬆了一口氣,一直沒有論文,其實我挺爲畢業感到擔憂的。如果這次不中,我都打算直接水個 C 會混畢業了。實習啥的都不用想太好的了,老老實實找個升經驗吧。但是現在中了,還是不能鬆懈,我還是決定繼續想 idea 投之後的幾個會。英雄聯盟中無極劍聖有句臺詞:真正的大師,永遠懷着一顆學徒的心。不能因爲達到畢業要求了就開始混日子了。其實這次說白了還是運氣好水上的論文,我感覺我還是很菜。看看網上實習都問 LSTM、SVM 之類的細節原理,我就一臉懵逼,平時我都調包啊,細節我哪裏記得?其他很多基礎知識也都朦朦朧朧早已不記得了。工程代碼能力更別談了,模型都沒手擼過,都是修修改改,以後不知道怎麼辦呢。別人總吹我,你很強啊、牛啊,其實我自己知道的,我算周圍人裏面比較菜的了,所謂的強都是表面上的和本科那些沒啥用的成績了,科研和課程差別還是太大了。特別是網上認識了很多很多的大佬之後,越發感覺我根本不值得一提。

v2-c17fc84eb89722f6aeacb256d16c2d49_b.jpg
真正的大師,永遠懷着一顆學徒的心

總結我的碩士前半程,一年划水,idea 做廢掉了,半年奇思妙想水了一篇頂會。我的經歷並不值得學習,但是我還是想提幾點也許可以對科研有幫助的小建議:

  • 積累是一定要的,你做的這個方向一定要了解的差不多,才能知道下一步朝哪發展。
  • 不要拘泥於只看你方向論文,去看看其他方向論文,甚至看看 CV 的論文,說不定有能直接拿過來用的 idea 。
  • idea 挺隨緣的,也許是你在喫飯的時候突然蹦出來的。平時走路、喫飯等閒暇時間可以腦子裏想一想,我的 idea 就是沖澡的時候想出來的。
  • 多跟導師、學長們討論討論,可以讓你少走彎路,甚至把你從錯誤的方向拉回來。討論的時候也許能解決你想了很久都沒想通的問題。
  • 站在巨人的肩膀上。論文多看頂會的,代碼多看大牛寫的。
  • 平時組會別人講論文的時候多聽聽,雖然跟你方向不搭,可能也能拿來用的,對你的 idea 也有很大啓發。
  • 有時間和精力的,可以寫博客,寫一點論文解讀,寫的過程可以解決你沒看懂的很多問題。

下面要開始找實習和準備下一階段工作了,希望中意的幾家公司能要我吧哈哈。這裏也感謝所有一直以來支持我的朋友們,祝你們早日頂會發到手軟。還有我的幾個兒子們,不知道什麼時候才能開學呢,幾個月沒見了,請你們的飯局要約起來了。最後微信名終於改掉了(不中 paper 不改名,拜拜~),下面該考慮脫單的事宜了,操勞的爸媽都把鄉下老房子裝修好了,就等着我領一個回家了,不知道髮量日漸稀少可還有人要哦。

v2-17c2da0d94564b5b51a81c7212ed7ae8_b.jpg
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章