人大副教授從細節上教你如何快速進行研究生早期的科研之路

點擊上方,選擇星標置頂,每天給你送乾貨

閱讀大概需要17分鐘

跟隨小博主,每天進步一丟丟

來自:RUC AI Box

作者:中國人民大學教師趙鑫

主頁:http://aibox.ruc.edu.cn/

 

之前寫了一篇文章《計算機系本科生開展科研學習的九問九答》,主要是關注本科生。這一篇繼續談一下研究生的早期科研之路。因爲大家的背景不同、經歷不同,所以我也只是從個人角度來說一下,內容僅供大家參考。

1.

跨越人生的舒適區

研究生階段是連接本科和社會的關鍵節點。很多同學進入研究生階段往往經歷了保研或者考研的洗禮。能夠進入心儀的學校甚至實驗室學習,已經是一個重要的收穫。本科階段側重基礎學習,保研或者考研對於應試能力有着較高的要求;研究生階段則更爲關注實戰能力和解決問題的能力。

研究生階段與本科生的整體學習方式和訓練方式不太一樣。不總會有教科書教你如何科研入門,不總會有資料直接將idea傳達給你。很多同學做的轉型實際上不好。經歷了保研和考研,很多同學可能慣性認爲本科的學習方式仍然適用於自己,畢竟這些原有的學習方式幫助大家走到了這個階段。然而原有的學習方式不是最優的方式,需要進行調整和摸索。

確定了研究生階段已經確定無疑後(例如考研填報完成或者考研複試通過),要及時開始下一段的規劃。越早上路的人還是會有優勢的。過去的“輝煌經歷”(例如GPA達到年級第一名、獲得過ACM金獎等)應該早點“丟”進箱子裏了,新一程的奮鬥又要開始了。不要躺在舒適區,每天沾沾自喜,實際上你會發現之前同水平的同學可能早已在科研上領先你很多了。千萬不要固化自己的學習方式,要勇於做改變,勇於接受新的挑戰。第一步就是在心理上做好準備,嘗試新的學習方式,也要接受忽然不能得心應手的落差。

2.

學習過程必須專業化

很多同學用了很多功夫,但是做不好科研,除了天賦外,一個很重要的原因就是不專業。科研是一個系統化的學習過程,可能包括閱讀英文原版書籍、學習基礎理論(機器學習)、使用標準規範編寫代碼、使用科學寫作方法攥寫論文等等。每一個環節不應當對標某本教科書某篇論文,而是要對標學術界的標準。這樣所有環節都下來,才能真正達到一流。

我強烈建議初學者一定要真正地學習一兩門頂尖學者開設的視頻課程,從教材、講義以及課後作業都認真完成一遍。通過閱讀相關經典論文,可以最接近學術界的科研語言;而獨立做作業會讓大家有足夠的思維訓練和動手訓練。另外一個好處是,無人監督的情況下,自己是否能夠完成一個學習過程,我覺得學公開課程實際上是很好的一個檢測手段。

專業的論文從寫作、理論以及代碼等多個維度都是專業的;相反不專業可以體現在糟糕的排版、英文術語不規範、代碼複用性很差。說到這裏,我強烈建議研究生一旦發表論文後,能夠創建一個project web page,讓你的所有東西可以復現,接受學術同行的考量。當然,這個要求很高,能做到的人不多。很多學生,包括很多狂發論文的研究生,有一個心態,一個工作被髮表了,這個工作就結束了。那麼原來的代碼爲了趕論文寫的差一些就差一些吧,論文裏的圖片區分度不高就不高吧。學術成果是研究人員的名片,一份“邋遢”的工作會是一段抹不去的黑歷史。既然做了,就要專業,也要持續維護這種專業。

3.

打好基礎才能“騏驥千里”

很多研究生有的時候會經常立flag,譬如,今年無論如何都發出來一篇A類論文。我想說的是好的工作人人渴望,但是工作不是靠期望得來的,當然不可否認信念和信心的重要性。大部分研究生都需要循序漸進的科研,需要將各種基礎打好後,才能出一個較爲滿意的工作。一般來說,這個過程可能花費1-3年。就和遊戲機裏過關一樣。例如,塞爾達第一場剛出來的林克是無法搞定遊戲後期的妖怪的(不排除有一些遊戲達人能夠完成)。彆着急,從基礎做起。

很多研究生經常將無法發表論文歸爲自己能力不夠、導師指導不好、運氣太差等因素,但是我想說,科研這東西,只要按照專業的方式持之以恆學習,或多或少都會有些結果的(例如論文)。

如果暫時沒有發表論文的同學也不要着急。爲什麼呢,因爲很有可能是真沒有達到這個水平。可以對標一個理想狀態“熟讀論文百篇、白紙推公式、vim寫代碼”,你是否達到了呢?當你很輕易地實現這個理想狀態,能不能發論文只是時間的問題(但是好工作未必一定能出來,論文和好工作是兩回事)。

 “高築牆、廣積糧”。所有好的工作最終都歸結爲持續的付出與積累,不要隨便喊口號、立flag。只有把一件事情做得專業、打好基礎,纔能有所成績。

想想馬斯克發射火箭和人造衛星,這可不是一句口號外加雞血能搞定的。日復一日,年復一年。總之,爲什麼有的人那麼厲害,因爲他比你更加拼命而又堅強。我看到很多同學因爲一兩次論文的被拒,就認爲自己不適合科研的想法。我很理解這種心態,但是同時也想說,有志者事竟成。雞湯有的時候講起來真的特別虛僞,但是有的時候又特別應景。有大付出者,纔有大回報。

4.

善於發現以及跟追熱點

首先想說,熱點這東西不總是好事。如果所有人只關注熱點,那麼科技創新可能就會受到影響。想想三劍客們在主題模型(topic model)“橫行十年”的背景下,安心去做神經網絡,其定力、判斷真是非同一般。

但是,對於初學科研的人,我不建議盲目追蹤冷門課題。因爲,我們的基礎不夠做足夠的探索。相反,熱點問題的討論和基礎很多,可以很好地切入並且空間很大。同樣地,即使一個老的課題,裏面可能也有一些新興的熱點,也是值得初學者高度關注的。

能夠早期預見以及鎖定一些熱點,這是一種很強的科研嗅覺。想想BERT剛剛出來的那一個月,如果我們能馬上喫透這個模型,並且將其應用在之前一個很難被提升的任務上,我想這樣的一個工作可能也會是不錯的一個研究工作(對於初學者)。雖然我不是特別鼓勵這種套模型的研究,但是還是覺得對於初學者這真的已經很厲害了:能在第一時間預判熱點、能在短期階段學會並且掌握該模型、能夠很好地遷移該工作或者該想法在自己的任務上。

不過現實是,我看到的是,追蹤熱點的同學往往都不是新手;相反都是一些前期功力深厚的研究組或者研究生。說起來,這有點像投資專家,你觀察他選擇一支股票的過程,經常會不服氣吐槽他好像沒啥技術,但是他就是對於商機把握的好,着實買到了潛力股(注:我個人確實沒有任何投資經驗,如果舉錯了例子,還望包容)。

5.

做好“模仿學習”

模仿是人類成長的重要手段。從嬰兒階段學習語言表達到進入一個領域學習新的技術,都需要找到一些可參照可學習的目標。當你還不清楚什麼是正確的、什麼是重要的科研時,那麼請模仿吧。

 

有些同學會說,我也沒有國際大師作爲導師啊,我也沒有什麼好心的師兄師姐啊。有些同學總會抱怨導師對自己關注不夠,沒有親自告訴自己做啥題目。我想說模仿是一種能力,就和預見熱點一樣。在線課程、大佬兒的論文、極客的代碼等等,只要你抱着學習心態,就有大把可供模仿學習的途徑。

有的同學說我不會寫論文,寫的亂糟糟的。我想問一下是否認真讀過幾篇論文的寫作,從標點到用詞是否真的揣摩過作者的意圖、是否用英英詞典查過每個詞的具體意思以及用法、是否定期摘抄一些好的句子。總結起來一句話,模仿做的不夠。

模仿不是抄襲。打過遊戲的同學,我想可能對這句話有着深入的體會。我想看過一些專業遊戲玩家的一些高級操作後,你以後也會在一些類似的場景下受到啓發。同理,在奧數比賽裏,很多同學都會總結一些常見的規律結題法,比如連線證明三角形相似。總之,模仿要深入骨髓、模仿要活靈活現、模仿要適當創新。

但是模仿必須專業。比如寫作。要找到寫作達到國際水準的論文,然後逐詞逐句分析。很多A類會議論文的寫作可能未必達標,千萬別隨便拿到一篇論文就開始模仿,以免照錯學錯。看看別人是爲什麼要做一個工作、如何論述一個工作的意義、如何介紹模型、如何進行公式推導等等。總而言之,模仿能夠做到位,第一個工作不會做的太差。

6.

集中精力攻堅

研究生沒有特殊情況,不要總是更改題目。正常來說,一個研究生只有2-3年時間做科研學習,中間再換23個題目,那麼產生的再次學習代價會很高。

有的同學可能要問,我這個題目我已經做了很久了,就是不出成果、就是效果不好,怎麼辦啊。首先,判斷一下研究領域是否是處於國際學術的熱點。比較簡單的方法是,找到對應的頂級會議,看看每年發表的相關論文(包含大的關鍵字)是否有5-10篇,甚至更多。這是在檢查當前問題是否還有可研究的空間。其次,判斷所提出的idea在所使用的數據是否合適。研究人員要不斷培養對於數據的敏感性,以便減少對於方法的試錯時間。很多idea或者思路,看一下具體的數據其實就可以判斷是否會work。如果說,一直無法說清楚自己的數據有怎樣的特點,反倒指望黑箱模型去提升效果,這種途徑失敗的概率是很高的。而且很多想法也是從數據而來。當然,這和看着test data去調參數是完全不同的。注意,idea不是去跟着bad case去走的,idea要普適、要適應於多個數據集合。

如果上述這兩點沒問題,相信我,這是你自己的問題。很多同學剛開始接觸科研,經常抱怨自己的效果總是不好。實際上,這是缺少數據的敏感性以及實踐能力(比如調參等)缺乏造成的,甚至很多時候還是代碼寫錯了。

 

那麼這個時候該怎麼辦?不要換題目,至少從相關工作、模型設計、代碼設計以及錯誤分析多條途徑不斷檢查、修正和改進。多讀多想多嘗試,持續推動對於這一問題的理解。攻克困難需要持續發力,使自己處於不斷在進步的狀態。大家一起爬山,有的人路好走一些,有的人難走一些。但是一座山過不去,盲目換到另一座山,結果就是很大概率也爬不上去。 

7.

動手去做吧

很多學生會問我如何能做好科研呢?我想借用一句話,那就是“實幹興邦”。在科研上,真的,想太多捷徑、立太多flag、說太多牢騷,都是沒有太多意義的。

我有的時候經常被問到“讀論文有什麼方法嗎”、“寫作有什麼方法嗎”、“有什麼辦法可以想到好的模型”。我想肯定是有一些技巧的,但是很多時候不願意回答這種問題。相反我會反問,你精讀過50篇論文嗎?你完整寫過一篇論文嗎?你試過了五種以上的模型嗎?沒有的話,那麼先去踏實地做。馬步還沒有紮好的話,可以先不用想太多的技巧。同樣的技巧,如果配以經驗,會得到不一樣的感悟。

所以初學者,別想太多,安心推進。今天你是否讀了新的論文、寫了新的代碼、有了新的想法等。科研很多時候很枯燥。科研工作者需要日復一日的重複固定流程來強化自身能力,讀論文、寫代碼、想idea、跑數據等等。科研沒有輕鬆和捷徑,去做就好了。

我給初學者的建議是,堅持讀完若干經典書籍、堅持復現若干經典模型的代碼、堅持每天不斷閱讀新的論文、堅持寫作、堅持跑不同的實驗、堅持去做錯誤分析。。。這就是祕籍。

 

到任何時候,別小看時間的力量。研究生3年能夠堅持上述的過程(每年有300天以上),我相信畢業時,你會發現一個“強大的自己”,強大到你曾經不敢相信自己能夠做到。相反,也可能讓你“泯然衆人矣”。科研前期是一場自律與放鬆的博弈。然而入門後,你會發現閱讀論文其實也是在放鬆、也是在享受。我回顧自己認識做科研較好的同學,往往都是執行力很強的同學,我想這一點也必須在這裏再強調一下。

 

8.

加強學術表達與交流

有了行動後,我覺得再聊聊“說”和“寫”。表達與交流是很重要的。“酒香也怕巷子深”。即使再好的工作,不被別人接受,不爲他人所知,可能也失去應有的價值。我感覺國內學者其實有的時候很謙虛。相反,老外實際上是注重宣傳的。一旦有了一個新工作,經常會說“proud of”、“important progress”。當我們有了新工作後,也要適度進行宣傳。

 

首先,把論文寫清楚。最近幾年,頂會論文的數量不斷增多,而其中有的時候會遇到一些不知所云的論文。在這種情況下,論文讀得懂全靠猜的準。科研工作者有義務讓自己的工作表述是清楚的。我一直覺得論文寫得清楚不清楚,和通用的英語寫作關係不是特別大。英語技巧只會是讓論文讀起來感覺美不美。之前智源做過一次英文寫作的講座,我也參與給了一個報告。關於此部分,我想大家也可以在網上搜到很多談科學寫作的文章,這裏不再這裏贅述。但是我還是想強調一下,用詞和邏輯。不要隨便用一些當前領域文章沒有出現的名詞,不要想當然地用一些自以爲正確的單詞。其次,就是邏輯。論文不是堆砌內容,而是要循序漸進引導讀者閱讀。

 

其次,做好交流報告。現在越來越多的報告交流會,這都是很好的和其他學者交流的機會。講報告最忌諱就是自我沉醉。講報告是爲了讓聽衆有收益,在作報告之前,要反覆問自己,聽的人能聽懂嗎、聽的人能有收穫嗎?這樣,讓自己置身自己的工作之外,才能講好自己的工作。一般來說,20分鐘主要的報告,要講清楚動機、模型以及實驗結論,不要陷入細節講個沒完。剛開始作報告的同學有個誤區,就是希望把自己工作的所有細節都告訴給聽衆。實際上,聽衆的重點和關注通常在固定時間內都是極爲有限的,重要內容傳遞過去已經很不容易了。

9.

保持心態平和

科研中心態是非常關鍵的。能做好科研的人,一定要相信自己能夠做好。如果沒有這種內在的力量,而要靠其他人的鼓勵來維持心態,可能確實很難做好科研了。

很多時候,我們做的課題,和做投資是一樣的,因爲你並不能看到整個全景。起步的時候只是一個idea,加上自己的經驗,但是你必須提前決策做還是不做。中間整個過程會遇到各種各樣的困難,包括想不出來模型、實驗效果不好等等。面對科研,不是所有的同學都是幸運到順風順水。很多大牛學者,可能都是科研入門的遲到者。要堅信自己可以做好科研,它有各種不順利都是正常的。相反,太容易被困難嚇怕了,早早結束自己的科研經歷,也是一次對於自我能力的否定。

如果有幸進入一個強組,從一方面是一個很好的機會,從另一方面又是會有很強的peer pressure。甚至,可能整個研究所內部、國內相關研究領域內部一些明星學者都會傳達一定的壓力。有適當的競爭心理,我覺得是很好的事情。特別是研究生同學,如果身邊能找到一個和自己實力相仿,甚至比自己厲害一些的同學作爲參考,能夠起到互相交流、互相促進的作用。

 

但是要控制這種心態的蔓延,不要盲目攀比論文的多少。要保持一顆平和的心態,不能看到別人在某一個任務上發了很多論文,自己就盲目更換題目追隨。還是要有一個核心的研究目標,不斷地做好規劃,不斷地持續推進。不要因爲他人的進步而對自己產生過大的負面壓力,而影響了自己的判斷能力和執行能力。

        

10.

將科研融於生活

如果說讓我用一句總結“快樂科研”的祕訣,我想要說就是將科研融於生活。

將科研融於生活的好處是不會覺得“太辛苦”。有同學馬上會反問,啥,這還不痛苦嗎,這不是瘋了嗎?實際上,當人形成了一定的習慣後,略微加上一些正反饋,就可以很適應不斷重複慣性行爲。相反,隔幾天做一次,纔會覺得痛苦。就拿健身來說,一般堅持過1年以上天天鍛鍊的人,之後斷的可能性很小。但是每週去2次左右的人,很容易放棄健身。偶爾一次健身,要不覺得很興奮,要不覺得很難受。平和、自然其實是最好的狀態。將科研融於生活,你慢慢適應它了,你對他的心態就會逐漸平和了。有一天,你發現你好像每天科研就像喫飯睡覺一樣,那麼即使連續工作多個小時,也並不會覺得太辛苦,因爲那是生活的一部分。因爲你心態平和了、自然了,你甚至沒覺得你在喫苦。

要做好一件事,你就每天都想每天都做。所謂念念不忘,必有迴響。我不太認同那句話“work hard, play hard”,把工作和放鬆完全割裂開。作爲一個科研工作者,你的靈感要發生在每一次有意義的情景思考中。還清楚地記得,我自己第一個長文(EMNLP 2010的論文)模型就是在公交車上想出來的。時至今日,我都能清楚記得那一刻的興奮。有的時候,我特別羨慕現在的學生:這樣年輕的你們,而我又是曾經這樣年輕過。在研究生階段,大家操心的事情很少,可以一心一意做科研。

作爲結尾,還是再次強調這篇文章僅是個人觀點,談的也是我們普通人的科研入門。在當前複雜的國際形勢面前,我們科研工作者要有所擔當,至少要有這股決心,要把科研做好,至少把手頭的研究工作做好。一名優秀的研究生,至少應該有兩年爲科研奮不顧身的一段經歷。那會是一段美好的回憶,甘之如飴。

  

添加個人微信,備註:暱稱-學校(公司)-方向即可獲得

1. 快速學習深度學習五件套資料

2. 進入高手如雲DL&NLP交流羣

記得備註呦

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章