你想帶一頂什麼樣的碩士帽[曾毅]

原文來自:http://bbs.nuc.edu.cn/pc/pccon.php?id=49&nid=2107&order=&tid=149
碩士研究生學習的動機
一個朋友曾問我這樣一個問題,他已經被保送研究生了,但是在選擇方向的時候他的學長向他建議選擇一個將來好找工作的簡單的研究方向,否則其他的方向就只能夠留校做老師了。我對這個問題有一些看法。

首 先一點我覺得要端正的是做研究工作的動機。很多同學走上了研究生道路,但是並不明確自己上研究生的目的,例如有些同學希望通過研究生一張文憑找一個好一點 的工作,有些同學甚至只是因爲成績好一點,懼怕走向社會,然後選擇讀研,我認爲這兩種動機都是錯誤的。我想在讀研之前需要明確,其實只有少數幾種想法的學 生纔是真正應該讀研究生的:第一種是覺得自己本科學習的課程不夠深入,希望通過研究生學習在本領域內積累更廣泛,更深入的專業知識。第二種是希望在研究領 域有所建樹的同學。有很多人認爲通過研究生學習可以積累很多工程化的經驗,我個人認爲工程化經驗的學習在企業中甚至要遠遠好過在研究院所中。例如在企業中 才能夠體會到哪些工程經驗和訓練纔是最有用的。在這方面我自己目前經驗不多,只想對那些選擇上研究生,希望在研究領域有所建樹的同學說一些自己的看法:

針對我的那個朋友現在的能力,他足以找到一份相當好的技術工作。如果還是選擇一般的通用化方向,那麼研究生三年相對來說就是在浪費時間了。我的觀點是,一般的開發工作他現在都能夠勝任了,應當花3年 的時間做一些有意義的研究工作。例如數據挖掘,自然語言處理,模式識別。然後將它們用在一些有意義的應用領域,例如遊戲開發,搜索領域(包括文本檢索,文 本過濾,文本分類)。這樣才能夠體現作三年研究工作的價值。也是上研究生的真正目的,研究生畢業不是要找一個所有人都可以做得工作,而是從事一個自己喜 歡,自己擅長,又很有意義的工作,在這個領域你應當努力做到最好,得到大部分人甚至是這個領域權威的認可。

對於是否留校,我認爲研究院校是一個很好的研究環境,如果自己非常喜歡研究工作並希望分享自己的研究心得給自己的學生和同行,留在學校做一名教師甚至是一個很好的選擇,我們不能因爲教師的待遇可能不是最好的就放棄自己的理想和信念。

深入的研究工作體現一個人學習的能力,就像 李開復 博士,在語音識別領域做到曾做到世界最好的成果,在加盟蘋果公司後做多媒體工作,加入微軟後做另外若干個領域的研究工作都能夠做到得到世界權威的認可,這纔是一個人研究能力的體現。不要爲了找一個看上去還不錯的工作耽誤了自己的前途,眼光要長遠。既然上了研究生,只要自己選擇了一個自己認爲有意義的方向,並且作了充分的考慮,要爭取在這個領域做到最好。李開復的博士導師,圖靈獎的獲獎者羅傑.瑞狄在李開復剛剛進入研究生血跡階段就跟他說:你現在你喜歡的領域並沒有舉世矚目的成就,但是5年後你畢業的時候你一定要做到這個領域最好的研究成果5年後李開復做到了。

我建議大家都閱讀一下MIT人工智能實驗室如何做研究以及我的五年研究生生活這兩篇文章,可以很容易的從Google搜索得到,從中可以深刻地體會到如何去做研究工作。研究生要選擇有挑戰性的工作,並要學會踏踏實實的深入做研究,才能在未來的工作中應對各種挑戰。

研究生基礎課學習的重要性

研 究生一年級主要的時間我想都應當進行基礎課程的學習,過早的進入課題首先將自己定在一個很狹窄的範圍內,不能夠在計算機專業核心領域的課程有所深入,不是 一個好的選擇。我自己在研究生一年級的課程中感覺因爲自己沒有投入百分之百的努力,在進入二年級的學習時,有些相關的領域就感覺有些吃力。所以在一年級打 下一個堅實的基礎是十分重要的。對於任何一個研究領域,下面的專業課程都是重要的:程序設計語言問題求解(相關課程爲:面向對象程序設計,約束式邏輯程序 設計,泛函編程),算法設計與分析,高級操作系統(有些學校也稱操作系統II”,統計學原理(圖形圖像的研究方向還要特別關注:計算方法學,最優化理論),數據庫、倉庫與數據挖掘。

在研究生基礎課學習階段,老師會根據學校總體的研究情況,將各個研究室涉及到本學科的一些共性問題作爲重點進行分析講解,這個時候課後練習就比本科的很多模擬練習更具有重要的意義,需要自己認真地獨立完成才能夠有真正的收穫。研究生階段課程的學習也不能僅僅只完 成 老 師的要求,在從事某一門課程學習的時候,要足夠深入的研究這門課程相關的核心理論,研讀足夠深入的書籍。例如很多同學在本科的時候都聽說過《計算機程序設 計的藝術》,那麼在研究生階段算法設計與分析課程學習的過程中,我們就應當努力去研讀這套經典的書籍,爲自己的理論研究打下紮實的基礎。

如何做研究工作

研究生最重要的一個環節就是二年級開始的研究工作。正如我上面提到的,既然選擇了一個自己喜歡的研究方向,就要爭取在三年(直博研究生5年)內作出一些有意義的成就。這並不是一件容易的事情,具體的方法建議大家參考MIT人工智能實驗室如何做研究這篇文章。

我想拿自己曾經涉足的兩個研究領域作爲一個例子說明一下:

最 開始我曾經從事過一段時間操作系統安全的研究,在這段時間我採用的主要方法是:找到本領域內最權威的一些著作首先認真研讀(我選擇的是卿斯漢教授編著的 《操作系統安全》,清華大學出版社出版),然後認真察看這些權威著作中提到的本領域內最重要的一些標準文檔(例如操作系統安全評估的菊皮書TCSEC”)和一些最重要的論文,例如“Secure Computer System”一系列的論文。閱讀完足夠量的書籍和論文後(例如2本領域的經典著作,10-20篇權威論文)還要做的工作就是了解別人曾經做過的工作,做到了什麼程度,有哪些可以改進的地方,是否有可能提出一種新的觀點等問題。隨後我曾經關注過EROS,ASOS,FluskSELinux,也找了一些國內的安全操作系統公開的材料作爲參考。並體會到安全操作系統的研究工作不但要深入細節,解決一些具體的安全隱患問題,更要在安全操作系統框架的設計,安全體系機制的構建上多下功夫。

本學期開始我從事的研究領域是文本挖掘與分類,由於對這個領域我開始幾乎一無所知,所以首先找來了《統計學原理》《統計自然語言處理基礎》《模式分類》《數據挖掘原理》等書籍打好必備的基礎知識,然後選擇了10篇本領域內很重要的論文進行了深入的研讀,例如:

Inductive Learning Algorithms and Representations for Text Categorization [Susan Dumais,Stanford]
Jackson P., Moulinier I. (eds.) Natural language processing for online applications.. text retrieval, extraction and categorization (2002)

每一個階段給自己佈置一部分論文閱讀,例如你可以在你的桌面上放置一個文件夾,裏面放着最近一定要閱讀的論文,並制定詳細的計劃按照計劃執行。(研究生階段做事情的計劃非常重要,也是有序的工作的保障)

我建議每一個學生都加入中國計算機協會(CCF)和美國計算機協會(ACM)的會員(Member,不要加入Student Member,因爲Student Member不能得到足夠多的文字資料和會議信息)。這樣不但能夠訪問到最新的論文成果,而且能夠及時掌握本領域內最重要的學術會議,便於我們向同行學習交流。加入的方法可以查看他們的官方主頁。

除了要加入一些學術會議組織外,還要善於挖掘網上有用的參考文獻和資料。例如我在做信息搜索領域時參考的主要網上資源就有:

文本分類資源列表:

http://www.cs.helsinki.fi/group/doremi/categorization/categorylinks.html
http://dewey.yonsei.ac.kr/memexlee/links/categorization.htm

文本分類實現:

http://svmlight.joachims.org/
http://www.csie.ntu.edu.tw/~cjlin/libsvm/index.html

支持向量機參考:

http://www.csie.ntu.edu.tw/~cjlin/
http://www.cocw.net/mit/Electrical-Engineering-and-Computer-Science/6-034Artificial-IntelligenceFall2002/Tools/detail/svmachine.htm

計算語言學相關資料:

算語言學文檔: http://acl.ldc.upenn.edu/ http://www.cs.cmu.edu/~pbennett/irseries/

統計自然語言處理基礎 http://www-nlp.stanford.edu/fsnlp/

Information Retrieval相關參考 

哈工大IR組機器學習論壇:
http://ir.hit.edu.cn/cgi-bin/newbbs/forums.cgi?forum=20
Carnegie Mellon University - Information Retrieval Discussion Series
http://www.cs.cmu.edu/~pbennett/irseries/
Statistical natural language processing and corpus-based computational linguistics
http://www-nlp.stanford.edu/links/statnlp.html

有關發表論文

發 表論文是對研究成果的一個很好的總結和反思的過程,如果認爲自己的工作足夠好,並希望得到更多同行的瞭解,我們不妨將自己的研究成果寫成論文,但是一定不 要爲了做論文而搞研究,這樣出來的研究成果可能是沒有實際價值的。我覺得不應當鼓勵以發論文的數量來衡量研究生的研究工作,而更應當將重點放在大量深入的 研究工作中去。

我自己的研究生學習還在進行當中,我會不斷地積累自己的經驗與大家分享,也希望大家將自己的研究方法和心得介紹給自己的朋友,共同爲營造一個良好的研究氛圍做出自己的努力。

希望能夠與您交流研究的心得,我的聯繫方式是:

北京工業大學 計算機學院 曾毅

[email protected]
 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章