ACM競賽之新人嚮導

我們學校的計算機學院從去年起開始組織學生參加世界上最具權威性的大學生程序設計競賽——ACM/ICPC。從這學期開始,學院計劃有組織地進行訓練和講座,以幫助大家在有限的時間內儘可能多地提高自己的能力,這對有興趣投入數據結構與算法研究的同學來說無疑是一件好事。但是,剛剛接觸信息學領域的同學往往存在很多困惑,不知道從何入手學習,在這篇文章裏,我希望能將自己不多的經驗與大家分享,希望對各位有所幫助。 

一、語言是最重要的基本功 

無論側重於什麼方面,只要是通過計算機程序去最終實現的競賽,語言都是大家要過的第一道關。亞洲賽區的比賽支持的語言包括C/C++與JAVA。筆者首先說說JAVA,衆所周知,作爲面向對象的王牌語言,JAVA在大型工程的組織與安全性方面有着自己獨特的優勢,但是對於信息學比賽的具體場合,JAVA則顯得不那麼合適,它對於輸入輸出流的操作相比於C++要繁雜很多,更爲重要的是JAVA程序的運行速度要比C++慢10倍以上,而競賽中對於JAVA程序的運行時限卻往往得不到同等比例的放寬,這無疑對算法設計提出了更高的要求,是相當不利的。其實,筆者並不主張大家在這種場合過多地運用面向對象的程序設計思維,因爲對於小程序來說這不旦需要花費更多的時間去編寫代碼,也會降低程序的執行效率。 

接着說C和C++。許多現在參加講座的同學還在上大一,C的基礎知識剛剛學完,還沒有接觸過C++,其實在賽場上使用純C的選手還是大有人在的,它們主要是看重了純C在效率上的優勢,所以這部分同學如果時間有限,並不需要急着去學習新的語言,只要提高了自己在算法設計上的造詣,純C一樣能發揮巨大的威力。 

而C++相對於C,在輸入輸出流上的封裝大大方便了我們的操作,同時降低了出錯的可能性,並且能夠很好地實現標準流與文件流的切換,方便了調試的工作。如果有些同學比較在意這點,可以嘗試C和C++的混編,畢竟僅僅學習C++的流操作還是不花什麼時間的。 

C++的另一個支持來源於標準模版庫(STL),庫中提供的對於基本數據結構的統一接口操作和基本算法的實現可以縮減我們編寫代碼的長度,這可以節省一些時間。但是,與此相對的,使用STL要在效率上做出一些犧牲,對於輸入規模很大的題目,有時候必須放棄STL,這意味着我們不能存在“有了STL就可以不去管基本算法的實現”的想法;另外,熟練和恰當地使用STL必須經過一定時間的積累,準確地瞭解各種操作的時間複雜度,切忌對STL中不熟悉的部分濫用,因爲這其中蘊涵着許多初學者不易發現的陷阱。 

通過以上的分析,我們可以看出僅就信息學競賽而言,對語言的掌握並不要求十分全面,但是對於經常用到的部分,必須十分熟練,不允許有半點不清楚的地方,下面我舉個真實的例子來說明這個道理——即使是一點很細微的語言障礙,都有可能釀成錯誤: 

在去年清華的賽區上,有一個隊在做F題的時候使用了cout和printf的混合輸出,由於一個帶緩衝一個不帶,所以輸出一長就混亂了。只是因爲當時judgeteam中負責F題的人眼睛尖,看出答案沒錯只是順序不對(答案有一頁多,是所有題目中最長的一個輸出),又看了看程序發現只是輸出問題就給了個Presentationerror(格式錯)。如果審題的人不是這樣而是直接給一個 WrongAnswer,相信這個隊是很難查到自己錯在什麼地方的。 

現在我們轉入第二個方面的討論,基礎學科知識的積累。 

二、以數學爲主的基礎知識十分重要 

雖然被定性爲程序設計競賽,但是參賽選手所遇到的問題更多的是沒有解決問題的思路,而不是有了思路卻死活不能實現,這就是平時積累的基礎知識不夠。今年WorldFinal的總冠軍是波蘭華沙大學,其成員出自於數學系而非計算機系,這就是一個鮮活的例子。競賽中對於基礎學科的涉及主要集中於數學,此外對於物理、電路等等也可能有一定應用,但是不多。因此,大一的同學也不必爲自己還沒學數據結構而感到不知從何入手提高,把數學撿起來吧!下面我來談談在競賽中應用的數學的主要分支。 

1、離散數學——作爲計算機學科的基礎,離散數學是競賽中涉及最多的數學分支,其重中之重又在於圖論和組合數學,尤其是圖論。 

圖論之所以運用最多是因爲它的變化最多,而且可以輕易地結合基本數據結構和許多算法的基本思想,較多用到的知識包括連通性判斷、DFS和BFS,關節點和關鍵路徑、歐拉回路、最小生成樹、最短路徑、二部圖匹配和網絡流等等。雖然這部分的比重很大,但是往往也是競賽中的難題所在,如果有初學者對於這部分的某些具體內容暫時感到力不從心,也不必着急,可以慢慢積累。 

競賽中設計的組合計數問題大都需要用組合數學來解決,組合數學中的知識相比於圖論要簡單一些,很多知識對於小學上過奧校的同學來說已經十分熟悉,但是也有一些部分需要先對代數結構中的羣論有初步瞭解才能進行學習。組合數學在競賽中很少以難題的形式出現,但是如果積累不夠,任何一道這方面的題目卻都有可能成爲難題。 

2、數論——以素數判斷和同餘爲模型構造出來的題目往往需要較多的數論知識來解決,這部分在競賽中的比重並不大,但只要來上一道,也足以使知識不足的人冥思苦想上一陣時間。素數判斷和同餘最常見的是在以密碼學爲背景的題目中出現,在運用密碼學常識確定大概的過程之後,核心算法往往要涉及數論的內容。 

3、計算幾何——計算幾何相比於其它部分來說是比較獨立的,就是說它和其它的知識點很少有過多的結合,較常用到的部分包括——線段相交的判斷、多邊形面積的計算、內點外點的判斷、凸包等等。計算幾何的題目難度不會很大,但也永遠不會成爲最弱的題。 

4、線性代數——對線性代數的應用都是圍繞矩陣展開的,一些表面上是模擬的題目往往可以藉助於矩陣來找到更好的算法。 

5、概率論——競賽是以黑箱來判卷的,這就是說你幾乎不能動使用概率算法的念頭,但這也並不是說概率就沒有用。關於這一點,只有通過一定的練習才能體會。 

6、初等數學與解析幾何——這主要就是中學的知識了,用的不多,但是至少比高等數學多,我覺得熟悉一下數學手冊上的相關內容,至少要知道在哪兒能查到,還是必要的。 

7、高等數學——純粹運用高等數學來解決的題目我接觸的只有一道,但是一些題目的敘述背景往往需要和這部分有一定聯繫,掌握得牢固一些總歸沒有壞處。 

以上就是競賽所涉及的數學領域,可以說範圍是相當廣的。我認識的許多人去搞信息學的競賽就是爲了逼着自己多學一點數學,因爲數學是一切一切的基礎。 

三、數據結構與算法是真正的核心 

雖然數學十分十分重要,但是如果讓三個只會數學的人蔘加比賽,我相信多數情況下會比三個只會數據結構與算法的人得到更爲悲慘的結局。 

先說說數據結構。掌握隊列、堆棧和圖的基本表達與操作是必需的,至於樹,我個人覺得需要建樹的問題有但是並不多。(但是樹往往是很重要的分析工具)除此之外,排序和查找並不需要對所有方式都能很熟練的掌握,但你必須保證自己對於各種情況都有一個在時間複雜度上滿足最低要求的解決方案。說到時間複雜度,就又該說說哈希表了,競賽時對時間的限制遠遠多於對空間的限制,這要求大家儘快掌握“以空間換時間”的原則策略,能用哈希表來存儲的數據一定不要到時候再去查找,如果實在不能建哈希表,再看看能否建二叉查找樹等等——這都是爭取時間的策略,掌握這些技巧需要大家對數據結構尤其是算法複雜度有比較全面的理性和感性認識。 

接着說說算法。算法中最基本和常用的是搜索,主要是回溯和分支限界法的使用。這裏要說的是,有些初學者在學習這些搜索基本算法是不太注意剪枝,這是十分不可取的,因爲所有搜索的題目給你的測試用例都不會有很大的規模,你往往察覺不出程序運行的時間問題,但是真正的測試數據一定能過濾出那些沒有剪枝的算法。實際上參賽選手基本上都會使用常用的搜索算法,題目的區分度往往就是建立在諸如剪枝之類的優化上了。 

常用算法中的另一類是以“相似或相同子問題”爲核心的,包括遞推、遞歸、貪心法和動態規劃。這其中比較難於掌握的就是動態規劃,如何抽象出重複的子問題是很多題目的難點所在,筆者建議初學者仔細理解圖論中一些以動態規劃爲基本思想所建立起來的基本算法(比如Floyd-Warshall算法),並且多閱讀一些定理的證明,這雖然不能有什麼直接的幫助,但是長期堅持就會對思維很有幫助。 

四、團隊配合 

通過以上的介紹大家也可以看出,信息學競賽對於知識面覆蓋的非常廣,想憑一己之力全部消化這些東西實在是相當困難的,這就要求我們儘可能地發揮團隊協作的精神。同組成員之間的熟練配合和默契的形成需要時間,具體的情況因成員的組成不同而不同,這裏我就不再多說了。 

五、練習、練習、再練習 

知識的積累固然重要,但是信息學終究不是看出來的,而是練出來的,這是多少前人最深的一點體會,只有通過具體題目的分析和實踐,才能真正掌握數學的使用和算法的應用,並在不斷的練習中增加編程經驗和技巧,提高對時間複雜度的感性認識,優化時間的分配,加強團隊的配合。總之,在這裏光有紙上談兵是絕對不行的,必須要通過實戰來鍛鍊自己。 

大家一定要問,我們去哪裏找題做,又如何檢驗程序是否正確呢?這大可不必擔心,現在已經有了很多網上做題的站點,這些站點提供了大量的題庫並支持在線判卷,你只需要把程序源碼提交上去,馬上就可以知道自己的程序是否正確,運行所使用的時間以及消耗的內存等等狀況。下面我給大家推薦幾個站點,筆者不建議大家在所有這些站點上做題,選擇一個就可以了,因爲每個站點的題都有一定的難易比例,系統地做一套題庫可以使你對各種難度、各種類型的題都有所認識。 

1、Ural: 

Ural是中國學生對俄羅斯的Ural州立大學的簡稱 ,那裏設立了一個Ural Online ProblemSet,並且支持OnlineJudge。Ural的不少題目算法性和趣聞性都很強,得到了國內廣大學生的厚愛。根據“信息學初學者之家”網站的統計,Ural的題目類型大概呈如下的分佈: 

題型 搜索 動態規劃 貪心 構造 圖論 計算幾何 純數學問題 數據結構其它 
所佔比例 約10% 約15% 約5% 約5% 約10% 約5% 約20% 約5%約25% 

這和實際比賽中的題型分佈也是大體相當的。有興趣的朋友可以去看看。 

2、UVA: 

UVA代表西班牙Valladolid大學(University de Valladolid)。該大學有一個那裏設立了一個PROBLEMSET ARCHIVE with ONLINE JUDGE ,並且支持ONLINEJUDGE,形式和Ural大學的題庫類似。不過和Ural不同的是,UVA題目多的多,而且比較雜,而且有些題目的測試數據比較刁鑽。這使得剛到那裏做題的朋友往往感覺到無所適從,要麼難以找到合適的題目,要麼WrongAnswer了很多次以後仍然不知道錯在那裏。如果說做Ural題目主要是爲了訓練算法,那麼UVA題目可以訓練全方位的基本功和一些必要的編程素質。UVA和許多世界知名大學聯合辦有同步網上比賽,因此那裏強人無數,不過你先要使自己具有聽懂他們在說什麼的素質:) 

3、ZOJ: 

ZOJ是浙江大學建立的ONLINEJUDGE,是中國大學建立的第一個同類站點,也是最好和人氣最高的一個,筆者和許多班裏的同學就是在這裏練習。ZOJ雖然也定位爲一個英文網站,但是這裏的中國學生比較多,因此讓人覺得很親切。這裏目前有500多道題目,難易分配適中,且涵蓋了各大洲的題目類型並配有索引,除此之外,ZOJ的JUDGE系統是幾個網站中表現得比較好的一個,很少出現WrongAnswer和Presentationerror混淆的情況。這裏每月也辦有一次網上比賽,只要是註冊的用戶都可以參加。 

4、HDOJ 

HDOJ是杭州電子科技大學建立的ONLINEJUDGE,雖然發展較晚,但是已經是第二版了,系統很完善,人氣也不錯,不過本校的學生居多。HDOJ目前題目還不多,但是有很多的簡單題,特別適合入門者練習。這裏還經常舉行非公開的內部比賽,以及一些公開的在線練習賽,只要是註冊的用戶都可以參加。(以上爲內部補充,特此說明:) 

說起中國的ONLINEJUDGE,去年纔開始參加ACM競賽的北京大學現在也建立了自己的提交系統;而我們學校也是去年開始參加比賽,現在也有可能推出自己的提交系統,如果能夠做成,到時候大家就可以去上面做題了。同類網站的飛速發展標誌着有越來越多的同學有興趣進入信息學的領域探索,這是一件好事,同時也意味着更激烈的競爭,希望大家都能通過競爭鍛鍊自己、提高自己,並爭取成爲勝利者。  


©2001-2004版權歸放飛技術小組所有。放飛技術小組保留對此的一切權利。 
©2001-2004 Frontfree Workgroup. All rights reserved. 全部文章
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章