[轉]控制論思想

控制論思想
控制論的思想是很重要的,對你的系統觀有着重要的影響。

控制論思想

1、控制論擊毀驅逐艦

1982年4月,英國和阿根廷在南大西洋的馬爾維納斯(福克蘭)羣島附近,展開了第二次世界大戰以來規模最大的海空戰,也是世界上第一場動用核潛艇和空對艦導彈以及複雜電子系統的大戰。這次海戰,雙方共出動了數十艘戰艦和幾百架飛機,尤其是使用了幾十種現代化導彈,在水面、水下、空中和島岸進行了封鎖與反封鎖、空襲與反空襲、登陸與反登陸的殊死較量。5月2日,英“征服者”號核潛艇在水下發射兩枚配有先進制導系統的“虎魚”式魚雷,擊沉了阿根廷唯一的一艘3千多噸的巡洋艦。5月4日,阿根廷使用法國製造的“超級軍旗式”戰鬥機,在距英艦央48公里左右處,發射一枚“飛魚AM39”型空對艦導彈,一舉擊沉了英國現代化程度很高、價值約2億美元的“謝菲爾德”號導彈驅逐艦。5月25日,阿方再次使用“超級軍旗式”飛機發射兩枚“飛魚式”導彈,又擊沉了一艘排水量爲1.8萬噸的英國“大西洋運送者”號運兵船。

阿方空軍用一枚價值20萬美元的“飛魚”導彈,擊沉了英國一艘價值2億美元的導彈驅逐艦,使世界各國軍事人員目瞪口呆,驚呼導彈在未來的海戰中將起到“關鍵作用”。戰鬥結果表明,配有精密制導系統的武器徹底改變了傳統海戰方式,雙方用不着面對面地艦炮對射,在幾十公里乃至幾百公里外就可用導彈發動攻擊了。

我們介紹這一戰例的目的在於說明這樣一個事實:現代導彈裝配的精密制導系統正是自動控制技術在軍事上的一個重要應用。



控制論是什麼?



控制論研究的對象是包括人在內的生物系統和各種非生物系統(如工程系統、化工系統、通訊系統、經濟系統等)。所謂系統,是由相互制約的各個部件組成的具有一定功能的整體。

恆溫箱就是一個簡單的系統。如圖所示,構成系統的基本部件是:電源、開關、加熱電阻絲、箱體和執行動作的人。因爲我們的目標是要保持恆溫箱內的溫度不變,所以這就是



一個控制系統,受控對象是箱內溫度,控制方式是接通或斷開電源開關。

如果我們希望箱內的溫度保持在20℃(假定環境溫度低於20℃),那麼當操作員觀察到溫度計的數值低於20℃時,就合上開關,接通電源加熱,使箱內的溫度升高。等升到20℃,操作員又將開關斷開了一段時間後,箱內溫度就會因爲散熱而下降,這時操作員又得合上開關爲箱子加熱。重複上述過程,操作員眼睛觀察溫度計,手控制電源開關,就能基本上保證箱內的溫度維持在20℃。



如果我們採用自動控制技術來代替人的勞動,就成爲自動恆溫系統。它與人工恆溫系統不同的是減少了操作員,但增加了一根彈簧、一個繼電器和有關線路。溫度計底部及20℃處,各有一根導線連到電源上,這些增加部件的功能就是代替人工操作。當繼電器迴路的電源接通時,就會產生吸力,將開關拉開(斷開),因此加熱電阻不工作(停止加熱)。如果繼電器迴路中電源斷開,繼電器不產生吸力,那麼開關受彈簧拉力的作用而閉合,接通加熱器迴路的電源,加熱器開始加熱。

這個系統是怎樣實現自動控制的呢?原理很簡單。因爲溫度計內的水銀是可以導電的,所以當箱內溫度低於規定值20℃時,繼電器迴路是斷開的,不產生吸力,彈簧把開關拉緊(閉合),加熱器迴路有電,電阻絲髮熱,箱內溫度持續升高。一旦溫度升到20℃時,水銀使繼電器迴路接通,因爲繼電器產生的吸力大於彈簧的拉力,所以將開關斷開,加熱器停止工作。由此可見,在自動恆溫系統中,彈簧與繼電器接替了操作員雙手的工作——合上或斷開開關;而溫度計上的接線相當於人雙眼的觀察,它能依據箱內是否達到規定值而使繼電器動作,從而實現了自動恆溫的目的。

從上面這個簡單例子可以歸納出自動控制系統的一個突出特點,即系統自動控制過程就是信息傳遞和變換的過程。但是一旦系統中信息傳遞受阻,又會發生什麼情況呢?我們再以一個美國獨立戰爭時期發生的一件事來說明。

當時,英國殖民主義者爲了鞏固它在美國的殖民統治地位和有效鎮壓美國人民的起義,曾組織了一次重要的戰役。英軍指揮者設想一支軍隊從加拿大出發,同另一支從紐約出發的軍隊,在一個名叫薩拉託加的地方匯合,對那裏的起義隊伍形成兩面夾擊的進攻陣勢,企圖一舉消滅起義軍隊。但是戰役的結果卻並不像英軍指揮者設想的那樣。當其中一支部隊到達指定地點時,卻始終不見另一支英軍前來匯合,結果形成了孤軍奮戰的被動局面,慘遭失敗。事後才查明,原因是由於疏忽,行動命令只發給了一支部隊,另一支部隊根本就沒有接到命令。

顯而易見,英軍失敗的主要原因是信息受阻。其下屬根本沒有收到上級的任何指示,因爲英軍的信息傳遞只有自上而下(命令),而沒有自下往上的信息反饋。所謂反饋(Feed-back),是指當指揮者控制系統發出的指令信息(也叫系統輸入)輸入後,通過系統內部變換後又將信息作用的結果(也叫系統輸出)返回到系統輸出端,並根據系統輸出與系統輸入(規定值)是否吻合,再對系統施加作用的過程。這也正是控制論創始人維納所提出的“雙向通訊”的慨念,既有從系統輸入到系統輸出的正向信息傳遞和變換,也有從系統輸出端返回輸入端的反饋信息。從控制論的觀點來看,系統的自動控制過程正是通過“雙向通訊”的信息反饋聯繫而實現的。信息在系統中的這種循環往返過程中,不斷變換形式,最終實現控制目標。這就是控制論所揭示的自動控制系統的反饋機制,它是自動控制系統的第二個特點。



反饋機制



在山村野地,一羣小雞在嘁嘁喳喳地尋找食物,時而翻動草屑,時而啄食幼蟲,怡然自得。一隻餓鷹從遠處飛來,發現了獵物,急速俯衝下來,嚇得小雞四處逃竄,於是演出了一幕“追蹤—逃逸”的活戲劇。在這個“追蹤—逃逸”系統中,對老鷹來說,目標是小雞,控制機構是鷹腦(發出指令),執行動作的機構是鷹翅、鷹爪和嘴。在整個追蹤過程中,鷹藉助眼睛不斷地獲得反饋信息(即小雞的位置、速度和方向變化),據此及時調整自己的動作,直到抓住目標。

從這場“鷹雞殊死之戰”的過程中,我們可以看出信息反饋和反饋控制的重要性。

其實反饋作爲一種技術手段自動控制目標,早在古代就開始了,只不過那時人們尚未從理論上加以昇華。相傳早在2千多年前,我國和古希臘都曾發明過水鍾(“銅壺滴漏”)。這種簡單的裝置中就包含了深奧的反饋控制原理。水鐘的基本要求是控制水流的速度恆定以達到準確記時的目的。控制方式如圖所示。



爲了進一步解決蒸汽機所推動的機械裝置的速度控制問題,1788年瓦特在系統中採用了離心式自動調速器。據估計,在19世紀中,僅英國就有7.5萬臺裝有瓦特調速器的蒸汽機裝置。我們又一次看到了反饋控制的神奇魅力。

有趣的是,我們人體本身幾乎處處都具有高速複雜控制能力的反饋控制系統。不知大家注意過沒有,人體在正常狀態下,無論春夏秋冬環境如何變化,都能保持體溫、血壓、血糖濃度、呼吸和心跳率基本恆定。大多數動物也具備這種功能。
反饋控制的概念還可以應用到更爲廣泛的領域,如教師講課時,在認真講授書中內容的同時,還密切觀察同學們的反應,並隨時提問,課後批改作業。這後面的三種方式就是爲了獲取反饋信息,以檢查同學們掌握教學內容的程度,並根據這些信息調整講授方法和進度,確保教學質量。

反饋機制對於人們的各種社會實踐活動也具有十分重要的意義。就拿企業管理來說吧,管理也是一種深奧的控制活動,必須緊緊抓住信息反饋這個關鍵環節。管理沒有信息反饋,只有上情下達,而無下情上達,就必然會脫離實際而出亂子,企業也會弄得一塌糊塗。同樣,對經營決策者來說,市場信息的反饋也是至關重要的,不注意市場需求變化而關起門來盲目生產的決策者,必然會導致企業虧損,甚至倒閉。

從上面的討論可以看出,信息概念和反饋思想是控制論的兩個基本出發點。



陀螺與航行自動控制



大家小時候可能都玩過陀螺,當你掌握了正確方法用鞭子抽打它幾下以後,它就會尖頂朝下豎起來,並繞其軸線旋轉而不傾倒。

可別小看陀螺這小玩意兒,人們正是根據其自旋不倒的原理而設計製造出了五花八門的精密陀螺儀,爲各種飛行器(如飛機)、導彈、人造衛星等)的飛行自動控制奠定了基礎。儘管陀螺儀的外表看起來與常見的陀螺不大一樣,其大小也不盡相同(如用在飛行儀器上的陀螺儀最輕者只有幾十克重,而一個穩定核潛艇的陀螺儀卻重達55噸),但是基本原理卻並無二致。

陀螺儀對於現代飛行控制系統來說可謂舉足輕重。它不僅對整個系統的工作起着決定性作用,而且它的精度高低、可靠性程度和使用壽命長短等指標,對飛行器的穩定性和精確性都有着至關重要的影響。

陀螺儀的最早應用領域是航海事業。19世紀人們廣泛利用陀螺儀標定航向,在漫長的航海史上寫下了新的一頁。從20世紀40年代開始,陀螺儀便在導彈武器及航空航天事業上得到廣泛應用,其穩定性和工作精度也隨着科學技術的進步和工藝水平的提高而迅速提高。目前陀螺儀已有滾珠軸承、氣浮、液浮、撓性、激光等類型。

陀螺儀在高速旋轉時,能夠抗拒任何外力和干擾的影響,保持其自轉軸相對於慣性空間方向上穩定不變。當飛行器的飛行姿態偏離了預定正確方向,陀螺儀在轉軸與飛行方向之間的夾角便發生了變化,飛行器上的檢測元件立刻就可測量出來,並同時發出控制信號,通過執行機構的作用使飛行器的狀態恢復正常。因此,這種自動控制系統也叫做“姿態穩定系統”。

陀螺自轉軸方向不變的原理除應用於導彈的制導和飛機姿態控制以外,在宇航技術中也同樣得到廣泛運用。例如陀螺儀用在人造衛星上,可以保證人造衛星不受外界干擾而穩定運行在預定軌道上。不論人造衛星繞地球轉到哪個位置或受其他什麼外界干擾,衛星上的陀螺儀始終是指向空間某一預定方向。

小小的玩具陀螺和精度日益提高的陀螺儀竟具有完全相同的原理,初看起來似乎覺得有點不可思議,其實這正是大千世界中存在的客觀規律。許多表面上看來非常簡單的東西,卻蘊藏着深奧的科學道理,關鍵在於我們杴迤潯局使媛桑傭貧緇嵯蚯胺⒄埂?
英國科學巨人牛頓從蘋果落地而不是飛向空中這樣一個司空見慣的現象中,發現了蘋果從樹上落到地上與其他行星繞太陽運行都遵循着同樣的法則——萬有引力定律,並且計算出了太陽系中各行星繞太陽旋轉的軌道和週期,一下子把幾百年來爭論不休的是“日心學說”正確還是“地心學說”正確的問題解釋得一清二楚。科技發展史表明,科學上許多原理和理論,常常是經過一段模糊時期後突然爲人們所認識。細心的讀者是否會從中得到什麼啓迪呢?



自動控制與電子戰爭



現代科學技術的發展,使電子技術在軍事上的應用日益普及。現代化的武器裝備,如大炮、坦克、飛機、軍艦、導彈等,都配有相應的雷達、通訊設備及紅外線或激光裝置。然而歷史的發展規律總是“有矛就有盾”。有了電子技術的應用,就會有電子技術上的鬥爭,這樣現代戰爭中就出現了一個嶄新的競爭領域——電子對抗和電子干擾,或叫做電子戰。

所謂電子對抗,是指敵對雙方利用電子設備和能夠反射、吸收電磁波的器材的電子鬥爭。電子對抗的歷史可以追溯到本世紀初。當無線電剛開始在軍事通信中應用時,以截獲和破譯敵方情報爲特徵的簡單的無線電通信對抗就萌芽了,並揭開了電子對抗的序幕。二次大戰以來,炮瞄雷達、導彈制導雷達和飛機截擊雷達相繼問世,大大提高了武器命中率。與此同時,圍繞着兵器控制與反控制展開了更激烈的電子對抗。

我們知道,雷達和無線電通信是現代社會當之無愧的“千里眼”和“順風耳”。而電子干擾卻能把敵人的“眼睛”和“耳朵”封住,使它們成爲“瞎子”和“聾子”,或者巧施妙計,使敵人上當受騙。比如,利用雷達干擾發射機作爲干擾源,可以發射或轉發某種電磁波來壓制敵方的電子設備,使它們無法正常工作。我們平時收看電視都有體會,如果附近有電子干擾(如汽車發動機或電焊機等工作時所產生的干擾),電視屏幕的畫面就會發生畸變,干擾越強,畫面畸變越厲害。同樣,當飛機或艦艇上的雷達接收機受到干擾壓制後,在雷達距離顯示器屏幕上會出現參差不齊的“茅草”。干擾電波的能量越大,“茅草”長得越高,把本應能夠發現的目標信號給掩蓋住了,因爲此時目標信號完全淹沒在干擾信號中了。而且,無線電通信設備受到強烈的電磁干擾後,耳機中充滿了雜亂刺耳的噪聲,也無法進行正常的通信聯絡。

另外一種電子對抗手段是欺騙性干擾。其原理是用干擾發射機或無線電臺巧妙地模仿敵方信號使敵人上當受騙。對雷達的欺騙性干擾,可使雷達在測定目標、方位、速度時產生錯誤,破壞雷達跟蹤或制導,使敵方火炮、導彈擊不中目標。無線電通信欺騙干擾還可以冒充敵臺通報、通話,攪亂敵方通信,達到以假亂真的目的。

電子干擾技術在第二次世界大戰中爲盟軍1944年6月在法國諾曼底登陸,並最終消滅德國法西斯軍隊立下了汗馬功勞。當時盟軍的具體作法是:

(1)將計就計,實施欺騙。納粹德軍統帥部曾武斷地認爲聯軍將在加萊地區登陸。英美聯軍將計就計,在多佛爾設置了一個假司令部電臺羣,不斷髮出內容適當的電報,故意泄密,造成聯軍將在加萊登陸的假象,使希特勒陷入圈套。

(2)嚴密偵察,挖睛掃障。英美聯軍對德軍部署在法國沿海一帶的雷達站、干擾站、警報臺和電臺進行嚴密偵察,並做到瞭如指掌。在登陸前夕,又派出轟炸機和戰鬥機進行大規模襲擊,摧毀了德軍所有的干擾臺和80%以上的雷達站,挖掉了德軍的“眼睛”,並保證了聯軍雷達和電臺的正常工作。

(3)巧佈疑陣,聲東擊西。登陸前夜,英美聯軍用一羣羣小船裝着角反射器,拖着塗鋁汽球等用於干擾的物體駛向加萊地區,使殘存無幾的德軍雷達誤將小船隊視爲大批飛機掩護下的大型進攻艦隊,牽制住了加萊地區的大量德軍,減少了聯軍在諾曼底登陸戰中的阻力。

(4)施放干擾,出奇制勝。登陸開始時,英美聯軍出動320架干擾飛機迷惑德軍殘存的雷達,掩護了飛向戰區的大批戰機。龐大的突擊艦隊始終隱蔽前進,只是在距登陸地點10海里時,因發動機響聲才被德軍發現,然而聯軍5個師20萬人的突擊部隊的登陸已是勢不可擋了。

60年代以來,還出現了一種反雷達導彈,是專門用來對付敵方雷達的導彈。其原理是利用敵方雷達發射的電磁波作引導,跟蹤其信號直搗老巢,最後摧毀敵方雷達站。反雷達導彈第一次出現在戰爭舞臺上是1965年,當時美國利用“百舌鳥”反雷達導彈,攻擊越南的高炮陣地。裝備“百舌鳥”導彈的飛機,一般先在地面防空高炮火力有效射程外盤旋,引誘敵方雷達開機搜索,然後捕捉其信號,再發射導彈予以摧毀。這種武器曾嚴重破壞了越南北方地面雷達系統。其後,在中東戰爭、英阿馬島戰爭、兩伊戰爭中,反雷達導彈都顯示了巨大的威力。



“最優化”思想



在日常生活中,我們都有這樣的經驗,無論幹什麼事都希望以最小的代價獲得最大的成功。例如上街購買東西時,我們總是挑那些質量好、外形最美觀、價格也便宜的商品;在學習上,我們喜歡掌握最好的學習方法,以便在最短的時間內取得最好的學習成績;在工作時,我們更願意用最輕鬆愉快的方式來取得最滿意的工作效果。這些看似平常的日常現象,其中包含了現代控制理論中的“最優化”思想。將上述這種“最優化”的觀點應用於工程實踐,便產生了在社會生活各個方面得到廣泛應用的最優控制技術。

最優控制理論的發展是伴隨着“最優化”概念的提出而開始的。在第二次大戰期間及以後的一段時間內,應戰爭和軍事防禦上的需要,以提高大炮發射命中率爲主要目標的自動控制系統(通常叫做伺服系統)的技術日臻完善。但是,隨着社會的發展,簡單的反饋控制已經難以滿足工程實踐的要求,傳統的系統設計方法也無法實現日漸增高的性能指標。在這種情況下,科學家們通過大量的研究,於50年代初提出了最優化的概念,並試圖對控制對象施加最優控制。但由於理論上尚不完善故未能真正實現。直到1960年前後,由於在控制理論中引入一系列新的研究方法和數學成果,推出了最優控制所必須滿足的必要的充分條件後,才使最優控制的應用逐漸普及,併成爲60年代自動控制領域的熱門課題。特別是空間技術的迅猛發展,更進一步推動了最優控制理論向前邁進。舉個例子來說,爲了使宇宙飛船登月艙能以最小的燃料在月球表面準確、平穩地實現“軟着陸”,即落到月球表面時的速度恰好爲零,以避免與月球表面發生碰撞而損壞艙內設備,必然選擇合適的控制方式來改變火箭發動機的推力。這就是所謂的“月球軟着陸”問題,也叫做“燃料最省控制問題。”

再舉一個例子:坐電梯。開關一按,哧溜一下就到了幾十層的大樓頂上。電梯省時省力,是現代科學和文明的產物。不過,應當怎樣來控制電梯的運動,使它能以最短的時間到達頂樓(或從樓上下到地面)地面呢?也許有人會說,這還不簡單,讓電梯始終以最快的速度直上(或直下)不就行了麼!其實仔細想一下就會發現這種控制方式是不行的。因爲當電梯以最大的速度衝向樓頂(或地面)時,必然會發生劇烈的碰撞而造成設置損壞甚至人員傷亡。因此必須運用科學分析的方法,制定合理可行的控制方案,既要保證電梯上升(或下降)的時間最短,又要讓它到達樓頂或地面時速度恰好爲零。這也是一個最優控制問題,我們稱之爲“時間最優控制問題”。

爲了解決各種各樣的最優控制問題,人們找到了許多方法,其中有兩種最有成效。一種是美國學者貝爾曼於1953~1957年間研究提出的“動態規劃”;另一種是前蘇聯學者龐特里亞金於1956~1958年間創立的“極大值原理”。



變色蜥蜴的啓示



“變色龍”,也叫“變色蜥蜴”,它能夠自動適應周圍環境的變化,隨時把皮膚顏色變成與它所附着的物體相同的顏色(俗稱保護色)。變色龍這種難能可貴的變色本領具有極好的僞裝效果,通常不會爲兇猛野獸識別,從而達到保護自己免受其天敵襲擊或吞食的目的。

我們人體本身也同樣具有適應外界環境變化的巨大能力。如人的體溫,無論酷暑嚴寒,總能保持在一個相對恆定的水平上。

人們從生物體具有自動適應外界環境變化的能力這種自然現象中受到了很大的啓發。如果人們設計的自動控制系統也能夠在外界條件發生變化時,仍然保持最優運行,豈不是美事一樁嗎?正是在這種思想支配下,人們提出了自適應控制(Adaptive Control)的概念。

前面我們已經介紹了,反饋控制的基本思想是利用系統輸入(受控量)與希望值之間的偏差來控制系統的行爲,使誤差趨近於零。但實際上,由於多數受控制對象的特性很難準確掌握,內部參數也隨環境而變化(如電阻會隨溫度變化),外界條件會隨時波動(如電壓波動),而且這些變化通常是無法預測的,所以,人們在對原系統進行控制的過程中,該系統的特性實際上已經發生了不同程度的變化。事先確定的最優控制在內部參數和外部環境變化後,可能已不再是最優方案了,因此只有設計一種隨內部參數和外部環境變化而自動調整系統特性的控制方式,才能保證控制系統始終處於或接近最優運行狀態,這種系統就是自適應控制系統,具有自適應能力的控制器叫做自適應控制器。

自適應控制的設想,最先是由考德威爾(W.1.Caldwell)於1950年提出來的。1958年美國麻省理工學院的懷特克(H.P.Whitaker)教授首先應用自適應控制方法設計了飛機自適應自動駕駛儀。

自適應控制系統的兩個基本功能是:①能夠自動檢測和分析受控對象的特性以及系統所處環境的變化;②能夠根據從環境和系統內部檢測到的信息得出決策,適當改變系統的結構或參數以及控制策略,以保護系統在任何情況下都能穩定和最優運行。要實現這兩種功能,顯然必須進行大量的複雜計算和推斷,所以自適應控制系統離不開現代社會的“天之驕子”——電子計算機的幫助。可以說,沒有電子計算機的參與,要實現系統的自適應控制是不可能的,正如“巧婦難爲無米之炊”。

如前所述,飛行器的控制是較早應用自適應控制技術的。大家知道,飛行器飛行的高度和速度會隨着高空中雲層、氣流等環境的改變而發生劇烈變化,飛行器的動力學參數也會產生較大波動,依靠常規的反饋控制往往難以獲得令人滿意的控制精度。現在,採用帶電腦的自適應控制系統可以實現良好的飛行。此外,大型船舶的自動駕駛儀是自適應控制技術成功應用的典型範例。

海上航行,環境複雜,氣候多變,隨時會出現一些意想不到的情況,如海浪、海潮、颱風等。採用船舶自適應駕駛儀後,則可以克服風、流、浪、水域深度、船舶裝載重量及其他不可預見的因素對船舶操縱性能的影響,確保船舶在各種環境條件下能量消耗最小,並安全準確地航行。目前,瑞典、日本和英美等國已生產出許多性能良好的產品投放市場。由於採用這種自適應駕駛儀後,航速可提高1%,估計每條遠洋輪船可節省燃油3%,因此具有明顯的經濟效益和社會效益。

在醫院,當有重病患者需急診搶救時,往往要對患者進行長時間的輸液治療,這對醫護人員是一個很重的負擔。日夜值班守護,一時疏忽就可能釀成重大事故。但如果採用自適應監護系統,就可以日夜不間斷地監測病人的脈搏和心電圖,及時獲得病情信息,並根據病人病情變化自動調整輸液量。這樣不但減輕醫護人員的工作負擔,還可明顯提高治療效果。

此外,自適應控制技術還廣泛應用於工業、農業、石油勘探與開發、資源分配、宏觀經濟調控等各個部門。

自適應控制系統的進一步發展,將走向所謂“自學習”、“自組織”和“智能控制”系統。這些系統除具備一般自適應功能外,還能夠自動記憶本系統過去的經驗和教訓,回憶過去曾經發生的情況,並基於這些信息改進系統的自適應功能。或許在不遠的將來,通過讀者朋友們的辛勤勞動和創造,在自動控制領域內將產生更加驚人的突破。



“黑箱”問題



今天,人們在許多科學研究領域,都可以碰到“黑箱”這一概念,但它並不是指一隻真正的黑色箱子,而是控制論中的一個重要概念。作爲一種近代科學方法,黑箱方法已越來越受到人們重視,並且與現代科學技術手段聯繫在一起,廣泛應用於社會生活實踐中。

1945年,控制論的創始人維納在一篇文章中寫道:“所有的科學問題都是作爲‘閉盒’問題開始的”,“若干可供選擇的結構被密封在‘閉盒’中,研究它們的唯一途徑是利用閉盒的輸入和輸出。”維納所說的閉盒,也就是我們今天所說的黑箱。

到底什麼是“黑箱”呢?粗略地說,所謂黑箱是指它的內部構造和機理還不清楚,但可以通過外部觀測和試驗來認識它的功能和特徵。在現實生活中,許多客觀事物,當人們還不可能,或客觀條件不允許深入解剖其內部細節(因而無法詳細瞭解其內部結構和特徵),都可以把它看做是黑箱。爲了讓讀者對黑箱概念有個形象化的認識,我們先從“大腦之謎”說起。

“大腦之謎”,也叫做“身心問題”,在科學研究史上是一個長期以來沒有得到圓滿解答的難題,無數科學家和哲學家傾注了畢生的心血進行過深入探討和研究,提出了種種假設和理論。思維究竟是怎樣從物質中產生出來的?大腦功能的具體活動機制又是什麼?要解答這一系列問題可不是一件容易的事。人們可以用物理上的分割法,研究物質的結構和屬性;也可以用化學分解和合成的方法來了解不同物質的成分。但這些方法,對研究大腦的思維功能卻是鞭長莫及的,因爲即使按這些方法的要求,將大腦打開,解剖分析,也只能是對失去思維功能的大腦物質的認識。這樣,在科學研究面前,大腦的思維過程就是一個只見其外觀和表現,而無法深入其內在瞭解其機制的難題。它就像一個不能打開的箱子一樣,裏面的一切對於我們來說都是黑乎乎的,一無所知。

在高能物理中,就有如下一個事實:當物質被高度分割後,就會出現不能再分割的微粒,這時人們只能藉助科學儀器來觀察其行爲,而無法再通過分割來了解其內部結構。對於這類問題,必須開闢新的研究途徑。幸好控制論中提出的黑箱研究方法,爲我們研究這類問題提供了可能。

所謂黑箱方法,指的是當一個系統內部結構不清楚時,利用外部觀察和試驗方法,獲得系統(即黑箱)的輸入——輸出特性;再根據這種信息,在不打開“黑箱”的情況下,研究其功能和屬性,探索其構造和機理的一種科學方法。人們常說“知人知面不知心”。如果說人相當於一個黑箱的話,那麼我們可以通過“聽其言,觀其行”而“知其心”,這是一種行爲分析的方法。

黑箱方法的道理並不神祕,在我們的日常生活中,人們都在自覺或不自覺地運用這種方法。比如說看電視,如果說看電視必須要懂得電視內部結構和工作原理才行,那恐怕能看電視的人就不會很多了。然而,人們雖然不懂得電視機內部構造和機理,卻知道按哪個開關打開它,調整哪些開關可以得到清晰穩定的畫面效果,什麼情況是出了故障,等等。這些都是我們運用黑箱方法的具體體現。不過黑箱方法最典型的應用是中醫看病。中醫看病,主要是通過“望、聞、問、切”等外部觀察作出診斷,開方抓藥。有時遇到疑難雜症沒有把握時,可以先投以試探性的藥物,觀察病人的反應,並隨時增減藥物,觀其療效,一旦抓住病症就大膽對症下藥。這種從人體的輸入特徵入手,實施“辯證論治”的方法正是黑箱方法的精髓所在。上面所舉的例子,主要是讓讀者對黑箱方法有個基本的認識,但是控制論的黑箱方法,作爲一種科學研究方法,具有自己的特點和獨特表達方式。隨着科學技術不斷髮展,對系統進行動態觀測的黑箱方法,已發展成爲現代控制理論的一個重要分支——系統辨識。辨識,指的是通過外部觀測系統得到系統的輸入-輸出數據,然後用數學方法確定系統的結構和參數,求得定量描述系統動態特性的數學模型,並在此基礎上,實現對系統的最優控制。



“人獅搏鬥”中的控制論思想



意大利古羅馬鬥獸場內,座無虛席、人聲鼎沸,一場殘酷的人獅角逐正在這裏進行。只見“獸中之王”大吼一聲,猛地一撲,向角鬥士直撲過來,而那位健壯剛強的小夥子卻敏捷的閃開了……奴隸主們注視着這一驚險紛呈的場面,不由得大聲叫喊起來,或者得意忘形,或者懊喪至極。原來,他們正在進行一場奇導的賭博,而且下了一筆可觀的賭注呢!

在這場雄獅與奴隸的生死搏鬥中,獅子總想盡早撲住對手美餐一頓,而人則要設法躲避求得安寧。這是一場驚心動魄、扣人心絃的角鬥。但是,誰又能料到,在這場事件背後竟然蘊含着深奧的對策論的樸素思想呢?

拿活生生的人去與殘忍的雄獅角鬥取樂,這在世界文明的今天是不可思議的,然面在古羅馬的奴隸制社會卻是司空見慣。假如您讀過小說《斯巴達克思》的話,您就會不以爲怪了。

對抗的雙方都要運用自己的聰明才智,充分發揮自身的優勢,儘量利用對方的弱點,選擇最優策略,最終戰勝對方。對策論就是一門利用數學的觀點和方法研究競爭或鬥爭現象中,是否存在一方戰勝另一方的最優策略以及如何制定最優策略的科學。由於我國古代把下棋玩牌這類活動叫做博奕,所以對策論又叫博奕論。

對策論的相互思想還可以追溯到公元前若干世紀。其中我國古代田忌賽馬的故事已成爲膾炙人口的對策問題的範例。這個故事給我們這樣一個啓發:只要策略得當,實力並不是取勝的唯一因素。這也深刻地反映了對策的極端重要性。

對策論雖然淵源久遠,但它真正成爲一門獨立的學科,還是1944年數學家馮·諾依曼和經濟學家摩根斯坦合著的《對策論與經濟行爲》一書出版以後的事。而該書則被認爲是對策論發展的一塊里程碑。馮·諾依曼不僅創立了對策論,他還是電子計算機的奠基人。1946年以後,由於電子計算機的發明和應用,大大簡化了對策論中的複雜計算,才使對策論不再僅僅是紙上談兵了。進人60年代,對策論與最優控制相互滲透,使對策論得到了長足的發展。

在對策論發展的基礎上,美國的依薩克斯博士通過對軍事上追逃問題的深入研究,開創了微分對策的研究工作,提出在追逃問題中,追逃雙方都能自由決策的新的對策,即微分對策理論。

形形色色的對策現象,一般都具有三個最基本的要素:(1)局中人。具有決策權的參與對策的各方叫做局中人。局中人既可以理解成個人(如獅子與奴隸、齊王與田忌等),也可以理解成集體(如參加比賽的球隊)。從人類與大自然進行鬥爭的角度理解,也可以把大自然作爲局中人,同時把那些得失一致的參加者看作是一個局中人。(2)策略集。對策過程中每個局中人可以採取的方案稱爲該局中人的策略。一個局中人可能採取的所有策略則稱爲他的策略集。(3)得失函數。一局對策結束之後,每個局中人都有自己的得與失,它與各局中人所採取的策略有關,故稱爲得失函數。

只有兩個局中人的對策叫二人對策,三人以上叫多人對策。在二人對策中,如果勝者之所得就是負者之所失,雙方得失之和爲零,則稱此種對策爲二人零和對策。實際生活中許多問題都可以歸結爲二人零和對策問題,如人獅之鬥、田忌賽馬及各種追蹤問題。如果對策各方得失之和大於零,即是互相協助、合作的,則稱這種對策爲合作對策。

對策論的應用很廣,尤其是作爲新一代更復雜的微分對策理論,由於與控制理論特別是最優控制理論緊密相聯,已經能夠解決許多實際問題,在軍事部署、自動控制、海洋捕撈、農業抗災、貿易競爭、外交談判、疾病醫治以及各種體育比賽中被廣泛應用。進入70年代後,對策論更加向縱深發展。如模糊數學是新近發展起來的一個數學分支,在對策論中也得到了應用。藉助模糊數學,可開闢對策論研究的新領域,用以探討如周圍環境、對策策略、合作關係等在模糊情況下的對策問題。

毋庸諱言,對策論,尤其是微分對策理論,畢竟還只是一門年輕的科學,其理論和應用不論在廣度或是深度方面都有許多問題,等待着廣大有識之士去開墾、去發掘、去探討。相信在不遠的將來,在對策論這片土地上,會綻開更多、更美的花朵。
 
發佈了28 篇原創文章 · 獲贊 0 · 訪問量 4萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章