情報領域因果推理智能項目概覽:以DAPAR爲例

美國國防高級研究計劃局(Defense Advanced Research Projects Agency),簡稱DARPA,提出了旨在從推進人工智能常識推理能力發展、深化機器學習理論研究和推進國防部複雜問題中應用人工智能、深化美軍對人工智能的研究和應用的“的下一代人工智能”計劃。具體包括有:知識導向的“人工智能推理圖譜”(KAIROS )、“世界建模者”(World Modelers )、“大機制”(Big Mechanism )、“複雜作戰環境中的因果探索”(Causal Exploration )、“不同來源主動闡釋”(AIDA )、“數據驅動的模型發現”(D3M )、“不完全信息博弈複雜軍事決策中的串行交互”(SI3-CMD )等,這些項目旨在自動化地利用呈指數增長的數據信息,將複雜系統的建模與推理相結合,從而輔助國防部快速認識、理解甚至是預測複雜國際和軍事環境中的重要事件。

本期圍繞“情報領域因果推理智能項目”這一主題,選擇“複雜作戰環境中的因果探索”(Causal Exploration )、不同來源主動闡釋”(AIDA )、知識導向的“人工智能推理圖譜”(KAIROS )三個項目展開調研,從而加強對情報領域因果推理的認識。

一、Causal Exploration:

複雜作戰環境中的因果探索項目

美國印太司令部與DARPA合作開展了一個名爲“因果探索”的人工智能項目。該項目旨在 “建立一種工具,利用人工智能來增強機器所擅長的研究大量數據和模式識別等工作的效能並將其與人類相結合,允許人類發揮特有的專長,如提出新想法等。”DARPA網站稱,該項目旨在建立一個“建模平臺,以幫助軍事規劃者理解和解決導致複雜衝突局勢的潛在因果因素。”這一工作,能夠揭露出敵方防禦的弱點,甚至是致命的漏洞。這些弱點可能是雷達覆蓋的漏洞、關鍵防禦系統的軟件漏洞、機動中的空檔,或者是敵方沒有意識到、但可能通過大量的雷達數據和其他數據暴露出來的其他漏洞。

1、項目研究目標
該項目旨在開發一個建模平臺,用於幫助軍事規劃者理解和解決導致區域混合衝突的潛在原因。平臺具有以下根據作戰環境(OE)快速創建和維護因果模型;探索影響作戰環境的因果動力學;深入全面地瞭解作戰環境等功能。該項目的成果可直接用於支持並告知規劃工作,以解決由政治、種族或宗教緊張等因素主導的複雜人類層面的衝突、低強度衝突、經濟侵略、或網絡恐嚇。

2、項目研究構成
該項目在技術構成上涉及“知識組織”、“因果模型裝配”、“人機交互”、“模型評估”以及“系統集成”幾個研究內容。

在這裏插入圖片描述
首先,在知識組織階段,需要操作多種多樣的異構和語義多樣的文本及數字信息源,具體包括:軍事和情報文件(如情報報告、作戰評估、軍事信息)、開源文本(如新聞媒體、基於Web的內容)、政府或非政府組織數據(如人口統計和經濟等報告和數據庫分析),以此作爲輸入源,提取出有關實體(參與者、條件、事件等)和關係的知識,並將實體和關係映射到公共本體中。這個階段存在包括廣泛變化的源材料、源信息的偏差或不可靠性、不符合清晰句法模式的因果關係、對因果關係特徵(如置信度、強度、延遲)的一致估計等在內的多個挑戰。

其次,在因果模型裝配階段,需要從知識組織階段輸出的數據集(以及可能的其他來源,如編碼專家知識)中匯編出來一個因果整合模),並識別出因果整合模式的缺陷和差異,以便進一步整合人的輸入從而修改或增強因果整合並整合新知識,從而實現最終的更新或完善。

最後,在人機交互階段,一方面需要使具有不同經驗和專業知識的用戶能夠與建好的因果整合模式進行互動,以建立理解;提供捕獲因果整合模式的結果以及用戶上下文的技術,產生靈活和動態產品。另一方面,還需要提供直觀的探索功能,以幫助用戶發現潛在的原因並評估潛在的方法,並使用戶能夠操作ICM結構、執行計算、可視化和簡要的結果。

3、項目應用
該項目的定位爲一個建模平臺,以幫助軍事規劃者理解和解決導致複雜衝突局勢的潛在因果因素,典型地的應用於以區域混合衝突爲例的場景挖掘。

1)給定一個衝突實例:“尼日爾三角洲爆發了危機,武裝分子佔領了油田和沿海地區,並與有組織犯罪集團聯手攻擊海灣的航運”“)。

2)獲取相應數據:獲取軍事和情報(作戰評估、軍事信息、情報報告)、政府和非政府組織數據(人口/經濟報告和數據庫)以及開源(公開信息,包括基於文本的新聞媒體、基於Web的內容、社交媒體)。

3)自動提取相關知識:實體知識:尼日利亞政府、尼日利亞安全部隊、尼日爾三角洲人口、石油公司、犯罪集團、武裝分子、博科聖地;條件、事件和趨勢:濫用安全部隊、人民支持武裝分子;因果關係的識別:濫用安全部隊增加了對武裝分子的人口支持;領域本體的定製:博科聖地—恐怖分子—非國家軍事演員—武裝分子民兵組織—武裝分子。

4)半自動因果模型裝配:將提取到的各項知識進行組織。
在這裏插入圖片描述

二、Active Interpretation of Disparate Alternatives (AIDA)

主動解釋不同替代方案

近年來,信息的複雜性已超出分析師從各種信息源蒐集有價值信息的能力,這些信息樣式各異,是結構數據和非結構數據的混合體,從軍事情報到社交媒體,包含準確和不準確的消息。而對於那些力圖理解世界大事的人,沒有由其他媒體提供的信息作爲參考,經常獨立分析來自各個媒體的信息是有挑戰的。經常出現的情況是,各個獨立的分析會導致僅僅只有一種解釋,而由於缺少證據,沒有備選的解釋,甚至缺少那些可以反駁那些可能選項的證據。通常在後續的分析過程中,當這些獨立的、無力的分析被放在一起,結果會是單一的表象的認識,而不是一個真正的認識。

因此,DARPA通過開發“對不同方案的主動解釋”(Active Interpretation of Disparate Alternatives,AIDA)項目,試圖克服今天數據環境的混亂、矛盾和潛在的欺騙性。AIDA項目的目標是開發一種多重假設“語義引擎”,這種“引擎”根據從廣泛渠道獲得的數據,生成對真實事件、現狀和趨勢的解釋。

該項目旨在創造一種新技術,這種技術能夠自動聚集和掃描多個媒體的碎片信息,將這些信息轉化爲常用表述或故事情節,然後生成關於事件、現狀和趨勢的本質和含義的多種假設。AIDA可以幫助分析員和軍隊決策者改善他們的分析,以便他們更能同更大更完整的整體語境相一致,並且能獲得對塑造我們世界的元素和力量的更加透徹的理解。AIDA提供對趨勢和事件的更好理解,清除出不相干的和不可靠的數據。

1、項目研究目標
主動解釋不同替代方案(AIDA)的目標是開發一個多假設語義引擎,從各種非結構化來源生成事件、情況和趨勢的明確替代解釋,用於嘈雜、衝突和潛在的欺騙性信息環境。

首先,該引擎必須能夠將從多個媒體源自動派生的知識元素映射到公共語義表示,聚合從這些媒體源派生的信息,並生成和探索有關事件、情況和感興趣趨勢的多個假設,並能夠根據分析的準確性和每個假設的語義表示的一致性,爲派生知識和假設建立置信度量。

其次,該引擎還必須能夠利用公共語義表示中的知識和生成的假設作爲媒體分析算法的替代上下文,通過改變它們的模型或先驗概率來提高準確性,並根據上下文的期望解決歧義。

最後,該語義引擎還需要能夠與用戶通信,以揭示生成的假設,並允許用戶更改假設或建議新的假設。

2、項目研究構成
該項目最終定位爲一個多假設語義引擎,這個引擎主要包括映射和反饋(Semantic Mapping and Feedback)、公共語義表示(Common Semantic Representation)、多重假設(Multiple Hypotheses)、集成和多重解釋(Integration and Multiple Interpretations)等主要組成部分。
在這裏插入圖片描述

首先,在語義映射和反饋階段,需要解決本項目的核心部分,即利用現有分析算法從所有可用媒體中提取知識元素,並將這些信息映射到定義的公共語義表示語言中。這一階段的主要輸入包括各種類型的文本、語音、圖像、視頻及其相關元數據流。通過分析每個輸入的信息項,最終生成出一組關於該信息項中可觀察到的事件、子事件或動作、實體、關係、位置、時間和情感的結構化表示。除了出處記錄外,表示的每個知識元素(包括互排斥的知識要素)都需要有一個與之相關的置信度度量。

其次,在公共語義表示階段,需要重點研究和開發一種新的通用語義表示,使人和計算機都可讀。將輸入的結構化且具有置信度量知識元素,用通用語義表示語言表示,並形成一個體系化的知識庫。另外,在多重假設階段,需要在知識庫中以公共語義表示的方式組裝信息,從而形成一個或多個內部一致的假設,其中的每個假設都應該捕獲一個內部一致的世界模型,通過對輸入數據的某些子集的解釋,進而估計和傳播不確定性。

最後,集成和多重假設階段,需要開發出一個能夠接受各種數據流的原型,該原型必須能夠實現通過探測知識庫、顯示假設、向系統提交查詢、編輯知識庫或假設中的知識元素,以及向計算的任何階段注入額外的“假設”來管理用戶交互。

三 Knowledge-directed Artificial Intelligence Reasoning Over Schemas(KAIROS)

知識導向的人工智能推理模式

迅速理解世界事件對於爲美國國家安全工作提供信息至關重要。這些自然界或人類社會中值得注意的變化可以對事件本身產生重大影響,或者可能構成產生更廣泛影響的因果鏈的一部分。許多事件不是簡單的事件,而是複雜的現象,它們是由許多附屬元素組成的網絡:包括從參與者到時間線,然而,越來越多的非結構化多媒體信息阻礙了對這些事件及其基本潛在要素的揭示和理解。

因此,美國國防部希望利用人工智能技術在日益複雜的全球環境中更好地追蹤、分析各地的重要事件。在這一需求的驅動下,DARPA啓動了“知識導向人工智能推理圖譜”(KAIROS)項目,計劃利用人工智能技術分析多媒體中的信息,理解世界各地發生的事件,旨在通過開發能夠對現實世界事件進行上下文和時間推理的人工智能技術,從看似無關的事件中,分析發現事件之間的關聯性。

1、研究目標
知識導向的人工智能推理模式這一系統旨在實現一個基於模式的人工智能系統,能夠根據事件的上下文和時間推理,產生對複雜現實世界事件的可操作理解,並預測它們將如何展開。該系統可以篩選每天產生的無數事件和媒體片段,並識別其中任何連接或敘述的線索,識別和繪製事件或數據之間的相關性。

2、項目研究內容
該項目大體上分成兩個階段:在第一階段,開發一種半自動化系統,能夠識別和繪製看似無關的事件或數據之間的相關性,以幫助我們瞭解或創建關於我們周圍世界的通用描述;第二階段,將系統用於分析複雜的現實世界數據,並嘗試根據創建的模式提取事件和敘述。
在這裏插入圖片描述
第一階段關注通過基於語言學推斷和常識推理的檢測、分類、匯聚,從海量數據中形成事件模式,參與這個階段的研究人員將運用歸納、綜合和特殊化的流程來幫助形成可描述簡單和複雜事件的模式,然後再將多個圖式串列使用來提取諸如“角色”、“事件”這樣的關鍵語境因素,並運用專業領域知識針對特定需求定製分析過程。

第二階段關注將形成於第一個階段的圖式庫應用到多媒體、多語言信息中去,以發現和提取複雜事件,這個階段的研究將致力於識別事件、實體等因素之間的關聯關係,以幫助人工智能系統形成和擴展其知識庫。

在系統構成上,該項目包括事件模式的生成(Generation of Schemas for Events)、時間知識和模式的表示和使用(Representation and Use of Temporal Knowledge and Schemas)、系統集成和用戶界面 (System Integration and User Interface)等模塊。

在這裏插入圖片描述
首先,在事件模式的生成階段,需要根據輔助元素、參數及時間和順序信息分析複雜事件,以組成和概括事件模式。其輸入數據包括多媒體、多語言批處理數據,要求輸出表示事件及其輔助元素結構的模式,事件如何演變,輔助元素的典型持續時間和順序是什麼。
在這裏插入圖片描述

其次,在時間事件模式的生成階段,該階段以來自多媒體、多語言流作爲輸入,以事件模式的生成階段中開發的模式,實現運行時使用的知識庫。知識庫中具體包含有關運行時數據中實例化模式的信息、與模式相關的所有事件和參與者,以及事件元素和參與者的時間關係,並能夠基於模式進行可能後續事件預測。

最後,在系統集成和用戶界面階段,需要設計一個平臺,該平臺以多媒體或語料庫作爲輸入,並允許所有系統組件與一個界面通信,該界面允許用戶查詢系統並控制可視化模塊。該模塊以來自事件模式的生成階段和在時事件模式的生成階段的算法、流模式或語料庫中的數據作爲輸入,實現數據之間的傳遞。不僅需要讓事件模式的生成階段構建的模式庫能夠被時間事件模式的生成訪問,還允許用戶與時間事件模式的生成算法之間進行讀取、編輯或可視化的接口。

四 總結

因果邏輯挖掘與推理,在情報領域扮演着越來越爲重要的角色。DARPA所提出的Causal Exploration(複雜作戰環境中的因果探索項目)、Active Interpretation of Disparate Alternatives (AIDA):主動解釋不同替代方案)、Knowledge-directed Artificial Intelligence Reasoning Over Schemas(KAIROS:知識導向的人工智能推理模式)都從不同的角度出發,對這一技術進行了研究和探索。本文簡要地從研究目標和研究內容兩個方面進行了簡要介紹。

類似地,從2018年開始至今,數據地平線對以“事件”爲核心的應用型技術、因果邏輯挖掘和可解釋性推理進行了探索和實踐,並在此期間陸續發佈了多項成果,包括:

1、“學跡”:大規模實時事理學習與搜索系統。該系統積累了數千萬因果邏輯、事件描述邏輯與數十萬產業鏈邏輯,爲推理奠定了推理基礎。

2、“數地工場”:NLP領域技術綜合開放平臺。該平臺奠定了因果邏輯、事件挖掘實現的基礎。

3、“投研雲圖”:集投資邏輯管理、多維數據輔證、實時輿情監控的智能投研工具。基於該系統可以完成邏輯的管理、自建、多維信息關聯與監測。

4、“事理圖譜Demo”:投資邏輯展示及檢索平臺。基於該平臺,可以搜索和查閱既定事件背後的因果邏輯網絡。

與金融領域一樣,情報領域對事件、事理邏輯相關技術和應用有着很大的需求,接下來,我們將逐步開展面向情報領域的事件挖掘和分析,歡迎感興趣的朋友們關注這項工作。

五、關於我們

If any question about the project or me ,see https://liuhuanyong.github.io/

如有自然語言處理、知識圖譜、事理圖譜、社會計算、語言資源建設等問題或合作,可聯繫我:
1、我的github項目介紹:https://liuhuanyong.github.io
2、我的csdn博客:https://blog.csdn.net/lhy2014
3、about me:劉煥勇,中國科學院軟件研究所,[email protected]

參考文獻
[1].https://www.ldc.upenn.edu/collaborations/current-projects
[2].https://www.sohu.com/a/385563257_613206
[3].https://www.federalgrants.com/Active-Interpretation-of-Disparate-Alternatives-AIDA-64580.html
[4].https://www.darpa.mil/news-events/2019-01-04
[5].https://m.sohu.com/a/132637014_465915
[6].https://www.darpa.mil

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章