不是隻有數字化水平高,纔可以落地知識圖譜

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"blockquote","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"中國計算機界一年一度的頂級盛會 —— "},{"type":"link","attrs":{"href":"https:\/\/cncc.ccf.org.cn\/web\/html15\/index.html?globalId=m8271748750546083841617255458379&type=1","title":"xxx","type":null},"content":[{"type":"text","text":"CNCC2021( 中國計算機大會)"}]},{"type":"text","text":"將於 12月16-18日在深圳拉開帷幕。InfoQ極客傳媒已正式成爲CNCC2021的戰略合作媒體。作爲合作的一部分,《InfoQ大咖說》與CCF聯合推出了高端訪談欄目《技術風雲 | 對話CNCC》。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"《技術風雲 | 對話CNCC》高端訪談欄目將以直播對話的形式,從縱覽計算機發展的視角出發,特邀來自CNCC2021的頂尖專家學者、科技企業的技術領袖,圍繞AI、數字化轉型、計算+ 、雲計算、開源、芯片等前沿技術展開廣泛探討,帶來學術、技術、產業等全方位的深度解讀,推動計算領域創新技術更廣泛的傳播、討論和變革,幫助IT從業者開闊視野,緊跟時代。"}]}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"人工智能的發展可分爲感知智能、認知智能和行動智能三個階段。當下行業正處於認知智能的起步階段,而從感知智能到認知智能的過程中,知識圖譜是關鍵技術之一。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"10月27日,InfoQ和 CCF 聯合推出的大咖說欄目《技術風雲 | 對話CNCC》第5期直播開播。本期大咖說,我們邀請到了中文開放知識圖譜聯盟OpenKG創始人、CCF術語工委副主任,也是CNCC 2021的講者——王昊奮老師 ,來跟我們聊聊知識圖譜如何爲應用場景提供技術賦能,以及如何賦能數字化轉型。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"以下內容節選自"},{"type":"link","attrs":{"href":"https:\/\/www.infoq.cn\/video\/M8RpStpSqebHpGAx7kgK?utm_source=home_video&utm_medium=video","title":"","type":null},"content":[{"type":"text","text":"當天的分享"}]},{"type":"text","text":",InfoQ 做了不改變原意的編輯:"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"InfoQ:首先請您跟大家做一下自我介紹,包括您的職業經歷、您一直以來研究哪些領域等等。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"王昊奮:"},{"type":"text","text":"我從事人工智能行業,尤其是自然語言處理和知識圖譜相關的研究,待過高校和創業公司(AI獨角獸),此前在狗尾草科技和樂言兩家公司擔任過CTO,構建了全球第一個虛擬偶像、以及應用面最廣的電商智能客服系統,當中使用了大量的知識圖譜的相關技術。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"目前在同濟大學擔任教授職務,希望將知識圖譜和數字化轉型結合起來做一些賦能的工作,尤其是城市數字化轉型和企業數字化轉型結合,所以今天非常榮幸可以在這邊跟大家做相關分享。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在中國計算機協會里我擔任CCF上海執委,以及CCF術語工委副主任,術語工委這邊主要是協助劉挺教授來開展術語的收集、翻譯、釋義和審定相關工作,也是知識圖譜興趣小組SIGKG主席。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"InfoQ:我們今天的主題是知識圖譜如何賦能數字化轉型,首先想請王老師給我們介紹一下什麼是知識圖譜?知識圖譜中的知識,從哪裏來?"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"王昊奮:"},{"type":"text","text":"這是非常基本且重要的問題,知識圖譜這個概念是2012年由谷歌率先提出。而在這之前,在上個世紀,像語義網絡、語義萬維網都可以認爲是知識圖譜的前身。知識圖譜包含兩個詞——知識、圖譜,可以理解爲是用圖結構的形式去關聯各種各樣的知識,相當於是對萬物知識化以及互聯。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"圖譜有結點和邊,我們可以將各種對象、事件對應到結點,將屬性、關係等等對應到邊,這樣就形成了諸如包括人物圖譜,興趣圖譜,還有企業產業鏈圖譜、醫療疾病和症狀關聯圖譜等等,形成各種垂直領域和通用領域的知識圖譜。既然知識圖譜是由谷歌率先提出的,所以早期的應用主要集中在如搜索、推薦、問答等互聯網2C應用中,之後才慢慢發展到滲透進各行各業當中,形成更加廣闊的領域行業2B輔助決策類智能應用。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"知識圖譜的知識可以來源於各個方面,比如業務系統,也可以來自文本、圖像、語音等各種各樣的多模態的數據,甚至說可以來自知識衆包,來自傳感器,或者物聯網所產生的各種數據。任何數據都可以去做相應的“知識化”,形成某種圖結構,構建出我們想要的知識圖譜,下游就包含我剛剛提到的各種應用。所以知識圖譜是普適性非常強、並且在人工智能的發展過程中屬於認知智能階段的核心技術。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"InfoQ:能否請您結合知識圖譜的發展歷程,說說現階段知識圖譜的發展情況如何?"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"王昊奮:"},{"type":"text","text":"知識圖譜第一階段,我們稱之爲叫專家系統,是伴隨着第一次人工智能熱潮而來的,有一位圖靈獎獲得者叫Edward Feigenbaum,他曾經說知識是AI系統的力量(Knowledge is the power in AI system)。第二階段慢慢經歷了對於大規模知識的發佈和知識之間的互聯,形成了語義萬維網;第三階段就是現階段,知識圖譜和深度學習進行更緊密的結合,千萬事物都可以進行“表示學習”,我們可以將一些符號系統、和本身所對應到的機器更擅長的一些神經系統結合起來,從而去創造出一些既可學習、又可解釋、又可讓人可以理解的新型的大規模知識圖譜,可以理解爲就是知識圖譜。現階段的第三代知識圖譜相當於在深度學習時代中發展,自動化程度更高、智能化程度更高、以及規模更大的知識工程。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"InfoQ:關於今天這個主題,知識圖譜怎麼賦能數字化轉型,對企業來說,之前也有傳統 BI(商業智能)、知識庫,爲什麼現在會越來越多的企業開始使用知識圖譜呢?"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"王昊奮:"},{"type":"text","text":"傳統的知識庫就像前面講到的,它是利用領域專家的知識而做的專家系統,問題在於規模比較小。大部分知識都是需要去做手動的加工和處理,這勢必導致構建成本相對高、週期長,不太利於大數據時代的新型應用的產生。我現在講的知識圖譜結合了包括自然語言處理、深度學習、信息檢索,也包括數據庫等各方面的技術,使得自動化程度變得更高,規模也更大,那麼在降本增效方面就做得比較好,既能保持原來知識庫所具備的權威性和質量高的特點,同時可以部分解放專家,使得我們可以追求更大規模的知識庫的生產,以及將數據背後的知識價值不斷延伸,去賦能更多領域。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"當然它和BI並不是相矛盾的,兩者是相輔相成的,我們也可以基於知識圖譜來做很多BI操作,但是傳統BI更多的是一些統計和簡單的數值分析。在知識圖譜裏,因爲知識本身還具有一定的推理能力,也就相當於我可以從現有的知識去找到它所蘊含的知識,除了傳統的描述性的統計之外,還可以得到更多的洞見,甚至對未來的規律做出分析和預判,這就相當於賦能了傳統的BI,讓它變得更高級,比如說預測性BI、交互式BI、或者增強型BI這類新的技術領域。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"InfoQ:降本增效應該是比較關鍵的作用,能否結合一些實踐案例說說,您認爲知識圖譜是如何賦能企業數字化轉型?"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"王昊奮:"},{"type":"text","text":"降本增效並不僅僅是說知識圖譜,對於任何的AI技術,它都是一種降本增效的手段。知識圖譜更多地充當“大腦”的角色,是在認知智能和決策智能當中起更大的作用,那麼結合數字化轉型來說,對於特定的一些領域,比如金融,特別是銀行當中,它需要去做很多的風控和反洗錢檢測工作,現在反洗錢越來越多,這並不是個性行爲,更多的是團體行爲,它的隱祕性比較強,而且需要去做實時性更強的判斷,那麼知識圖譜就可以賦能我們去將各種各樣的多源異構的信息去做相應的整合,避免形成信息孤島,產生決策失誤。或者可以說它是一個“漏檢”過程,能夠快速檢測出原來傳統技術所不能方便地檢測出來的東西。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"另外還有醫療方面,現在AI輔助製藥非常火,這裏面很重要的一點是能不能快速去閱讀大量的醫療文件,或者專利,並且結合已經瞭解到的基因庫、蛋白庫和一些交互作用,快速對藥物進行靶標識別、基因篩選,甚至是在醫療臨牀診斷過程當中的用藥安全識別進行快速判斷,來幫助加速藥物研發的流程,減少醫療事故的風險。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"當然同樣的例子還有非常多,總體來說就是"},{"type":"text","marks":[{"type":"strong"}],"text":"將知識圖譜作爲"},{"type":"text","text":"黏合劑,可以將各種多源異構的數據進行統一的表示,使得這些數據可以互聯互通,並且不僅是在結構層面,而且可以在語義層面形成更好的互操作,基於這樣的互操作形成知識圖譜,這樣我們就可以在這上面去做相應的分析、計算、推理、預測,從而幫助下游的一些決策性任務,提升決策的質量,這對於數字化轉型是起到了賦能的作用。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"InfoQ:您側重聊到了金融跟醫療,目前是不是隻有部分數字化水平比較高的行業,纔可以落地知識圖譜的應用場景?"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"王昊奮:"},{"type":"text","text":"我覺得知識圖譜並不是一定要等數字化全部做完才能去做的事情。數字化轉型本身是非常大的產業,我們可以按需針對某一個業務、某一個主題去做相應的數字化。有可能這個行業整體的數字化基礎不是特別好,但是不妨在某些特定的細分領域\/主題去開花結果。舉個例子,比如說在智能製造,我們都知道製造業本身的信息化和數字化水平遠低於互聯網或者金融\/醫療等行業,但是在智能製造領域,像複雜設備的檢修,它的一些根因的識別、故障的推算,都是有知識圖譜的身影。所以在數字化程度不一定很高的行業裏,我們也可以對於其中一個非常細分的場景做切分,也可以使用知識圖譜去做數字化的賦能,這裏說的是產業數字化。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"另一方面,數字化轉型還包括數字產業化,比如“雪亮工程”有很多的攝像頭,有很多傳感器設備感知到信號,還有很多智能音箱或者別的語音接收器,那麼這些硬件收集到的數據如何可以更好去賦能其它各行各業並在這個過程中不斷提升。就像石油,原油的價值一定不如精煉後去形成衍生物的價值高。知識圖譜正好起到了對數據本身的價值的提升的作用,並且是對一些碎片化的內容做聚合、包裝。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"所以從產業數字化轉型來說,我們可以去從很小的場景切入,而對於數字產業化來說,知識圖譜有更廣闊的泛場景的應用需求,對於數據進行挖掘,從而體現出它背後的更多價值,這是它更大的用處。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"InfoQ:實際應用過程中,知識圖譜在落地中會出現很多挑戰與困難,能否說說有哪些比較典型的挑戰與困難?"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"王昊奮:"},{"type":"text","text":"知識圖譜不是專門的學科,而是比較複雜的系統工程。我們都會去關心知識從哪裏來,知識怎麼去用這兩個很核心的問題,那麼對於如何應用,基本上我們會對它的生命週期做梳理,這裏面就包括知識建模、知識抽取、知識融合、知識存儲、知識計算、知識服務這樣的幾大模塊,每一模塊都有大量的挑戰。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"關於知識建模,在產業數字化的賦能過程當中,我們需要將行業所對應的各種數據做統一的表示和理解,並且在這個過程中要去抽象和建模,需要行業專家的經驗和很多knowhow,這件事情對於知識表示的語言和表達能力提出了更高要求。至於知識抽取,我總不能所有東西全是靠人工來去抽取,怎麼去更好地自動化進行大規模抽取,這是它所對應的一個挑戰。對於結構化數據,我們要去做數據的映射,對於半結構化數據,需要去設計相應的一些包裝器,而對於一些非結構化數據,如果是文本,就需要做相應的自然語言的信息抽取,而對於圖像,又需要再結合機器視覺去做場景理解,包括對象識別,以及他們之間的一些關聯等等。那麼往往在這個過程當中,我們既要保證它的自動化程度,又會受制於標註數據的稀疏性和本身的質量不佳等問題,這又反過來會對深度學習、或者其他相關學科裏面的應用落地提出了很大的挑戰。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"另外,知識抽取完之後,需要對它進行融合,融合就涉及到如何對多源異構數據快速做高質量融合的問題。知識是不斷動態變化的,我怎麼去對它進行增量融合,甚至說跨模態的融合。還有多源的問題,現在跨境電商也很火,比如淘寶上面的一些商品的分類跟亞馬遜上的怎麼去做相應的對齊,這又涉及到多語言的理解問題。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"當這些全部都做完之後,我們又會形成“幸福的煩惱”,這個幸福的煩惱就是在於這麼大規模的知識庫,應該怎麼樣對它進行存儲?存儲並不僅僅是通過一個文件、或者說傳統的磁盤就可以去做,需要考慮到這個數據該怎麼用?怎麼能高效地做檢索和過濾、以及分析,於是圖數據庫就誕生了。所以這不僅是涉及查詢,還涉及比較複雜的圖上面的計算、圖上面的挖掘、圖的一些推理,因此對存儲和處理引擎提出了更高的要求。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"再接下來就會涉及到,如何把它對應到向量化的表示,以更利於機器的處理,甚至是更復雜的一些圖的一些神經網絡,這個涉及數據的挑戰,也會涉及到技術和算法上的挑戰。更進一步,當我們在落地的時候,還會涉及到很多業務挑戰,很多時候業務數據少只能做私有化部署,對數據、算法、技術、工程、工具等等的成熟度,以及知識圖譜相關的不同人員的效率和成熟度,提出了很高的要求。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"InfoQ:總結性地說,在您看來,知識圖譜落地的關鍵是什麼?"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"王昊奮:"},{"type":"text","text":"知識圖譜的落地關鍵可以從toC和toB兩個角度看。如果是toC的應用(常說的互聯網應用),那麼它對於知識本身的廣度、知識的搜索推薦問答等等基礎的應用服務的質量,以及數據的運營和知識圖譜的工程化能力有比較高的要求,關鍵在於服務和服務化的能力。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"而toB層面,目前是有行業的一些知識圖譜的應用解決方案,但很多時候存在某一方數據不能露出的情況,它不像toC的一些應用有非常豐富的數據,它對於工具化的要求和平臺化的要求也比較高。在這個過程中,如何對各行各業的領域知識、行業的算法、行業的模型和知識以及經驗去做沉澱,去形成一個個類似於互聯網2C應用的閉環,這是現在比較關鍵的方向。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"InfoQ:目前已有應用的行業可以如何去拓展知識圖譜的應用場景與應用領域?對此,您有什麼樣的看法\/建議?"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"王昊奮:"},{"type":"text","text":"每個領域都可以去拓展。一方面,從知識產出到形成應用會涉及到傳統行業,叫做知識管理。雖然知識管理更多地是面向諮詢人員,但其實每個行業都需要知識管理。另一方面在於,如果說需要對一些碎片化、分佈在不同的地方的數據進行統一的治理或者管理,這裏面也有知識圖譜的身影。即使是在大數據行業,比如說在數據湖、數據倉庫、湖倉一體化等等,也可以看到知識圖譜在底層應用的運用。特別是很多預測性或決策性的任務,需要有一定的可解釋性,都是需要用到知識圖譜去做進一步的賦能。當然這方面的賦能只能循序漸進,一般來說可以先去看它是不是在一些像搜索、推薦等方面有需求,推薦可以有各種類型的推薦,還有一些類似於像智能客服、投顧,或者聊天對話式的內容,是可以率先去落地的。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"InfoQ:聊完知識圖譜的背景知識和落地,最後我們想聊聊中文開放知識圖譜聯盟OpenKG,該聯盟創立的初衷是什麼?"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"王昊奮:"},{"type":"text","text":"就像深度學習的成功取決於算法、算力和數據,首先這個聯盟集合了互聯網上的各種各樣的大數據。第二,如今GPU的算力得到大量的釋放,在這樣的情況下,我們的算法也可以有很大的提升,那麼這些算法怎麼能讓更多的人、而不是特指傳統去學習AI的科班人員,讓業務人也可以很好地去使用。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在這個過程當中,我們都知道,包括像TensorFlow、PyTorch等深度學習框架應運而生,而正是因爲這些深度學習框架,以及很多開箱即用的算法,都發布在了像GitHub這樣的開源社區當中,還有很多預訓練好的模型等等,所有的這一切都使得我們去使用AI的成本和壁壘變得越來越低、變得越來越小。所以我們覺得知識圖譜要去發光發熱,不能說所有的這些經驗和內容,都是在某幾個科班出身的人的腦子當中,進一步地,我們需要對這裏面的已有的一些數據去做知識化,並且將知識化之後的結果進行公開發布,並且普及一些開源工具和最佳實踐和案例。只有這樣纔可以打通產學研,社區纔可以蓬勃發展。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"InfoQ:從2014年創立到現在,OpenKG的發展符合預期嗎?爲什麼?"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"王昊奮:"},{"type":"text","text":"OpenKG的發展基本上還是比較符合我們的預期。因爲我們從一開始就構建了自己的門戶,上面涵蓋了大概超過20種行業的大規模的知識圖譜。然後我們在百科、常識、以及多語言關聯的知識圖譜做了很多開源開放的工作,並且也被應用在各行業中,包括高校科研、公司裏的商業應用都會以此爲基礎展開,去構建自己的知識圖譜的應用。同時我們也建立了很好的迴流機制,用之於民,用之於民,在這個過程當中,大家也會非常積極地去將自己修改過的知識庫開源出來,甚至在這個修改的過程中做了各種各樣的知識處理工具,也紛紛開源出來,或者做很多案例分享以及最佳實踐的總結。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"我覺得這個社區是在不斷持續擴展,其參與者包括高校和科研院所、國企事業單位、互聯網公司、傳統企業等等。它的結構是相對健全的,並且處於良性發展的階段,我也希望通過InfoQ這個平臺,呼籲更多的人蔘與進來,因爲只有用的人更多,才能暴露出更多的問題,同時也可以發現出更多有趣的、有挑戰的、值得去做的內容,使得社區的成長和產出,可以達到指數級的增長,這個是我對於OpenKG的期望。我們現在也在思考,怎麼能讓OpenKG跟其他的開源社區\/聯盟可以更好地關聯和對接,做一些資源共享和互補,一起把事情做得更好。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"InfoQ:您將在2021中國計算機大會上帶來題爲《OpenKG:知識開放平臺在數字化轉型中的機遇和應用》的分享,能否提前劇透一下,您屆時將帶來哪些內容的分享?"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"王昊奮:"},{"type":"text","text":"總體來說,我會沿着數字化轉型這個浪潮去做分享,除了傳統意義上的互聯網應用和企業應用,在城市數字化轉型和企業數字化轉型、特別是新興的領域也會討論,包括建築規劃和土木工程,以及在智能製造的一些領域,新能源汽車,還有藝術設計等等,聊聊知識圖譜能給這些領域帶來的價值,以及這個過程中知識開放平臺的價值、帶來的可能性以及面對的挑戰等等。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"如果大家還想了解關於知識圖譜賦能數字化轉型的更多信息,請關注將於12月16-18日在深圳舉辦的"},{"type":"link","attrs":{"href":"https:\/\/mobile.ccf.org.cn\/web\/html15\/index.html?globalId=m8271748750546083841617255458379&type=1","title":"","type":null},"content":[{"type":"text","text":"CNCC2021"}]},{"type":"text","text":",屆時王昊奮老師將在大會上做精彩的報告。"}]}]}
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章