《人工智能之學術搜索》報告重磅發佈:呈現知識和算法雙引擎驅動的未來發展趨勢 | 附報告PDF下載

【導讀】近日,由清華大學人工智能研究院、清華-中國工程院知識智能聯合研究中心和智譜AI聯合發佈了《人工智能之學術搜索》報告。報告顯示,得益於人工智能技術的不斷引入,未來學術搜索產品將呈現出知識融合與推理、智能挖掘高精度算法雙引擎驅動的發展趨勢。

微信截圖_20200507134727.png

該報告以 AI 賦能的學術搜索爲核心,在梳理學術搜索概念特徵、發展歷程、工作原理以及系統架構的基礎上,重點分析解讀了 AI 技術在學術搜索領域的具體應用情況、領域專家人才現狀、典型產品的資源覆蓋和功能特色,以及 AI 學術搜索技術與應用的未來發展趨勢,並探討了學術搜索領域的市場主體如何才能更“智能”、更“聰明”、更“定製化”地爲科研用戶提供相關情報服務。

報告呈現三大亮點

  1. 展示主流學術搜索產品中已引入的AI特色功能;
  2. 挖掘AI學術搜索領域專家學者並進行人才畫像;
  3. 預測AI學術搜索技術趨勢,爲產品性能提升提出建議。

報告通過 AMiner 科技情報大數據挖掘與服務系統平臺,對近 10 年(2009-2019年)領域高端期刊會議的論文數據進行挖掘,基於“學術搜索”相關的關鍵詞庫以及關鍵詞智能匹配挖掘出所有相關論文。然後,進行文獻分析、論文與學者數據挖掘、特徵抽取、學者畫像、技術預見等一系列分析。

智源研究院學術副院長、清華大學計算機系唐傑教授認爲,人工智能在過去十年中已基本實現了感知能力,但卻無法做到認知能力(推理、可解釋等);因此在學術搜索的未來,將主要會去實現具有推理、具有可解釋性、具有認知的智能搜索功能。

清華大學計算機系教授李涓子強調,學術搜索未來核心技術將在知識融合基礎上,以知識加工技術和智能挖掘算法作爲技術驅動的雙引擎,發展出更多的科技創新智能化應用。

學術搜索產品可以分爲兩大類:融合開放數據和服務、專門數據庫和服務。前者較知名的產品有 Google Scholar, Microsoft Academic 和 Semantic Scholar 等,後者較知名的產品有 Web of Science, Scopus 和 CNKI 等。

目前學術搜索引擎使用的主要人工智能技術包括:

  • 信息抽取引入了機器學習、深度學習和人工神經網絡等技術
  • 用戶交互引入了自然語言處理NLP和語義分析等技術
  • 作者識別技術、命名消歧技術
  • 信息集成中引入了NLP、人工神經網絡、知識庫管理等技術
  • 信息檢索引入了知識圖譜模型構建、計算機視覺檢索模型等技術
  • 文獻或作者推薦中引入了協同過濾算法、知識管理、數據挖掘、智能推薦、機器學習、深度學習等技術
  • 排序及論文影響力評價引入了排序學習、深度學習、自然語言處理、機器學習等技術

報告還研究了學術搜索領域的相關學者分佈情況。結果發現,在 2009-2020 年期間,全球學術搜索領域學者數量共計 7262 位, 覆蓋全球 54 個國家,主要集中在北美洲的美國地區;歐洲中西部也有一定的學者分佈;亞洲的人才主要分佈於中國、新加坡、印度及日韓等地區;其他諸如南美洲、非洲等地區的學者數量稀少。在中國地區,領域學者主要分佈在北京、上海和深圳,安徽、陝西、湖北等省份也有少量分佈。

從排名上看,學術搜索領域學者數量 TOP10 國家是美國 (1791位)、中國 (1373位)、英國 (326位)、德國 (302位)、加拿大 (261位)、新加坡(210位)、澳大利亞 (175位)、荷蘭(233位)、日本(222位)、西班牙 (181位)。

在學者的跨國合作中,與中國學者合作論文數量前十的國家分別是美國、新加坡、英國、澳大利亞、加拿大、荷蘭、日本、德國、印度和法國。其中,中國學者與美國學者合作發表論文最多,共計 161 篇。

第一.png

在領域學者數量排名前十的機構之中,清華大學位列第一,領域學者數量爲 231 人,但學者 h-index 均值在排名前十機構中仍處於偏低位置。微軟和卡內基梅隆大學分別位列第二位、第三位,領域學者數量分別爲 202 人、199 人,這兩家機構的領域學者 h-index 均值都處於較高水平。

第二.png

全球化的背景下,學者的遷徙也時有發生。目前,美國領域學者流動最大,遷徙總數爲 12686 人次,其中遷入 6452 人次,遷出 6234 人次。中國領域學者流動量排名第二,遷徙總人數爲 9644 人,其中遷入 4722 人次,遷出 4872 人次,且中國學者流動總體呈現逐年減少趨勢。

第三.png

隨着文獻數據量的不斷擴大,以及數據庫的檢索和排序功能日益完善,對期刊、文獻或學者進行學術影響力評價的需求越來越大,也越來越受到學術界的重視。自 20 世紀 90 年代以來,學術搜索產品逐漸開始利用自身不同數據源的文獻及引文數據等構建出了各種評價指標模型。這些學術評價指標主要分爲期刊評價指標、文獻評價指標和作者評價指標三類。

報告指出,AI 學術搜索領域相關技術預見主要包括:data mining(數據挖掘)、support vector(支持向量)、social network(社交網絡)、machine learning(機器學習)、feature extraction(特徵抽取)、computer mediated communication(計算機中介傳播)、collaborative filtering(協同過濾)以及search engine(搜索引擎)等。

 

第四.png

關於 AI 學術搜索技術的未來發展,報告強調,隨着AI和IT技術在學術領域的廣泛和深入應用,學術搜索的未來發展將呈現出多源異構知識融合化、知識加工設施化和自動化、智能挖掘算法高度精準化、科技應用智能化和創新化四大趨勢。

展望未來,AI 學術搜索不僅可以支持快速獲取來自所有科學領域的科學論文,快速瞭解文獻趨勢和新的研究領域,可以快速將所有信息鏈接在一起,找到研究之間的聯繫,形成一整套前沿研究的全貌。基於人工智能技術的學術搜索不僅可以分析研究論文,輔助學術科研工作,而且將承擔挖掘科技競合情報,助推企業、行業乃至產業的創新變革的重要角色。

202005070106.gif

點擊“下載報告”,獲取《人工智能之學術搜索》報告PDF完整版!

往期回顧:

雄激素“助紂爲虐”?最新研究發現:雄激素剝奪療法或是男性新冠患者“救星”

硬核科普:是什麼導致了虎門大橋振動,卡門渦街?

曠視研究院:深度解析MegEngine亞線性顯存優化技術

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章