【CIKM2018】從大數據到大信息和大知識教程(附PPT下載)

CIKM創辦於1992年,是由美國計算機協會針對信息檢索、知識管理以及數據庫主辦的全球頂尖學術會議。CIKM每年匯聚了最前沿的科研人員,探討先進知識及信息系統面臨的發展困惑及挑戰,通過高質量、已實踐的理論研究成果,確定未來的研究方向。

CIKM十分重視工業界的運用,除了CIKM Cup這樣的面向實戰的國際數據挖掘競賽外, 還有很多的面向工業界的Tutorial、Workshop。今天給大家帶來《從大數據到大信息和大知識:以地球觀察數據爲例

大數據和人工智能熱潮之後,越來越多的專家開始思考未來的技術走向,中科院自動化所胡包鋼,董未名,黃飛躍等人指出人工智能未來發展方向的“基於大數據+大知識的建模方法”。他們指出然而深度學習方法的侷限性也是顯而易見的。其中最爲缺失的是關於知識的顯式應用與更新。目前的深度學習方法沒有應用演繹推理方式實現智能。 而”大知識”是一種以多學科爲基礎的、多領域爲應用的、多種表達方式的一類知識庫。 未來類人智能機器在利用已有知識與數據方面均會超過人類平均(AverageHuman-being)水平。其次,它也預示大數據利用下成功發展的深度學習模型必將依賴大知識利用方面取得突破性發展。而對於知識模型方法則需要採取大數據利用下的學習方式實現知識庫的“自動/半自動”更新與擴展(這遠不同於早期專家系統)。

參考文獻:胡包鋼,董未名,黃飛躍,基於大數據+大知識的建模方法 ——人工智能未來之路的探索,自動化學報通訊

摘要

一些特別重要的開放且免費的大型地理空間數據的豐富來源是各國的地球觀測計劃,如美國的Landsat計劃和歐盟的哥白尼計劃。地球觀測數據是大數據的一個範例,從中提取的信息和知識也是如此。地球觀測數據(衛星圖像和現場數據)和所提取的信息和知識可用於許多對金融和環境產生影響的應用,比如應急管理,氣候變化,農業和安全等領域。到目前爲止,這種潛力尚未完全實現,因爲地球觀測數據和從中提取的信息“隱藏”在美國宇航局、歐洲航天局和國家航天機構操作的各種檔案中。因此,想要開發應用程序的用戶需要搜索這些檔案,發現所需的數據和信息並將其集成到他的應用程序中。

在本教程中,作者將展示如何通過以RDF的形式發佈數據來“打破這些孤島”, 使現代搜索引擎能夠發現它們,將其與其他相關數據連接起來,並使其在Web上免費可用,從而方便地開發地理空間應用程序。提供了一個完整的數據科學流程,該流程以各種格式的地球觀測數據集開始,可以在ESA和NASA等空間機構的檔案中免費獲得,最後部署了一個交互式視覺應用程序,該應用程序使用地球觀測數據和其他使用鏈接數據技術的抵押數據(例如,開放政府數據,封閉企業數據,模型數據等)。本教程將深入介紹在過去8年中,在5個歐洲項目的背景下,演示者開發的相關地球觀測數據的技術,系統和應用。其他研究人員的相關工作也將深入討論。最後,還將討論該領域未來研究的開放性問題和方向。

教程概述

這是一個爲期半天的教程,簡要概述如下:

第1部分:簡介。衛星圖像。歐盟的哥白尼計劃。哥白尼數據作爲大數據的範例。

第2部分:衛星數據的數據庫技術。在本教程的這一部分中,我們將介紹最新的數組DBMS:MonetDB / SciQL,paradigm4 / SciDB和rasdaman。我們將集中研究這些系統處理遙感數據的能力和現有應用。

第3部分:衛星圖像的知識發現。在本教程的這一部分中,我們將介紹遙感文獻,該文獻研究模式識別和機器學習技術,以便從衛星圖像中提取知識(例如,土地覆蓋類)。PPT將展示這一部分

第4部分:地理空間和時間數據的RDF和SPARQL擴展。在本教程的這一部分中,我們將首先討論RDF地理空間和時間擴展的數據模型和查詢語言,重點關注數據模型stRDF和我們小組開發的查詢語言stSPARQL,開放地理空間聯盟(OGC)標準GeoSPARQL和RDF的擴展,用於表示不完整信息RDFi。 這些RDF的時空擴展可以使用本教程第3部分中介紹的技術以及其他附帶數據(例如,某個國家的行政區劃、OpenStreetMap數據等)對從衛星圖像中提取的知識進行編碼。

第5部分:時空RDF存儲。在本教程的這一部分中,我們將介紹Strabon、Ontop-spatial和它們的競爭對手系統(Parliament、uSeekM、GraphDB、AllegroGraph、Virtuoso、Stardog和Oracle Spatial和Graph 12c),以及最近使用benchmark geographic對它們進行的功能和性能比較。我們還將討論開放問題,比如如何將這些系統擴展到大數據,以及如何在關聯數據範式中表示和查詢柵格數據。

第6部分:互連地理空間和時間RDF數據。在本教程的這一部分中,我們將討論有關地理空間實體解析的工作以及與Silk和Radon等系統發現地理空間關係的最新工作。

第7部分:搜索,瀏覽,探索和可視化遙感數據和鏈接的時空數據。在本教程的這一部分中,我們將首先討論從衛星圖像檔案中進行基於內容的檢索的遙感技術。我們還將展示我們的工具Sextant,用於可視化鏈接的時空數據,以及它在Copernicus App Lab項目的環境應用中的使用。

請關注專知公衆號(掃一掃最下面專知二維碼,或者點擊上方藍色專知)

  • 後臺回覆“CIKM2018BD” 就可以獲取 最新PPT下載鏈接~

附PPT全文:

參考鏈接:

https://www.cikm2018.units.it/tutorial5.html

http://kr.di.uoa.gr/#cikm2018-tutorial

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章