【知識圖譜問答】QALD知識圖譜問答比賽介紹

網站鏈接

QALD

介紹

隨着越來越多的語義數據在網上發佈,網絡用戶如何訪問到知識本身變得尤爲重要。與日俱增的在交互模塊的研究讓終端用戶能夠在標準的語義網表達中獲取方便的查詢方式。尤其是自然語言接口,獲得了極大的關注,因爲它們允許用戶通過直觀的表達方式來表達複雜的信息,至少在遵循原則的基礎上,用他們自己的語言。
關鍵的技術依賴於將用戶的語言轉換成一種形式化的查詢,從而可以利用標準語義查詢處理和推理技術。最後,系統必須能夠處理多形式的,分佈式的和大型連通數據。這種可用的在開源和結構化數據上的方法,在計算機科學和方法上都沒有先例可以處理特別的關聯數據,因而這種技術是緊急需要的。另外,多語言已經成爲語義網研究團體的主要興趣所在,因爲不是通過英語創建的角色和發佈的數據,和不說英語的訪問關聯數據的用戶變得越來越多。爲了讓來自世界各地的人們可以訪問相同的信息,系統能夠克服語言的障礙,可以通過多語種訪問語義網數據變得尤爲迫切。
在關聯數據上的問答1(QALD)的開放挑戰的主要目的是提供最新的要求基準,從而建立一個標準,使得在結構化數據上的問答系統可以被評估和比較。QALD-3是QALD開放挑戰的第三個版本,在CLEF 2013上被組織成半日實驗。這篇文章剩下的部分描述了先前版本的挑戰(第2章),QALD-3的主要內容和實驗設置(第3章)和提交的系統的性能(第4章)。(第5章)主要在現有的版本上得出了一些結論,並且爲未來的版本提出了一些建設性的意見。

概述

QALD是旨在研究用戶的自然語言和RDF結構化數據之間的中間系統。 衡量目前的系統的優點和缺點。同時研究方法來提高系統性能,因爲RDF數據是大量的,並且數據是異質的而且數據集的數據是分佈的。

任務

參與者的任務是給定一個或多個RDF數據集以及自然語言問題,返回正確的答案或者是SPARQL查詢。

Benchmark

QALD-3到QALD-5在DBpedia上的多語言問答都有一個DOI。

QALD-3: doi:10.4119/unibi/citec.2013.6

Reference: DBpedia 3.8
Languages: English, German, Spanish, Italian, French, Dutch
200 questions (train: 1-100, test: 101-200)

QALD-4: doi:10.4119/unibi/2687439

Reference: DBpedia 3.9
Languages: English, German, Spanish, Italian, French, Dutch, Romanian
250 questions (train: 1-200, test: 201-250)

QALD-5: doi:10.4119/unibi/2900686

Reference: DBpedia 2014
Languages: English, German, Spanish, Italian, French, Dutch, Romanian
420 questions (multilingual QA - train: 1-340, test: 341-390, hybrid QA - train: 391-410, test: 411-420)

QALD1

數據集

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章