原创 助力句子變換:35W抽象、43W同義、13W簡稱三大知識庫對外開源

句子變換,是指根據給定中文句子,藉助某種語言處理手段,擴展出一定數據規模的中文句子集合,是一個從1到N的過程,目的在於解決搜索(查詢擴展)、分類(樣本擴充)、抽取(數據回標)、推薦與生成(關聯引導)等多個工業級應用任務。 我們發現

原创 事件抽取中的“門面技術”:事件名稱生成淺談

6月10日,“網信中國”微信公衆號發佈消息稱:微博熱搜榜、熱門話題榜暫停更新一週,這使得很多熱榜平臺都受到波及,而在喫瓜之餘,我們更進一步地思考熱點榜單以及熱點名稱生成背後的技術,併發出兩連問: 熱點名稱是否僅僅來源於用戶搜索,還

原创 沒錯,繼事理圖譜後,我們又搞事情了:數地工場自然語言處理語義開放平臺正式對外發布!

2020年的鐘聲即將敲響,在這辭舊迎新之際,經過近幾年在Fintech領域中的自然語言處理技術研發和產品迭代積累,數據地平線Datahorizon迎來重大更新,以數據、事件、邏輯的語義toolbox爲願景的數地工場開放平臺V1.0

原创 事理圖譜:一種純學術需求、無法落地、漏洞百出的新技術或新概念?

過去幾個月,深陷所謂“事理圖譜”當中,苦惱不已。從2018年4月份開始做所謂的“事理圖譜”以來至今,磕磕碰碰,做了很多技術上的嘗試,也不乏在應用事理圖譜上嘗試了多種做法,也不乏寫了幾篇關於事理圖譜的文章(實際有未想明白之處)。現在

原创 【再認識】認知智能下需要的實體知識與事件知識

1,知識圖譜理想上雙層結構,實際單層 知識圖譜是個雙層結構。模式層和實例層,模式層,又稱爲本體層,模式層分成兩個部分,一個是概念的上下層級,另一個是概念之間的關係層或者概念的自身屬性信息層。前者規定了概念類之間的類關係,賦予了概念

原创 【重磅】全行業事理圖譜V3.0正式發佈:基於實證的由因求果、由果溯因,因果路徑發現

我們一直在事理圖譜的探索和應用路上不斷前行。。。 【中科院軟件所】數據地平線的金融事理圖譜Demo已經和大家見面有一段時間了(Demo地址:http://eg.zhiwenben.com/),這段時間我們收到了很多用戶的建議反饋和

原创 實時事理邏輯知識庫(事理圖譜)終身學習項目-EventKGNELL(學跡)

EventKGNELL EventKGNELL, event knowlege graph never end learning system, a event-centric knowledge base search syst

原创 如何看待事理圖譜版magi--"學跡"

如何看待事理圖譜版magi–“學跡”:項目地址:https://xueji.zhiwenben.com 看到界面和功能都似乎很相似,除了magi更通用一些,這個系統更專注“事件”這個領域,請問兩者的區別是什麼?或者說這個系統就是利

原创 實時事理學習與搜索平臺DemoV1.0正式對外發布

我們團隊探索了一種將事件、概念、邏輯、實時學習、多類知識庫實時更新串起來的知識服務新模式。一個面向事理的實時學習和搜索系統Demo,取名叫“學跡”,取自“學事理,知行跡”。 項目地址:https://xueji.zhiwenben

原创 淺談事理圖譜認知:系統體系+領域收斂+人機協同+輔助範式

事理圖譜,不是簡單的事件識別和事件關係識別以及事件三元組存儲,是一個需要健全事件體系牽引、具有領域收斂特性、在構建上需要人機協同,在應用上擁有多種輔助範式形成的系統體系工程。–劉煥勇,於中科院軟件所,20191012 事理圖譜,不

原创 隨筆-機器如何學習我們的知識?

1、 人類語言的語法知識。 不同的人類語言有不同的語言表達形式,包括語言符號,語言符號的組合和應用規則。阿拉伯文字、斯拉夫文字、羅馬文字、拉丁文字、象形文字等代表着不同語言背景、語言文化。 2、 機器可用的詞典知識庫有哪些? 1)

原创 金融情報挖掘:面向公開文本的期貨事件聚合與傳導因素分析

金融情報挖掘是情報領域的一個重要分支,通過對金融領域信息進行提取和分析,發現關聯線索,對傳導關聯進行建模,能夠挖掘出市場變動的規律,最終輔助決策。 例如,國內外資本市場,衍生品市場熱點不斷,如“原油跌停”、“智利地震”、“美股暴跌

原创 中文句法分析、標記規範及其應用

一、 Why句法分析 句法分析是比詞高一個層級的語言單位,單個詞之間通過中文語法規則進行組織,形成一個具有連貫語義的詞語序列。爲了揭示這種組織結構和規則,揭示出詞語以及詞語的成分,往往需要對其進行句法分析。就中文而言,句子有七個成

原创 自然語言處理中的中文詞性、標記規範及其應用

分詞和詞性標註是自然語言處理領域的重要組成部分,尤其對於中文而言,作爲整條自然語言處理pipeline的源頭,分詞和詞性標註更是起到了關鍵的作用。我整理這篇文章,主要來源於這幾個問題: 一、理解中文詞性是否有意義? 問題:前幾天跟

原创 知識圖譜發展的三個時期以及事理圖譜概念辨析

一、知識圖譜發展三個週期       知識圖譜,從2012年穀歌正式將這一概念應用到工業界之後,到現在已經逐步走過了將近7年的時間,在這七年的時間裏,知識圖譜逐步經歷了從概念興起、概念泛化、技術掙扎與落地尷尬三個環節。 1、 知識