斯坦福句法分析使用方法(java版)

首先說一下句子相似度分析的主要思想。句法分析和義元分析是兩個大方向,如果學過編譯原理的大概能明白其中的關係。我做的方向就是句法分析這個方向的。

斯坦福句法分析器絕對不是最好用的中文句法分析器,它的主要思想都是以英語句法分析爲前提的,因此在某些方面並不適合中文,但它一定是我們能找到的最好用的了。國內很奇怪,國外最好的東西都是開源的國內都是收費的。廢話不說進入正題 (已經說了好多了)。

首先還是先要下載下來斯坦福句法分析器的壓縮包,這個包比較大根本上傳不上來,沒有辦法大家只能是自己下載了。斯坦福壓縮包下載

下載下來之後就看到有四個jar,新建一個工程,右鍵選擇最下面的一項properties。在左側找到build path,把這四個都add進去,準備工作就好了。

下面的代碼大家要一行不差複製,因爲在壓縮包中的例子有一點錯誤,不能直接使用。這些代碼是我借用的別人的,我測試了沒有問題。。

代碼是我自己的,因爲查重的關係不能直接給大家,只能是上傳到資源了,大家去下載一下吧 斯坦福例子下載

我用的是3.4.1的版本jar,因此可能最新的有一些不同,差距不會太大,到時候大家可以留言問我。

到這裏是無法使用的,因爲獲取到的是一句關係

assmod(日報-3, 每天-1), assm(每天-1, 的-2), nsubj(記得-5, 日報-3), advmod(記得-5, 都-4), root(ROOT-0, 記得-5), rcomp(記得-5, 要-6), dobj(記得-5, 發送-7)

這玩意兒根本沒法直接用,要用到後面的數據結構來存儲,後面的東西我暫時不能上傳,是我在做的核心內容,會在七月份更新,到時候會開源給大家(收一分,意思一下…………小無恥一下)

可以說一下思路,兩個數字是一組,提取出來,存儲到數據結構裏面,然後的事情就是機密了。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章