亞馬遜Comprehend增加新功能，無需機器學習背景也能爲應用添加NLP

原創

2018-12-18 15:10

編譯：chux

出品：ATYUN訂閱號

去年，亞馬遜宣佈推出一款自然語言處理工具Comprehend，幫助企業從信息集中提取常用詞彙和短語。今天，在其Re:invent customer會議前的一週，亞馬遜宣佈了Comprehend性能的增強，允許開發人員在沒有機器學習領域知識的情況下構建專業單詞和短語列表。

新的無代碼自定義工具，即Custom Entities和Custom Classification，在Comprehend中將允許開發人員識別自然語言術語並對專門針對其團隊，業務或行業的文本進行分類，亞馬遜網絡服務公司學習與AI總經理Matt Wood博士寫道。

他表示，“許多客戶告訴我們他們擁有過剩的數據，特別是包含非結構化，自然語言的數據，在找到潛在信息的寶庫之前，你可能不必深入自己的組織內部，機器學習十分擅長找到特別的東西。”

爲此，Custom Entities允許客戶教Comprehend特定於垂直位置或域的術語。通過一小部分示例，例如政策編號列表和使用它們的文本，Custom Entities可以訓練一個能夠識別任何給定片段中的目標文本的定製模型。

一個作爲補充的新功能，即Custom Classification使開發人員能夠將文檔分組到命名類別。只需50個示例，Custom Classification就可以訓練一個能夠對電子郵件，社交媒體帖子，分析報告和其他文檔進行分類的模型，或者根據其內容對其進行分類。

Custom Entities和Custom Classification現在都可用。Wood博士寫道，LexisNexis已經使用Custom Entities功能從超過2億份文檔中提取法律實體，準確率超過92％。

Wood補充道，“自AWS創立以來，我們的目標一直是將傳統上只有大型、資金充裕的組織才能獲得的技術，交給所有開發人員使用。在底層，Comprehend將承擔構建、訓練和託管定製的機器學習模型的重任，並通過私有API使這些模型可用，這些新的特性正是這種精神的完美體現。”

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.