自然語言處理技術在各行業有着廣泛的應用,然而長久以來,其落地並不是一帆風順的。
語義檢索系統
具備三大亮點:
低門檻:數據+代碼+模型全部開源,無需標註數據也能夠輕鬆構建起檢索系統,並且提供訓練、預測、近似最近鄰(ANN)搜索一站式能力。
精度高:結合業界前沿模型和自有創新思路,推出適用多種數據情況、靈活的技術方案,精度超高。
-
性能好: 與開源向量數據庫 Milvus 打通 ,結合 Paddle Inference,實現高性能建庫,並在千萬級數據中做到毫秒級快速查詢。
前往 GitHub 獲取開源代碼和模型:
https://github.com/PaddlePaddle/PaddleNLP/tree/develop/applications/neural_search
預訓練時代的端到端問答 - RocketQA
傳統的問答系統通常由多個模塊級聯組成,而在預訓練時代我們可以用一個端到端模型代替傳統的複雜系統,實現更好的效果。然而,研發端到端問答模型需要大量的計算和數據資源,爲了使更多開發者能方便地獲取最先進的問答技術,我們推出了 RocketQA 開發工具,有三大亮點:
領先:提供國際領先的端到端問答技術-RocketQA,效果遠超傳統問答系統,與國際知名公司的技術方案相比也有一定優勢。
中文:開源首個中文端到端問答模型,該模型基於知識增強的預訓練模型ERNIE和百萬量級的人工標註數據集 DuReader 訓練得到,效果優異。
易用:提供11種預置模型、2 種安裝方式和極簡的開發接口,2 行命令即可搭建自己的問答系統。
前往 GitHub 獲取開源代碼和模型:https://github.com/PaddlePaddle/RocketQA
情感分析系統
爲了降低技術門檻,方便開發者共享效果領先的情感分析技術,PaddleNLP 本次開源的情感分析系統,具備三大亮點:
覆蓋任務全:集成句子級情感分類、評論觀點抽取、屬性級情感分類等多種情感分析能力,並開源模型,且打通模型訓練、評估、預測部署全流程。
效果領先:集成百度研發的基於情感知識增強的預訓練模型 SKEP,爲各類情感分析任務提供統一且強大的情感語義表示能力。
-
預測性能強: 針對預訓練模型預測效率低的問題,開源小模型 PP-MiniLM,配套裁剪、量化優化策略,預測性能提速 900%!
如果您想了解詳細技術方案和完整代碼、下載開源數據和模型,歡迎關注 GitHub Repo,也可在直播中與百度高工交流哦:
PaddleNLP: https://github.com/PaddlePaddle/PaddleNLP
RocketQA: https://github.com/PaddlePaddle/RocketQA
直播預告課
12.28~12.30 日每晚 20:15~21:30 百度高工將帶來直播講解,剖析行業痛點問題,深入解讀系統方案,並帶來手把手項目實戰。歡迎大家掃碼上車!直播間不見不散~
本文分享自微信公衆號 - ZILLIZ(Zilliztech)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。