自然語言處理將徹底改變企業的業務

雲棲號資訊:【點擊查看更多行業資訊
在這裏您可以找到不同行業的第一手的上雲資訊,還在等什麼,快來!

從支持面向客戶的聊天機器人,到跟蹤合同承諾,再到充分利用會議記錄,自然語言處理具有巨大的潛力來改變企業的業務。

image

自然語言處理 (NLP) 的最新改進正在通過語音和文本功能來支持主流技術,無論是使用聽起來更加自然的聲音來大聲朗讀電子郵件,還是使用Excel輸入有關電子表格數據並以自動生成圖表和數據透視表的形式來獲得答案。

隨着NLP變得更加精確和更廣泛可用,它有可能從爲客戶支持聊天機器人提供預置主題轉向能夠處理定性、半結構化和非結構化的數據。最後,實現知識挖掘的承諾還將可以釋放關於公司流程、資產和負債的信息,從而創建更好的工作流和更實時的組織視圖。

“NLP能夠將單詞分解成最簡單的形式,並識別出它們之間的模式、規則和關係,”apexanalytix的應用和先進技術高級副總裁Walt Kristick解釋道。“它會使用計算機算法來解析和解釋書面和口頭的自然語言,使系統能夠學習和理解人類語言。”

NLP的應用範圍可以從翻譯和語言生成(用於總結、註釋甚至是解釋其他機器學習模型),再到分類和聚類、情緒分析和其他信息的提取。Kristick指出,NLP最簡單的形式已經被廣泛使用:拼寫檢查、電子郵件中的建議和消息響應以及Siri等虛擬助手都在使用NLP,聊天機器人也是如此。

“對文本和非相關數據源的分析和提取的需求已經越來越大,特別是在醫療保健和生命科學領域,”Kristick指出。

下面是NLP的現狀以及它可能適合你組織的地方。

NLP服務占主導地位

雖然有許多算法可以與Python NLTK、Sanford CoreNLP和Apache OpenNLP等框架一起構建自己的NLP任務,但最有效的模型往往非常龐大。在撰寫本文時,Microsoft的170億參數的圖靈自然語言生成模型是有史以來最大的,BERT和GPT-2也有數十億個參數。

“對於一些公司需要做的複雜事情來說,僅僅把這些模型從貨架上拿下來是行不通的,”Microsoft的會話人工智能副總裁Lili Cheng警告說。“對許多公司來說,託管這些大型模型、管理它們並完成所有這些工作將是非常具有挑戰性的。有些人想這樣做,但我們相信更多的客戶只是想定製和添加他們自己的信息,”Cheng說,並指出,這對於許多組織所聘用的NLP專家來說也會是一個挑戰。

不僅僅是零售和其他面向客戶的行業纔可以從NLP中受益,IBM研究員、人工智能首席架構師Dakshi Agrawal說。任何與客戶打交道的公司都可以利用NLP來從他們的互動中獲得深刻的見解,Agrawal說,“許多公司在處理外部客戶和合作夥伴事務的同時,也會在內部員工和一般人力資源事務中使用該技術。”

例如,主題聚類就使用了像句子嵌入這樣的NLP技術,而不僅僅是關鍵字提取,這使得在對客戶可能使用不同術語報告的問題進行分組時能夠更加準確。在儀表板中突出顯示這些集羣將有助於揭示趨勢或重複出現的問題。

Signoi試圖通過展示常用詞、突出正面和負面詞彙並按人口羣體的彙總來處理調查中的開放式評論。獨立的英國交通用戶監督機構transport Focus利用Signoi調查了各種火車服務上通勤者和休閒乘客所最關心的問題。商務旅客對一條線路的過度擁擠感到憤怒;那些乘坐火車休閒的人則想要更好的停車場,更多的空間以放置行李和自行車。

NLP也可以用來生成解釋結果的語言。Microsoft的Power BI商業分析服務和Salesforce.com的Tableau都提供了一些功能,用戶可以輸入有關數據的問題,然後得到圖表或自動分析。

瞭解企業所知道的

NLP有很大的潛力來幫助提取一個組織不知道它已經知道的東西。

專業的人工智能工具,如ABBY的Text Analytics for Contracts、Exient的Contract Management Solution或是Seal的Contract Discovery and Analytics,都可以從合同中提取條款和期限,幫助組織理解他們的承諾。Docugami是XML的共同發明人Jean Paoli所創辦的一家新公司,它的目標就是爲結構化程度較低的文檔實現這種功能。

“企業中只有15%的數據存儲在數據庫中。我們使用文本、電子郵件和文件進行交流。真相併不在那些可愛的結構化數據庫當中。真相在文件裏,”Paoli告訴我們。

“拿一個非常文件密集型的企業來說,比如商業地產。一線業務用戶每週都會花時間創建15個租賃協議,每個星期一,他們的經理都會問:你做了什麼?截止日期是什麼時候?你談過停車問題了嗎?他們想不想讓我們保留這塊土地?一旦你簽署了一份文件,這些就是公司所必須履行的條款,但這些信息都被埋在文件裏了,” Paoli說。

解鎖這些“暗數據”可以取代每週一早上的狀態會議,並提高業務靈活性;Paoli指出,無論是房東被星巴克要求重新談判租賃協議,還是餐廳需要了解保險單的內容,這都會比以往任何時候都來的更加重要。

“在這一點上,使用NLP來分析業務文檔將變得更爲重要,因爲企業正在重新思考其業務模式。他們可能不得不重新談判一切,他們需要了解他們的義務和風險是什麼。專業服務公司埃森哲就是這麼做的,它利用自己的NLP分析了100多萬份合同,以瞭解自己的承諾和責任。

Paoli表示,對於那些沒有自己內部NLP專業知識的組織,Docugami的SaaS產品也有30個示例文檔可以使用,它可以從一個業務文檔文件夾中自行選擇這些文檔,還可以向創建文檔的業務用戶提供30分鐘的反饋,以訓練模型。

然後,Docugami可以將這些信息輸入數據庫,以幫助創建一個在瀏覽器中可以看到的儀表板,或是與Excel或Tableau集成在一起。“我們可以說,看,這是到期了的,或者所有這些文件都有這個特定的條款,除了那一個,”Paoli說。

打開會議的隱藏力量

從會議和對話中提取有用的信息是一個費力的手工過程。一些公司的電話已經被轉錄,但很少有人對它們進行分析。從會議上的發言中,企業能對項目的進展或即將到來的截止日期瞭解多少呢?

Otter的首席執行官Sam Liang指出,由於企業員工通常會在會議上花費30%或更多的時間,因此從這些會議中獲取的很多信息並不像其他業務數據那樣有意義。

“人們將如何保持一致意見,尤其是在你連續召開了Zoom會議的情況下?”Liang說。

像Otter這樣的轉錄工具將可以幫助到你。PowerPoint演示文稿和團隊會議中的實時字幕,或者是Azure Streams廣播平臺中可搜索的實時會議轉錄,都可以有效地提供後續對話的文本,而無需人工來做筆記。

Microsoft的Cheng建議,在未來,平臺將使用轉錄和文檔分析以及圖像識別來提取“會議的集體智慧”,這樣在會議結束後繼續工作時,就可以很容易地訪問這些信息了。“你可以記錄下更多正在發生的事情,然後方便地與你的團隊分享,”她說。

例如,Bridgewater Associates記錄了過去15年的所有內部會議,任何員工都可以觀看這些錄音。但由於很難搜索,他們很少會被瀏覽,公司現在正在使用Otter來提取舊的會議內容。

類似地,支持Azure Media Services live meeting轉錄的Azure Cognitive Services speech to text API也將很快能夠轉錄上傳到OneDrive的音頻文件。開發人員已經可以使用這些API來構建轉錄應用程序,但是將這些功能直接構建到平臺中將使其更廣泛地被使用。

數據分析和準確性

完整的轉錄並不總是應用NLP最有用的結果,儘管它們可以提供一個時間線,讓你通過上下文搜索找到Cheng所說的“有趣的金塊”。

Otter提取了標記作爲自動摘要,以指示文本中所包含的內容。IBM Watson的自然語言理解和Otter也在研究類似的工具,但是你仍然要記得查閱文字記錄。2018年,Microsoft爲團隊展示了一個原型系統,該系統可以根據會議記錄創建和分配行動項目,並向與會者分發會議記錄。

從長遠來看,NLP還可以爲會議提供數據分析:同樣的話題是否不斷被提出,同樣的截止日期是否不斷地被推遲,某些員工是否比其他人說得更多,還是在討論其他人。

所有這些的價值取決於轉錄的準確性,而對於NLP來說,準確度是一件複雜的事情。許多NLP系統在正式的基準上實現了與人類相同的性能,但它們大多是基於對話的,可能無法給你一個與你想要做的事情的準確比較。仍然沒有一個單一有效的衡量標準,Cheng指出。

“我們看到人們將各種能力融合到了多模式的系統中。你可能會發現你的對話系統真的很棒,但它在搜索或混合系統方面就做得不太好了,在混合系統中,你可能會想要把說話、語言、視覺和文檔結合在一起,”她說。

轉錄的準確性隨錄音質量、背景噪音、說話者的口音和人們所談論的內容而有所變化。對於一個在安靜環境中以英語爲母語的人來說,Otter的Liang表示,它的準確率已經超過了95%。在實踐中,你會得到一些有用的轉錄,但還不夠完美。

無論你使用何種NLP工具,你都應該準備好投入時間來定製與你的業務相關的概念和相聯繫的詞彙表,例如你所在行業的技術術語或你自己的產品名稱,以及員工名稱,以便能夠正確的識別它們。

在使用NLP之前,組織需要知道什麼是他們可以接受的錯誤水平,而不僅僅是爲了捷徑或探索,但是Cheng建議將重點放在端到端的體驗上。

“你是如何把這些東西組合在一起,讓人們真正使用,並能夠幫助你的公司或客戶更有效地完成某些事情的,”她問道。

“你不能承諾太多;人工智能不是魔法,雖然自然語言工具的確可以改進很多東西。你的公司現在所面臨的最大問題可能是如何組織你的信息,從你所擁有的文件中獲得更多價值,並讓有專業知識的人來進行指導。”Cheng說。“我們現在有很多遠程工作的經驗,或許我們可以使用人工智能來做得更好。”

【雲棲號在線課堂】每天都有產品技術專家分享!
課程地址:https://yqh.aliyun.com/live

立即加入社羣,與專家面對面,及時瞭解課程最新動態!
【雲棲號在線課堂 社羣】https://c.tb.cn/F3.Z8gvnK

原文發佈時間:2020-07-23
本文作者:Mary Branscombe
本文來自:“51CTO”,瞭解相關信息可以關注“51CTO”。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章