淺談企業如何正確的引入和發展AI算法

在這裏插入圖片描述

本文主要分爲上下兩部分,(上)部分主要介紹一下企業內部什麼時候需要引入AI技術(這裏的AI技術泛指機器學習、深度學習、NLP、視覺、語音、推薦等),(下)部分主要介紹一下在引入這些AI技術之後的一些情況和企業的技術方向發展。

(上)部分

數據積累

當一個產品是以內容爲主的時候,必然會積累大量的數據,在這個數據爲王的時代,有了數據當前要進行分析、挖掘,然後產出更多的商業價值。這個時候必然需要引入AI技術。

但在數據積累前期,產品、分析、挖掘等更多是基於「規則」進行的。人們總結出一些規則,然後利用編程讓計算機自動的去執行這些規則。基於規則的好處是:人們知道在什麼的數據條件下,會產出什麼樣的數據結果,一切皆可判斷,可以解釋。

當然一些規則會逐漸演變成可解釋的、簡單機器學習模型,比如KNN、K-Means、貝葉斯等。但是基於規則的方法,很難甚至無法總結出有效的規則。這個時候規則就要退場,並逐漸切換到AI技術。AI技術的最底層的根基便是數據,如果沒有數據,何談AI。

「基於數據」的方法簡單說就是:從海量數據中找規律,這些規律是很抽象的,並不能總 結成具象的規則。比如:

  • 給機器看海量的貓和狗的照片,它就具備了「區分貓和狗」的能力
  • 給機器海量的中英文對照文章,它就具備了「中英文翻譯」的能力
  • 給機器海量的文章,它甚至可以具備「寫文章」的能力

基於數據的好處是:只要有足夠多的優質數據,那麼機器就能學會某些技能,數據越多, 能力越強。

但是基於數據的方法也有明顯的弊端:機器只能告訴你「是什麼」,但是無法告訴你「爲什麼」。這就是模型的不可解釋性。表現最突出的就是神經網絡相關的算法模型。

上邊說了有了數據的時候需要考慮引入AI,但並不僅僅是一些雜亂無章的數據,我們考慮的是數據的四大要素:
數據的四大要素

特徵

首先我們要理解什麼是特徵?比如當聽到一個人說着一口流利的東北話,我們就知道他可能來自東北,當看到一個人的頭髮短、卷,膚色全黑,但牙齒十分潔白,我們就可以猜測他來自非洲。但一個人說着東北話 卻不一定是東北人,可能他在東北上學,一個人符合非洲人的特徵,也有可能是個混血兒。

上面這個例子其實想要說明兩點:

  • 1、AI技術模型的一般流程
    AI算法的一般流程

  • 2、特徵是AI算法模型的關鍵(當我們想要使用一個算法去評估一個結果時,簡單幾個特徵是不夠的,我們需要引入更多的特徵,同時特徵本身的不確定性也對結果有很大的影響)
    特徵時AI算法的關鍵

    • 特徵少+確定性弱:適合人工解決
    • 特徵少+確定性強:適合規則解決
    • 特徵多+確定性強:適合規則解決
    • 特徵多+確定性弱:「可以考慮」 AI 解決

但其實還有很多其他因素:成本、⻛險、是否可測量…這裏不做考慮,否則太複雜了

模型的不可解釋性

在「數據積累」中,提到了模型的不可解釋性。不可解釋的模型只會告訴你結果「是什麼」,而不會告訴你「爲什麼」會產出這個結果。當我們的不可解釋模型中出現badcase時,我們並不能輕易的找到爲什麼會出現這個問題的原因?同樣通常也不能對症下藥,因爲我們的修改和優化都是針對模型整體而言的。

因此在考慮是否使用不可解釋模型去解決一些問題時,需要考慮:

  • 是否需要解釋
  • 是否可容忍

兩個維度

我們先從這2個⻆度來看看普及率較高的AI應用:

案例 是否需要解釋 錯誤容忍度
語音識別 用戶只關心效果好不好,並不關心背後的原理是什麼 偶爾出現一些錯誤並不影響對整句話的理 解。少量出錯是可以接受的。
人臉識別 同上 相比語音識別,用戶對出錯的容忍度要低一些,因爲需要重新刷臉
機器翻譯 同上 跟語音識別類似,只要大面上準確,並不影 響整體的理解。

再來看一些人力和AI結合的案例

案例 是否需要解釋 錯誤容忍度
智能客服 用戶不關心是人工服務還是機器服務,只要能解決我的問題就行 如果機器客服不能理解我的意圖,無法幫我解決問 題,用戶會很不滿意。所以當機器搞不定的時候需要人工來補位
內容審覈 對於審覈不通過的內容,需要解釋原因。通過的內容不需要解釋爲什麼 有一種職業叫「鑑⻩師」,目前正在逐步被機器替 代,但是並沒有完全替代,因爲有時候機器會拿不 準,這個時候人工來複審

最後看一些不適合AI落地的場景

案例 是否需要解釋 錯誤容忍度
推導定理 科學是絕對嚴謹的,一定是從邏輯上推導出來的,而不是統計出來的。 如果有例外就不能稱作定理,一定是絕對正確沒有錯誤的
寫論文 人工智能已經可以寫小說、詩歌、散文。但是論文這種文體要求非常嚴謹的上下文邏輯。 論文裏是不允許有錯誤的,全文的邏輯要非 常清晰,哪怕一個細節出現了邏輯問題,也 會造成整篇論文沒有價值。

如果我們把上面提到的案例全部放在象限中,大致如下:
AI落地的評估

所以在評估是否引入不可解釋的AI技術時,有下面三個準則:

  • 1、解決方案越需要解釋背後的原因,越不適合用深度學習
  • 2、對錯誤的容忍度越低,越不適合使用深度學習
  • 3、上面2條並非絕對判斷標準,還需要看商業價值和性價比,自動駕駛和醫療就是反例。

(下)篇——引入AI後的情況

首先需要明確的是引入AI後並不代表其他勞動可以缺失,AI只是整個內容生產、運營鏈條中的一環而已,不能凡事都交給AI。

這裏插播一個笑話:我經常會聽到一些說,AI不是很厲害嗎,那xxxx不能用AI解決嗎?

是呀,AI技術是能夠挖掘和創造一些價值,但AI也並不是萬能的。我們要對AI樹立正確的態度,合理利用AI技術,繼而帶來更大的產業價值。

沒有任何事情是一蹴而就的,引入AI並不是馬上要見到成效。通常的做法應該是這樣的:
引入AI

在產品中無論引入什麼技術,我們最終需要追求的就是創造價值。只不過規則時代能夠創造的價值是有限的,而引入AI技術之後,潛能是巨大的。

技術在企業發展中的過程中主要有兩大原則:

  • 1、爲企業創造可見的價值(如營收、用戶)
  • 2、豎立企業技術品牌,擴大其影響力

2 是建立在1的基礎上的,畢竟只有企業生存下來了,纔有資格去談技術品牌和影響力。所以這也就促進了員工在工作期間,不僅要完成工作的內容,同樣也要不斷學習新的技術,擴展自己的知識面和技術實力。當然如果一個人的目標不是技術,那無可厚非,做自己喜歡的事情就好。

所以一個企業的技術肯定是要不斷進步和演化的,不可能固守在規則爲王或者簡單的可解釋算法模型時期,需要引入更加先進的技術,因爲其潛在的能創造的價值是無限的。

這才引入AI技術後,企業技術發展的正確方向。


掃一掃 關注微信公衆號!號主 專注於搜索和推薦系統,嘗試使用算法去更好的服務於用戶,包括但不侷限於機器學習,深度學習,強化學習,自然語言理解,知識圖譜,還不定時分享技術,資料,思考等文章!

發佈了320 篇原創文章 · 獲贊 492 · 訪問量 202萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章