本文主要分爲上下兩部分，（上）部分主要介紹一下企業內部什麼時候需要引入AI技術（這裏的AI技術泛指機器學習、深度學習、NLP、視覺、語音、推薦等），（下）部分主要介紹一下在引入這些AI技術之後的一些情況和企業的技術方向發展。

（上）部分

數據積累

當一個產品是以內容爲主的時候，必然會積累大量的數據，在這個數據爲王的時代，有了數據當前要進行分析、挖掘，然後產出更多的商業價值。這個時候必然需要引入AI技術。

但在數據積累前期，產品、分析、挖掘等更多是基於「規則」進行的。人們總結出一些規則，然後利用編程讓計算機自動的去執行這些規則。基於規則的好處是：人們知道在什麼的數據條件下，會產出什麼樣的數據結果，一切皆可判斷，可以解釋。

當然一些規則會逐漸演變成可解釋的、簡單機器學習模型，比如KNN、K-Means、貝葉斯等。但是基於規則的方法，很難甚至無法總結出有效的規則。這個時候規則就要退場，並逐漸切換到AI技術。AI技術的最底層的根基便是數據，如果沒有數據，何談AI。

「基於數據」的方法簡單說就是:從海量數據中找規律，這些規律是很抽象的，並不能總結成具象的規則。比如:

給機器看海量的貓和狗的照片，它就具備了「區分貓和狗」的能力
給機器海量的中英文對照文章，它就具備了「中英文翻譯」的能力
給機器海量的文章，它甚至可以具備「寫文章」的能力

基於數據的好處是：只要有足夠多的優質數據，那麼機器就能學會某些技能，數據越多，能力越強。

但是基於數據的方法也有明顯的弊端：機器只能告訴你「是什麼」，但是無法告訴你「爲什麼」。這就是模型的不可解釋性。表現最突出的就是神經網絡相關的算法模型。

上邊說了有了數據的時候需要考慮引入AI，但並不僅僅是一些雜亂無章的數據，我們考慮的是數據的四大要素：

特徵

首先我們要理解什麼是特徵？比如當聽到一個人說着一口流利的東北話，我們就知道他可能來自東北，當看到一個人的頭髮短、卷，膚色全黑，但牙齒十分潔白，我們就可以猜測他來自非洲。但一個人說着東北話卻不一定是東北人，可能他在東北上學，一個人符合非洲人的特徵，也有可能是個混血兒。

上面這個例子其實想要說明兩點：

1、AI技術模型的一般流程
2、特徵是AI算法模型的關鍵（當我們想要使用一個算法去評估一個結果時，簡單幾個特徵是不夠的，我們需要引入更多的特徵，同時特徵本身的不確定性也對結果有很大的影響）
- 特徵少+確定性弱：適合人工解決
- 特徵少+確定性強：適合規則解決
- 特徵多+確定性強：適合規則解決
- 特徵多+確定性弱:「可以考慮」 AI 解決

但其實還有很多其他因素:成本、⻛險、是否可測量…這裏不做考慮，否則太複雜了

模型的不可解釋性

在「數據積累」中，提到了模型的不可解釋性。不可解釋的模型只會告訴你結果「是什麼」，而不會告訴你「爲什麼」會產出這個結果。當我們的不可解釋模型中出現badcase時，我們並不能輕易的找到爲什麼會出現這個問題的原因？同樣通常也不能對症下藥，因爲我們的修改和優化都是針對模型整體而言的。

因此在考慮是否使用不可解釋模型去解決一些問題時，需要考慮：

是否需要解釋
是否可容忍

我們先從這2個⻆度來看看普及率較高的AI應用:

案例	是否需要解釋	錯誤容忍度
語音識別	用戶只關心效果好不好，並不關心背後的原理是什麼	偶爾出現一些錯誤並不影響對整句話的理解。少量出錯是可以接受的。
人臉識別	同上	相比語音識別，用戶對出錯的容忍度要低一些，因爲需要重新刷臉
機器翻譯	同上	跟語音識別類似，只要大面上準確，並不影響整體的理解。

再來看一些人力和AI結合的案例

案例	是否需要解釋	錯誤容忍度
智能客服	用戶不關心是人工服務還是機器服務，只要能解決我的問題就行	如果機器客服不能理解我的意圖，無法幫我解決問題，用戶會很不滿意。所以當機器搞不定的時候需要人工來補位
內容審覈	對於審覈不通過的內容，需要解釋原因。通過的內容不需要解釋爲什麼	有一種職業叫「鑑⻩師」，目前正在逐步被機器替代，但是並沒有完全替代，因爲有時候機器會拿不準，這個時候人工來複審

最後看一些不適合AI落地的場景

案例	是否需要解釋	錯誤容忍度
推導定理	科學是絕對嚴謹的，一定是從邏輯上推導出來的，而不是統計出來的。	如果有例外就不能稱作定理，一定是絕對正確沒有錯誤的
寫論文	人工智能已經可以寫小說、詩歌、散文。但是論文這種文體要求非常嚴謹的上下文邏輯。	論文裏是不允許有錯誤的，全文的邏輯要非常清晰，哪怕一個細節出現了邏輯問題，也會造成整篇論文沒有價值。

如果我們把上面提到的案例全部放在象限中，大致如下：

所以在評估是否引入不可解釋的AI技術時，有下面三個準則：

1、解決方案越需要解釋背後的原因，越不適合用深度學習
2、對錯誤的容忍度越低，越不適合使用深度學習
3、上面2條並非絕對判斷標準，還需要看商業價值和性價比，自動駕駛和醫療就是反例。

（下）篇——引入AI後的情況

首先需要明確的是引入AI後並不代表其他勞動可以缺失，AI只是整個內容生產、運營鏈條中的一環而已，不能凡事都交給AI。

這裏插播一個笑話：我經常會聽到一些說，AI不是很厲害嗎，那xxxx不能用AI解決嗎？

是呀，AI技術是能夠挖掘和創造一些價值，但AI也並不是萬能的。我們要對AI樹立正確的態度，合理利用AI技術，繼而帶來更大的產業價值。

沒有任何事情是一蹴而就的，引入AI並不是馬上要見到成效。通常的做法應該是這樣的：

在產品中無論引入什麼技術，我們最終需要追求的就是創造價值。只不過規則時代能夠創造的價值是有限的，而引入AI技術之後，潛能是巨大的。

技術在企業發展中的過程中主要有兩大原則：

1、爲企業創造可見的價值（如營收、用戶）
2、豎立企業技術品牌，擴大其影響力

2 是建立在1的基礎上的，畢竟只有企業生存下來了，纔有資格去談技術品牌和影響力。所以這也就促進了員工在工作期間，不僅要完成工作的內容，同樣也要不斷學習新的技術，擴展自己的知識面和技術實力。當然如果一個人的目標不是技術，那無可厚非，做自己喜歡的事情就好。

所以一個企業的技術肯定是要不斷進步和演化的，不可能固守在規則爲王或者簡單的可解釋算法模型時期，需要引入更加先進的技術，因爲其潛在的能創造的價值是無限的。

這才引入AI技術後，企業技術發展的正確方向。

掃一掃關注微信公衆號！號主專注於搜索和推薦系統，嘗試使用算法去更好的服務於用戶，包括但不侷限於機器學習，深度學習，強化學習，自然語言理解，知識圖譜，還不定時分享技術，資料，思考等文章！

Thinkgamer_ 博客專家

發佈了320 篇原創文章 · 獲贊 492 · 訪問量 202萬+

他的留言板關注

淺談企業如何正確的引入和發展AI算法

（上）部分

數據積累

特徵

模型的不可解釋性

（下）篇——引入AI後的情況

關於接口協議，你必須要知道這些！

一鍵自動化博客發佈工具,用過的人都說好(頭條篇)

01 穩定性（一）如何應對事故並做好覆盤？

美團一面：項目中有 10000 個 if else 如何優化？想了半天，被問懵了！

京東面試：如何進行JVM調優？

線程池那些坑爹的參數-核心線程數&最大線程數&工作隊列

Stream流常用方法總結

獨孤九劍：算法模型訓練的一般流程

傳統機器學習和前沿深度學習推薦模型演化關係介紹

TensorFlow的邏輯迴歸實現

論文｜LinUCB論文的思想解讀、場景應用與痛點說明

常見的五種神經網絡(4)-深度信念網絡（下）篇之深度信念網絡的原理解讀、參數學習

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結