“AI工廠”本質:AI基礎設施及怎樣將AI轉化爲運營動力

來源:TechTalks

作者:Ben Dickson

編譯:科技行者

持續關注人工智能新聞的朋友肯定已經發現,AI這個字眼已經被異化成了兩個截然不同的定義。媒體和影視作品喜歡把AI描述成已然具備人類般的能力、會導致大量失業甚至會出動機械部隊進行人類清剿的末日威脅。但在另一方面,學術研究則更多關注人工智能的具體發展,並承認目前的AI還非常弱小、無法實現人類思維體系中的大部分基本能力。 

但至少可以肯定的是,如今的AI算法已經在醫療保健、金融、製造以及運輸等領域成爲重要的解決方案組件。正如哈佛商學院教授Marco Iansiti與Karim Lakhani在其著作《人工智能時代的競爭:算法與網絡爲主導的時代下的戰略與領導力》一文中所提到,不久之後,“一切人類事務將再也離不開人工智能的輔助。” 

事實上,就是目前的“弱”AI已然引領了谷歌、Amazon、微軟乃至Facebook等科技巨頭的發展與成功,並給全球數十億民衆的日常生活帶來影響。Lakhani與Iansiti在自己的書中提到,“在實際應用中,我們需要的並不一定是完美的人工智能。不夠完美的AI也足以對社交網絡上的內容進行優先級排序、製作品質完美的卡布奇諾咖啡、分析客戶行爲、設定最佳價格甚至以完成不同的風格創造畫作。事實上,這種不完美的弱AI足以改變企業的性質及其運營方式。” 

而哪家企業能夠真正將AI轉化爲運營動力,誰就能開拓出新的市場空間並顛覆傳統行業。能夠適應AI時代的老牌廠商將生存下來並繼續蓬勃發展。而繼續固守傳統方法的公司則錯失AI之力,要麼不復存在、要麼被徹底邊緣化。 

Iansiti與Lakhani在書中討論了諸多主題,其中一大核心正是概念AI工廠,他們將其視爲企業在AI時代競爭並發展的關鍵性前提。 

問題是,“AI工廠”究竟是什麼? 

在當今業務體系中,最關鍵的AI技術在於機器學習算法。算法的實質屬於統計引擎,負責從以往觀察到的數據內收集模式,並據此預測新的結果。機器學習算法與其他關鍵組件(包括數據源、實驗與軟件等)融合起來就建立起AI工廠,代表一組能夠相互連接、促進學習與發展的組件與流程。 

這就是AI工廠的運作方式。從內部及外部來源獲取高質量數據以訓練機器學習算法,再使用算法對特定任務執行預測。在某些情況下,例如疾病診斷與治療等,這類預測可以幫助人類專家做出準確的判斷。而在其他領域(例如內容推薦)當中,機器學習算法可以在幾乎無需任何人爲干預的情況下自動完成所有任務。 

AI工廠的算法與數據驅動模型,使得各類組織得以快速測試新的假設,進而推出變更以不斷改善自身系統。具體措施可以是向現有產品中添加新的功能,也可以在公司的現有資產基礎之上開發新的產品。這一切變化又反過來幫助企業掌握更多新數據、改進AI算法,並再次找到提高性能,創建新服務和產品,通過這樣的良性循環保持發展並衝擊種種新的市場區間。 

Iansiti與Lakhani在《AI時代的競爭》中寫道,“從本質上講,AI工廠在用戶參與、數據收集、算法設計、預測與改進等環節之間建立起一條完整的良性閉環。” 

這種將構建、衡量、學習與改進環節串連起來的想法並不是什麼新鮮事物。企業家與初創公司已經在這一領域擁有多年的理論與實踐經驗。但是,AI工廠憑藉着強大的自然語言處理與計算機視覺技術,將這一循環提升到了新的高度,由此在最近幾年中邁出了全面普及的重要一步。 

《AI時代的競爭》中還列舉了螞蟻金服(現爲螞蟻集團)的案例。該公司成立於2014年,擁有9000名員工,目前爲超過7億用戶提供廣泛的金融服務。而這種前所未有的運營服務效率,依靠的正是高效的AI工廠與卓越領導。相比之下,美國銀行成立於1924年,擁有209000名員工,而服務的對象僅爲6700萬用戶、產品種類也更爲有限。 

Iansiti與Lakhani感嘆道,“螞蟻金服開闢出全新的金融服務概念。” 

“AI工廠”的基礎設施 

衆所周知,機器學習算法高度依賴於大規模數據。目前,關於數據的價值已經有很多耳熟能詳的比喻,例如“數據就是新的石油”,這種陳詞濫調多見於各類紙頭報端。 

但單憑大量數據絕不可能成就好的AI算法。實際上,很多企業都掌握着大量數據儲備,但他們的數據與軟件各自居於孤島之內,存儲形式不統一、模型與框架也互不兼容。 

Iansiti與Lakhani寫道,“即使客戶將企業視爲統一的實體,但事實上企業在各內部機構、部門以及跨職能區劃間的系統與數據大多彼此分散,導致數據難以聚合,延遲了洞見的產生速度,最終導致人們無法充分動用分析與人工智能的力量。” 

此外,在將數據饋送至AI算法之前,我們還需要進行數據預處理。例如,你可能希望使用客戶往來聊天記錄開發一個AI驅動型聊天機器人,由其自動爲部分客戶提供支持服務。在這類場景下,我們首先需要對文本數據進行合併、令牌化、去除多餘的詞彙及標點符號、輔以其他轉換,而後才能將其用於訓練機器學習模型。 

即使面對銷售記錄等結構化數據時,其中同樣可能存在空缺、信息丟失乃至其他需要處理的不確切之處。再有,如果數據來自多種來源,則需要以不致引起誤差的方式加以聚合。如果未經預處理,大家只能使用低質量數據訓練機器學習模型,最終導致AI系統性能不佳。 

最後,內部數據源可能在體量上不足以支撐AI管道的開發。有時候,大家還需要藉助外部來源進行信息補充,例如收集來自社交媒體、股市、新聞等來源的數據。以BlueDot爲例,該公司使用機器學習預測傳染病的傳播情況。爲了訓練並運行其AI系統,BlueDot會自動從數百個來源處收集信息,包括來自衛生組織的聲明、商業航班、牲畜健康報告、衛星氣候數據以及新聞報道等等。該公司的大部分工作內容乃至軟件方案都圍繞數據的收集與聚合設計而生。 

在《AI時代的競爭》中,兩位作者介紹了“數據管道”的概念,通過一組組件與流程對來自多個內部及外部來源的數據進行合併、清洗以及集成,而後處理並存儲結果以供不同AI系統使用。但更重要的是,數據管道必須以“系統化、可持續且可擴展的方式運作”,意味着應儘可能避免手動操作以消除AI工廠中的一切潛在瓶頸。 

Iansiti與Lakhani還進一步探討了AI工廠所面臨的其他挑戰,例如如何爲監督機器學習算法建立正確的指標與特徵,在人類專家洞見與AI預測結果之間找到正確的缺失環節,以及如何應對運行層面的挑戰並驗證結果。 

作者們寫道,“如果將數據視爲向AI工廠提供動力的燃料,那麼基礎設施就是輸送燃料的管道,而算法則是完成工作的機器。反過來,實驗平臺則是負責將燃料、管道與機器接入現有操作系統的閥門。” 

轉型爲AI公司 

從各個角度來看,建立一家成功的AI公司不僅需要克服工程技術層面的挑戰,更需要解決產品管理領域的諸多難題。事實上,不少成功企業已經找到了以AI技術爲基礎建立長期文化與業務流程的實踐方法,而不再單純嘗試將深度學習的最新成果強行融入難以與之匹配的傳統基礎設施。 

這種方式對於初創企業及傳統主流公司都同樣適用。正如Iansiti與Lakhani在《AI時代的競爭》中所闡述,只有那些不斷改變自身運營及商業模式的企業,才能在這樣一個新時代下生存下來。 

他們寫道,“對於傳統企業而言,要想轉型爲一家基於軟件的AI驅動型公司,必須要採取完全不同的組織形式,並把轉型視爲一種新的常態。這並不是說單純建立起新的部門、AI專項團隊或者是偶發性的開發流程,而應建立起由敏捷組織支持的、以數據爲中心的新型運營體系,這將從根本上扭轉公司的運營核心。” 

《AI時代的競爭》還提供豐富的相關案例研究。其中包括Peloton(徹底顛覆了傳統家庭運動器材市場)與Ocado(利用AI技術實現低利潤日用百貨的數字化轉型)等初創企業從零開始建立AI工廠的趣聞軼事。此外,知名科技企業也將以案例形式出現,包括通過多次成功轉型在AI時代實現蓬勃發展的微軟,以及動用數字化及人工智能技術克服自身固有缺陷的沃爾瑪等等。 

AI技術的興起,也給“網絡效應”帶來了新的含義。事實上,這種現象自搜索引擎與社交網絡誕生之初就成爲科技企業的重要研究對象。《AI時代的競爭》討論了網絡領域的各個層面與類型,涵蓋如何通過將AI算法集成至網絡之內以促進增長、推動學習並改進產品。 

正如行業專家們觀察到的那樣,AI技術的進步將給各類組織內的每一位技術人員乃至運營人員產生影響。Iansiti與Lakhani表示,“許多優秀的管理者需要重新接受培訓並學習AI領域的基礎知識,瞭解如何在組織業務及運營模型中有效部署這項技術。但需要強調的是,他們並不需要成爲真正的數據科學家、統計學家、程序員或者AI工程師;正如每位MBA學員都需要掌握一定的財會及運營知識,但卻不必成爲專業會計一樣,如今的企業管理員也需要以同樣的方式對AI以及相關技術建立起初步的認知與理解。”

未來智能實驗室的主要工作包括:建立AI智能系統智商評測體系,開展世界人工智能智商評測;開展互聯網(城市)雲腦研究計劃,構建互聯網(城市)雲腦技術和企業圖譜,爲提升企業,行業與城市的智能水平服務。

  如果您對實驗室的研究感興趣,歡迎加入未來智能實驗室線上平臺。掃描以下二維碼或點擊本文左下角“閱讀原文”

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章