人工智能的新業務(以及與傳統軟件的區別)

馬丁·卡薩多 ( Martin Casado)馬特 ·伯恩斯坦 ( Matt Bornstein)

從技術上講,人工智能似乎是軟件的未來。 人工智能在一系列棘手的計算機科學問題上顯示出了驚人的進步,並且軟件開發人員的工作正在發生根本性的變化,軟件開發人員的在數據上的工作,和源代碼上的工作一樣多了。

許多AI公司(和投資者)都押注,這種關係將不僅限於技術領域 - AI業務也將類似於傳統軟件公司。 根據我們與AI公司合作的經驗,我們不太確定。

我們堅信AI能夠推動業務轉型:我們已經將資金投入了這一主題,並且我們將繼續在應用AI公司和AI基礎設施方面進行大量投資。 但是,我們注意到,在很多情況下,人工智能公司的經濟結構與軟件業務根本不一樣。 有時,它們甚至看起來更像傳統服務公司。 特別是,許多AI公司具有:

  1. 較低毛利率:由於大量使用雲基礎架構和持續的人工支持;
  2. 規模擴大挑戰:由於邊緣案例的棘手問題而帶來的;
  3. 較弱防禦護城河:由於AI模型的商品化和數據網絡效應帶來的挑戰。

有趣的是,在AI公司的財務數據中我們看到了一個出乎意料的一致模式,毛利率通常在50-60%的範圍內-遠低於可比的SaaS業務的60-80%以上的基準。 早期的私人資本可以在短期內掩蓋這些效率低下的情況,特別是在一些投資者推動增長而非盈利的情況下。 但是,尚不清楚某一數量的長期產品或走向市場(GTM)優化可以完全解決這一問題。

正如SaaS與本地軟件相比引入了一種新穎的經濟模式一樣,我們認爲AI正在創造一種本質上新型的業務 。 因此,本文探討了AI公司與傳統軟件公司的不同之處,並就如何解決這些差異分享了一些建議。 我們的目標不是規範性的,而是幫助運營者和其他人瞭解AI的經濟和戰略前景,以便他們可以建立持久的公司。

我們注意到,在很多情況下,人工智能公司的經濟結構與軟件業務根本不一樣。有時,它們甚至看起來更像傳統服務公司。

軟件+服務= AI?

軟件(包括SaaS)的魅力在於它可以一次生產並多次出售。 該屬性創造了許多引人注目的業務收益,包括經常性收入流,高(60-80%+)的毛利率,以及(在相對罕見的情況下,如果網絡效應或規模效應得以控制) 超線性的規模擴大。 軟件公司還具有建立強大的防禦性護城河的潛力,因爲它們擁有工作所產生的知識產權(通常是代碼)。

服務業佔據了另一種情況。 每個新項目都需要專門的人員,並且只能出售一次。 結果,收入往往是非經常性的,毛利率較低(30%至50%),並且規模擴大在最好情況下也是線性的。 可防禦性更具挑戰性 - 通常基於品牌或現有客戶的控制 - 因爲客戶不擁有的任何知識產權都不太可能具有廣泛的適用性。

人工智能公司越來越多地將軟件和服務兩者結合在一起。

大多數AI應用程序看起來和感覺都像普通軟件。 他們依靠常規代碼執行諸如與用戶交互,管理數據或與其他系統集成之類的任務。 但是,應用程序的核心是一系列訓練的數據模型。 這些模型理解圖像,轉錄語音,生成自然語言並執行其他複雜任務。 維護它們有時會感覺更像是服務業務 – 需要大量的、針對特定客戶的工作和投入成本,而這些成本卻超出了典型支持和成功的職責。

這種動態變化以多種重要方式影響着AI業務。 在以下各節中,我們將探討 - 毛利率,可擴展性和可防禦性。

越來越多的AI公司似乎在毛利率,可擴展性和可防禦性上將軟件和服務的要素結合在一起,這可能完全代表一類新的業務。

毛利率,第1部分:雲基礎設施對AI公司來說是一筆巨大的成本,有時甚至是隱藏的成本 

在內部部署軟件的舊時代,交付產品意味着淘汰和運輸物理介質 - 無論是在服務器還是臺式機上運行軟件的成本均由買方承擔。 如今,在SaaS的主導下,該成本已被推回給供應商。 大多數軟件公司每個月都要支付大量的AWS或Azure賬單 - 軟件要求越高,賬單就越高。

事實證明,人工智能的要求很高:

  • 訓練一個AI模型可能會花費數十萬美元(或更多)的計算資源。 儘管將其視爲一次性成本很誘人,但重新訓練已被視爲一項持續的成本,因爲供給AI模型的數據會隨着時間而變化(這種現象稱爲“數據漂移”)。
  • 與運行傳統軟件相比, 模型推斷 (在生產中生成預測的過程)在計算上也更加複雜。 與從數據庫中讀取數據相比,執行一連串的矩陣乘法正好需要更多的數學運算。
  • 與傳統軟件相比,人工智能應用更有可能在圖像,音頻或視頻等富媒體上運行。 這些類型的數據消耗的資源比通常的存儲資源高,處理成本高,並且經常遇到關注區域問題 - 應用程序可能需要處理一個大文件才能找到相關的小片段。
  • 已經有AI公司告訴我們,與傳統方法相比, 雲計算操作可能更復雜,成本更高,尤其是因爲沒有好的工具可以在全球範圍內擴展AI模型。 結果,一些AI公司必須定期在雲區域之間轉移訓練的模型 - 花費大量的進出成本 - 以提高可靠性,延遲和合規性。

總而言之,這些效力貢獻了AI公司經常在雲資源上花費的收入的25%或更多。 在極端情況下,處理特別複雜任務的初創企業實際上發現手動數據處理比執行經過訓練的模型便宜。

可以通過專用AI處理器的形式來提供幫助,這些AI處理器可以更有效地執行計算,優化技術(例如模型壓縮和交叉編譯)可以減少所需的計算數量。

但是尚不清楚效率曲線的形狀。 在許多問題領域中,需要成倍增長的處理和數據來獲得越來越高的準確性。 就像我們之前提到的,這意味着模型的複雜性正以驚人的速度增長,並且處理器不太可能跟上。 摩爾定律是不夠的。(例如,自2012年以來,訓練最先進的AI模型所需的計算資源增長了300,000倍,而NVIDIA GPU的晶體管數量僅增長了約4倍!)分佈式計算是解決此問題的有力方法,但主要解決速度問題,而不是解決成本問題。

毛利率,第2部分:許多AI應用程序都依靠“人工參與”來以較高的精度運行

人工參與系統有兩種形式,這兩種形式都會導致許多AI初創公司的毛利率降低。

第一:訓練當今大多數最先進的AI模型涉及到手動清理和標記大型數據集。 這個過程費力、昂貴,並且是更廣泛採用AI的最大障礙之一。 另外,如上所述,一旦部署了模型,訓練就不會結束。 爲了保持準確性,需要不斷捕獲、標記新的訓練數據,並將其反饋到系統中。 儘管諸如漂移檢測(drift detection)和主動學習(active learning)之類的技術可以減輕負擔,但傳聞數據顯示,許多公司在此過程中的支出高達收入的10-15%(通常不計入核心工程資源),並且表明正在進行的開發工作超出了典型的錯誤修復和功能增加。

第二:對於許多任務,尤其是那些需要更多認知推理的任務,人類通常會實時插入AI系統。 例如,社交媒體公司僱用了數千名人工審覈員來增強基於AI的審覈系統。 許多自動駕駛汽車系統都包括遠程操作員,大多數基於AI的醫療設備都與作爲聯合決策者的醫生進行交互。 隨着越來越多的現代AI系統的能力被理解,越來越多的初創公司正在採用這種方法。 計劃出售純軟件產品的許多AI公司越來越多地將服務能力引入內部,並預定相關成本。

隨着AI模型性能的提高,對人工干預的需求可能會下降。 但是,不太可能將人類完全淘汰。 無人駕駛汽車等許多問題過於複雜,以至於無法通過當前的AI技術實現完全自動化。 安全、公平和信任的問題也需要人爲監督,這一事實很可能已體現在美國歐盟和其他地區當前正在制定的AI法規中。

隨着AI模型性能的提高,對人工干預的需求可能會下降。但是,不太可能將人類完全淘汰。

即使我們最終實現了某些任務的完全自動化,也尚不清楚由此可以提高多少利潤。 AI應用程序的基本功能是處理輸入數據流並生成相關的預測。 因此,運營該系統的成本是所處理數據量的函數。 一些數據點(data points)由人工處理(相對昂貴),而其他數據點則由AI模型自動處理(希望更便宜)。 但是每個輸入都需要被處理,以一種或另一種方式。

因此,到目前爲止,我們已經討論了兩類成本,即雲計算和人工支持。 減少一個往往會導致另一個增加。 這一方程式中的兩個因素都可以被優化,但沒有一個可能達到與SaaS業務相關的接近零成本水平。

AI系統擴大規模可能比預期的要困難得多,因爲AI存在於長尾中

對於AI公司而言,知道何時能找到適合市場的產品比傳統軟件要難得多。 容易想到您已經達到這種狀況了 - 尤其是在拒絕5-10個大的客戶之後 - 只看到了ML(機器學習)團隊的積壓工作開始膨脹,客戶部署計劃開始不堪重負,從而資源無法支持新銷售。

在許多情況下,罪魁禍首是邊緣案例。許多AI應用程序都有開放式界面,並且可以處理有噪聲的非結構化數據(例如圖像或自然語言)。 用戶通常對產品缺乏直覺,或更糟糕的是,假定產品具有人類/超人類的能力。 這意味着邊緣案例無處不在:我們研究的AI產品的預期功能的多達40-50%可以在用戶意圖的長尾範圍內。

換句話說,用戶可以 - 並將 - 把幾乎所有內容輸入AI應用程序。

用戶可以 - 並將 - 把幾乎所有內容輸入AI應用程序。

處理這個巨大的狀態空間往往是一件繁瑣的事情。 由於可能的輸入值範圍如此之大,因此每個新的客戶部署都可能生成從未見過的數據。 即使是看起來相似的客戶(例如,兩家汽車製造商都在進行缺陷檢測)也可能需要實質上不同的訓練數據,這是因爲將視頻攝像機放置在裝配線上很簡單。

一位創始人稱這種現象爲AI產品的“時間成本”。 她的公司在每個新的客戶導入開始時都會進行專門的數據收集和模型微調。 這使他們可以查看客戶數據的分佈,並消除了部署前的一些邊緣案例。 但這還帶來了成本:公司的團隊和財務資源被捆綁在一起,直到模型準確性達到可接受的水平。 訓練週期的持續時間通常也是未知的,因爲通常沒有什麼選擇可以更快地生成訓練數據……無論團隊如何努力。

人工智能初創公司通常最終會花費比預期更多的時間和資源來部署其產品。 提前識別這些需求可能很困難,因爲傳統的原型設計工具(例如模型,原型或Beta測試)往往只覆蓋最常見的路徑,而不能涵蓋邊緣案例。 與傳統軟件一樣,在最早的客戶羣中,該過程特別耗時,但是與傳統軟件不同,該過程不一定會隨着時間的流逝而消失。

捍衛AI業務的劇本仍在編寫中

偉大的軟件公司圍繞強大的護城河而建。 最好的護城河是像網絡效應、高交換成本和規模經濟一樣的強大的力量。

所有這些因素對於AI公司也是可能的。 可防禦性的基礎通常是由技術上優越的產品而形成的,尤其是在企業中。 作爲第一個實現複雜軟件的公司,可以帶來很大的品牌優勢和幾乎排他的時期。

在AI世界中,很難實現技術差異化。 新的模型架構主要是在開放的學術環境中開發的。 可以從開源庫中獲得參考實現(預訓練的模型),並且可以自動優化模型參數。 數據是AI系統的核心,但通常由客戶擁有,在公開領域或隨着時間的流逝成爲商品。 隨着市場的成熟,其價值也逐漸下降,並且網絡效應相對較弱。 在某些情況下,我們甚至發現與供給AI業務的數據相關的規模不經濟 。 隨着模型變得更加成熟(如“ 數據護城河的空頭承諾 ”所述),每種新的邊緣案例解決成本都越來越高,同時爲越來越少的相關客戶提供價值。

這並不一定意味着AI產品的防禦性要比其純軟件產品低。 但是,對於人工智能公司而言,護城河似乎比許多人預期的要淺。 從可防禦性的角度來看,人工智能在很大程度上可能是一個通向潛在產品和數據的途徑。

這並不一定意味着AI產品的防禦性要比其純軟件產品低。但是,對於人工智能公司而言,護城河似乎比許多人預期的要淺。

建立、擴展和捍衛優秀的AI公司 - 給創始人的實用建議

我們認爲,人工智能公司要取得長期成功,關鍵是要應對挑戰,並充分利用服務和軟件的優勢。 秉承這種精神,創始人可以採取許多步驟來使新的或現有的AI應用程序蓬勃發展。

儘可能 消除 模型複雜性  我們已經看到,在每位客戶訓練一個唯一模型的初創公司與能夠在所有客戶之間共享一個模型(或一組模型)的初創公司之間,COGS存在巨大差異。 “單一模型”策略更易於維護,更快地推向新客戶,且支持一個更簡單、更高效的工程組織。 它還趨向於減少數據流水線的蔓延和重複的訓練運行,重複的訓練運行可以顯著提高雲基礎架構的成本。 雖然沒有達到理想狀態的靈丹妙藥,但關鍵之一是達成協議之前要儘可能多地瞭解您的客戶及其數據。 有時候,很明顯,新客戶會爲您的ML工程工作帶來巨大的負擔。 在大多數情況下,更改會更加細微,僅涉及少數幾個獨特的模型或進行一些微調。 做出這些判斷(權衡長期經濟健康與近期增長)是AI創始人面臨的最重要工作之一。

仔細選擇問題領域(通常是狹窄範圍),以降低 數據複雜性  從根本上說,使人工勞動自動化是一件很難的事。 許多公司發現AI模型的最小切實可行的任務比他們預期的要窄。 例如,有些團隊發現在電子郵件或職位發佈中提供簡短的建議很成功,而不是提供通用的文本建議。 CRM領域的公司已經發現,基於AI的只關於更新記錄,可以爲AI找到非常有價值的市場定位。 像這樣的一大類問題,人類很難執行,而AI則相對容易。 它們往往涉及大規模,低複雜度的任務,例如審覈,數據輸入/編碼,轉錄等。專注於這些領域可以最大程度地減少持續性邊緣案例帶來的挑戰,換句話說,它們可以簡化供給人工智能開發過程的數據。

我們認爲,人工智能公司要取得長期成功,關鍵是要應對挑戰,並充分利用服務和軟件的優勢。

計劃高可變成本。 作爲創始人,您應該爲您的業務模型(business model)提供可靠,直觀的思維框架。 這篇文章中討論的成本可能會變好(降低一定幅度),但假設它們將完全消失(或非自然的強制)將是錯誤的。 相反,我們建議考慮在較低毛利率的情況下建立業務模型和GTM戰略。 給創始人的一些好的建議:深刻理解供給模型的數據的分佈。將模型維護和失效人工接管視爲首要問題。 跟蹤並衡量您的實際可變成本(不要讓它們隱藏在研發中)。 在您的財務模型中做出保守的單位經濟假設,尤其是在籌款期間。 不要等待規模擴大或外部技術進步來解決該問題。

擁抱服務。 有巨大的機會來滿足它所在的市場。 這可能意味着要提供全棧翻譯服務而不是翻譯軟件,或者提供出租車服務而不是出售自動駕駛汽車。 建立混合業務比純軟件更難,但是這種方法可以提供對客戶需求的深刻洞察,併產生快速發展的,市場定義的公司。 服務也可以成爲啓動一家公司的走向市場(go-to-market)引擎的絕佳工具 - 相關更多信息請參閱這篇文章 - 特別是在銷售複雜和/或全新技術時。 關鍵是要以一種堅定的方式追求一種策略,而不是同時支持軟件和服務客戶​​。

計劃技術堆棧中的改變。 現代AI仍處於起步階段。 幫助從業人員以高效和標準化的方式完成工作的工具現在正在被構建。 在接下來的幾年中,我們希望看到工具的廣泛使用,以使模型訓練自動化,提高推理效率,標準化開發人員工作流以及監控和保護生產中的AI模型。 通常,作爲軟件公司要解決的成本問題,雲計算也越來越受到關注。 將一個應用程序緊密耦合到當前的工作方式,可能會在導致將來在體系結構上的劣勢。

用老式的方法建立可防禦性。 雖然尚不清楚AI模型本身 - 或其底層數據 - 是否會提供長期的護城河,但好產品和專有數據幾乎總能建立良好的業務。 人工智能爲創始人提供瞭解決舊問題的新視角。 例如,人工智能技術通過簡單地表現出更好的性能,在相對冷清的惡意軟件檢測市場中已經產生了新的價值。 在最初的獨特產品功能之上構建粘性產品和持久業務的機會是永恆的。 有趣的是,我們還發現有幾家AI公司通過有效的雲戰略鞏固了自己的市場地位,類似於最新一代的開源公司。

* * *

總結一下:從傳統意義上講,當今大多數AI系統都不是完全軟件。 結果,人工智能業務看起來並不完全像軟件業務。 它們涉及持續的人力支持和重大可變成本。 他們通常沒有我們想要的那麼容易擴大規模。 強大的防禦能力(​​對於“一次製造/多次出售”軟件模型至關重要)似乎並不是免費到來的。

這些特徵在某種程度上使AI感覺像服務業。 換句話說,您可以更換服務公司,但不能(完全)更換服務。

信不信由你,這可能是個好消息。 諸如可變成本,規模擴大動態和防禦護城河之類的事物最終由市場決定 - 而不是單個公司。 我們在數據中看到不熟悉的模式,這一事實表明AI公司確實是新事物 - 進入新市場並創造大量機會。 已經有許多偉大的AI公司成功地在思想迷宮中航行,並製造出性能始終如一的產品。

諸如可變成本,規模擴大動態和防禦性護城河之類的事物最終由市場決定 - 而不是單個公司。我們在數據中看到不熟悉的模式,這一事實表明AI公司確實是新事物 – …

人工智能仍處於從研究課題到生產技術的過渡的早期階段。 很容易忘記,可以說引發了當前AI軟件開發浪潮的AlexNet是不到八年前發佈的。 智能應用程序正在推動軟件行業向前發展,我們很興奮將看到下一步它們向哪發展。

資料來源:傳統軟件的毛利率估計是基於publiccomps.com上列出的一些公司得出的; 服務公司的毛利率估算基於1萬份申報; 人工智能業務的毛利率估算基於對人工智能初創公司創始人的幾次採訪。

 

英文原文鏈接:https://a16z.com/2020/02/16/the-new-business-of-ai-and-how-its-different-from-traditional-software/?from=groupmessage&isappinstalled=0

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章