下一個中臺“戰場”:人工智能大廠的冰與火之歌

從《2017互聯網科技創新白皮書》將移動互聯網之後定義爲人工智能時代,到2018年馬化騰提出人工智能領域“奧林匹克”。如果說雲計算的下半場是人工智能,騰訊又將如何佈局以應對未來的不確定性及挑戰?

近幾年人工智能技術得以迅猛發展,這和雲計算提供的強大算力和大數據領域多年的積累是分不開的。而就在人人探討如何打破數據孤島,“數據中臺”已成爲大數據領域的一個重要理念之時,騰訊卻表示,在打通數據和利用數據方面,數據保護和隱私保護是最需要優先考慮的。

“數據中臺的建設目標,是對業務系統和應用開發者提供更加高效、簡潔、靈活的數據服務,使得上層建築不會受限於底層多變的數據格式、數據類型、數據處理和管理邏輯以及複雜的基礎架構建設和運維,從而最大限度的釋放數據的價值,幫助業務團隊及時滿足複雜、快速、多變的市場和客戶需求。” 在 5 月 21 日召開的騰訊全球數字生態大會上,騰訊雲副總裁王龍接受採訪時說道,“騰訊從未表示不做數據中臺,只是我們認爲,並不是一定要把騰訊數據打通並開放使用纔是“數據中臺”。 騰訊的做法是從客戶的真實需求出發,把騰訊積累多年的構建數據服務的一系列工具開放出來,幫助客戶構建更加適合自身的數據中臺。”

在產業互聯網時代,數據中臺對於企業的業務發展來說,起着更加重要的作用。那麼,騰訊如何佈局數據中臺?如何以數據中臺爲基礎,不斷拓展其AI發展和應用的邊界?騰訊雲AI下一站又如何佈局呢?

騰訊雲副總裁 王龍

從數據中臺到AI中臺

“與數據中臺類似,AI 中臺也需要爲業務系統和應用開發者提供簡單、高效、靈活的各種 AI 服務。 在這個過程中,數據中臺一方面成爲 AI 模型訓練中非常重要的數據和算力來源;另一方面,AI 推理的結果也能夠反饋給數據中臺,提升數據中臺的服務能力。”

5 月 22 日,在騰訊數字生態大會 AI 專場上王龍稱,人工智能已經逐步進入深水區,在很多場景下,需要多種數據、算法和模型聯合使用來提升 AI 服務的效果。

早在此前 Analytics Vidhya 發佈的一份 2018 人工智能技術總結與 2019 趨勢預測報告中,Analytics Vidhya 就曾對人工智能技術在實際場景中的落地進行預測,並表示在 2019 年,計算機視覺等領域對現有方法的改進和增強可能多於創造新方法。

以騰訊雲業界領先的刷臉支付和實人實名驗證場景爲例,就需要使用騰訊優圖的 OCR、人臉比對、活體檢測等多種人工智能算法來確保覈驗的效果,有時甚至需要使用更爲前沿的脣語檢測、聲紋識別能力。再加上已經成熟應用多年的大數據風控和安全模型,合作伙伴和客戶的業務辦理就能得到更強大、更全方位的安全保障。

再以騰訊雲在保險行業推出的智能覈保解決方案爲例,多種 OCR、機器學習和 NLP 算法相結合,就能智能化的處理從客戶提交投保材料到產生覈保結果的全流程,提升企業運作的效率和終端用戶的體驗。

AI 模型訓練方面也是如此。以已有衆多社交、遊戲、電商、金融等行業客戶的騰訊雲 ASR 服務爲例,這一來自於微信智聆和微信智言團隊的服務,基於多種序列神經網絡結構,如 LSTM、AttentionModel、DeepCNN 等,採用 Multitask 混合訓練方法,結合 T/S 方式,使得騰訊雲 ASR 服務在通用和垂直領域都有行業領先的識別精度。

“AI 中臺和數據中臺也有顯著的差異。要給業務系統和應用開發中提供高效、簡單、靈活的 AI 服務,除了要解決傳統數據中臺遇到的困難,還需要關注另外兩個更加複雜的緯度:一是使用的數據常常來自於非手機之外的智能設備,例如各種攝像頭、傳感器等,其質量和規模受外界環境影響很大,導致 AI 應用效果常常很不穩定,且難以標準化擴展;二是深度神經網絡的不可解釋性,導致超出預期的數據標註成本、模型優化次數和訓練時長,這成爲 AI 應用規模化的巨大瓶頸。騰訊推出的雲智天樞人工智能服務平臺,其目的和使命就是爲了解決這些問題。”王龍進一步闡述了 AI 中臺和數據中臺的定位。

AI 中臺賦能雲邊端:騰訊雲智天樞架構初探

藉助一個平臺或者中臺,將軟件服務中代表成本和效率的標準化,與代表客戶體驗和業務敏捷度的的定製化做更好的平衡,這是所有新技術的發展趨勢。AI 中臺充分利用數據中臺能力的同時,需要更有效的圍繞 AI 來構建智能服務的各層架構,它嘗試解決如下的問題:

  • 和數據平臺結合,利用其能力作爲數據支撐,最大化的發揮數據平臺的價值;
  • 高效拆分服務構建環節,智能服務開發流程化,快速響應業務需求;
  • 利用元數據管理方式,提供統一的標準格式,場景可以多人協同配合開發;
  • 基礎設施共享化,模型的訓練和發佈與數據平臺有效綁定,服務的構建自動化;
  • 統一的元數據管理系統,模型的全生命週期可管理;
  • 通用 AI 能力平臺化,降低人員要求,提升協作效率。

爲此,騰訊憑藉着多年的技術和能力積累,將 AI 能力應用於產業中複雜的多算法融合場景,通過騰訊雲智天樞人工智能服務平臺(以下簡稱爲“雲智天樞”)這一開放、高效的平臺服務,不斷的輸出騰訊的 AI 中臺能力。

在本次大會上,“騰訊雲智天樞”也發佈了重大更新。針對其誕生背景、設計思路及底層技術實現方式,InfoQ 記者也在會後對騰訊雲內部該平臺的負責人進行了深度對話。

“雲智天樞”的架構類似操作系統,既包括各種硬件的驅動程序,也包括各種組件開發、部署、監控和管理工具。在應用架構方面,“雲智天樞”從功能模塊上分爲 6 大窗口,分別是應用中心、AI 工作室、算法倉庫、數據中心、設備中心、管理中心。而在技術架構方面,“雲智天樞”採用微服務架構和容器化部署,架構層次上採用典型的三層設計,包含網關接入層、邏輯層、存儲層。

同時,在此次騰訊全球數字生態大會上,騰訊雲副總裁王龍也發佈了“雲智天樞”的重大更新——可實現 10 行代碼完成一個 AI 任務的編排與調度,快速構建專屬雲邊端智能應用。

針對於平臺內 AI 任務的編排與調度的實現方式,記者在採訪中得知,任務編排的本質是需要實現一個流程引擎的運行 DAG 圖,讓流程引擎服務按照圖中配置的規則運行整個流程。作爲“雲智天樞”中的一個重要模塊,AI 工作室承擔 AI 任務編排的重要工作。在 AI 任務編排的過程中,使用來自於設備中心、算法倉庫、數據中心等多方提供的組件,必然面臨不同的組件通信協議不一致的問題,此時,需要平臺提供合適的流程引擎來進行適配和驅動。

在任務的調度方面,AI 工作室實現了中央調度服務,中央調度服務主要實現兩個大方面的功能,即任務調度與容錯。中央調度服務的調度策略支持隨機調度,輪詢調度等。未來會實現按流程引擎服務的負載進行調度,分配任務的時候優先選擇負載低的節點,做到全局負載均衡。

而流程引擎服務本身是無狀態的,每次運行都會根據中央調度服務無的指令來執行任務。中央調度服務會收集每個流程引擎服務的狀態,當發現有服務宕過,會重新把原屬於該節點的任務再分配給這個服務。當發現服務是宕掉無法重啓或者機器死機,會把屬於這個流程引擎服務的所有任務重新調度到其他流程引擎服務。

一個好的流程引擎,需要足夠穩定,保證任務在執行過程中不被頻繁的打斷或重啓。但目前常見的問題是,多個任務在同一個引擎上運行,當一個任務在執行中或者出現異常,將導致其他的任務不可用。AI 工作室的流程引擎通過對任務進行分組,而非無規則的混合部署,來避免此類問題的產生。按任務分配流程引擎的方式,一個任務獨佔一個流程引擎的容器,完全規避任務之間的相互影響,從而提升穩定性。

通過基於騰訊雲智天樞構建的 AI 中臺,開發者能夠簡單、快捷的連接和使用騰訊雲的各種其他產品、服務和中臺能力。AI 中臺不僅是數據中臺在業務上的演進,更是系統服務的重組的過程,而這個“持續智能”的過程正是 AI 落地的核心思想。

AI 落地仍有挑戰:AI 中臺勢在必行

現如今,人工智能是解放生產力最直接的手段,也是產業升級必須跨越的“坎”。相比於前兩年,人工智能技術的熱度已經漸漸趨緩。然而,對企業而言,AI 的落地之路仍舊“坎坷”。

騰訊雲副總裁王龍在大會現場表示,現如今,AI 在產業互聯網落地仍面臨如下幾大挑戰:

  • 當人工智能與企業生產應用系統深度融合時,如何滿足 AI 激發出的創新訴求所帶來的應用多樣性?
  • 智能設備選型、部署環境,與算法的適配效果息息相關,如何在這三者之間做最高效的集成和適配?
  • 企業的真實場景中,已有 IT 系統和新增的智能設備,尤其是邊緣設備衆多,導致數據類型差異大,數據清洗、管理和標註工作強度大,如何能夠大幅降低成本?
  • 定製化建模成本高,人才匱乏,如何能夠真正可行的降低 AI 建模和調參的門檻?
  • AI 數據和計算越來越多的發生在邊緣,如何能更好的和雲的基礎設施配合,達到更高的利用效率?

對此,王龍認爲:“應用場景、資源與基礎設施、算法和模型、智能設備、數據質量和規模構成了 AI 技術落地的五個密不可分的要素。如何將這五大要素實現高效協同,是 AI 技術在產業界落地中的關鍵,也是 AI 中臺最重要的任務之一。”

結語

從平臺到中臺,助力 AI 技術一步步落地,是一個循序漸進的過程。數據中臺和 AI 中臺都應秉持相同的理念,降低新技術應用的門檻,提升各行各業的數字化和信息化水平,助力產業互聯網的智能化升級。

但數據中臺和 AI 中臺都只是工具,企業需要從自身的市場和業務狀況、IT 技術能力和人才儲備的真實水平出發,以共享服務、整合資源、降低成本、提升效率爲目標,在管理文化、組織架構,業務流程等多方配合改進,才能更好的發揮中臺的作用,真正提升業務的敏捷度和企業的創新能力。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章