CTO案頭必備|AI技術產業落地的42章經

每一次技術革命,都是一次生產力與生產關係的大變革。AI時代呼嘯而至,深度學習、強化學習、圖神經網絡顯示出強大的技術張力,但爲何在產業應用落地中又會遇到種種挑戰,讓不少產業從業者擔憂——AI到底離我們有多遠?

 

黃埔學院,“首席AI架構師”的搖籃,對於這一產業之問,自然也是學院講師、學員必須回答的問題。

 

得其法者事半功倍,不得其法者事倍功半。

11月4日,百度黃埔學院第四期開啓爲期6周的線上預科班。就是通過AI思維、AI方法、AI技術、AI選擇等環環相扣的課程,讓大家“得法前行”,找到新技術推動產業升級的全流程方法論。

上圖:黃埔學院第四期預科班課程表

跨上AI的戰車

從技術邏輯和商業邏輯雙面看

跨上AI戰車的第一步,企業首先需要確認現階段是否適合進行AI轉型。如果對AI本身的邏輯缺乏深入的理解,究竟能不能使用、如何使用AI去落地就成了難題。結合飛槳實踐落地過程中各行業AI應用案例,企業想成功應用AI系統,要遵循技術和商業邏輯兩大原則。

AI應用可行的兩大前提

AI作爲決策系統的前提:

信息採集和自動化實施要完備

從技術邏輯來看, AI應用作爲一個決策系統不是單獨存在的,它包含完整的上下游。上游是我們採集的數據信息,下游則是我們要執行實施的自動化。

 

因此,當企業發現所在的應用場景上下游都完備,只需 AI決策系統時,企業AI場景應用落地的步伐就可以加快。像如今互聯網、金融領域AI應用最先落地,重要原因便是其產業鏈上下游完備。

AI要滿足商業邏輯的前提:

對關鍵業務的效率提升要大於付出的成本

目前,中國無人超市的技術已非常成熟,但依然沒有在中國看到遍地的無人超市。是因爲今天要實現無人超市的技術所花費的成本高於兩個店員的人力成本。所以無人超市這個技術雖已經實現了效率上的大幅提升,但是因爲效率提升程度不及花費的成本,所以目前還只能是實驗田。

 

所以,快速跨上AI戰車還需要考慮背後的商業邏輯。企業之所以運用AI技術滿足我們今天的商業發展,是想提升企業自身的關鍵業務。同時“成本”作爲企業轉型考慮的重要因素之一,也成爲選擇AI應用的關鍵項。總結來看就是,選擇AI技術提升效率不能只“幫扶”企業效率提升一小步,但卻要“冒險”付出大成本。

——百度傑出架構師&飛槳產品負責人 畢然《跨上AI的戰車》

從學術研究到產業落地

“多法結合”推動整個系統準確率提升

要想習得真經,企業除了明白是否適合AI轉型,還需要切實的瞭解如何運用AI實現應用。我們發現在產業落地這個過程中,通常會面臨三大問題:

  • 數據的規模和平衡性

  • 模型的泛化能力及魯棒性

  • 場景領域的長尾、變化需求

面對AI技術難題的正攻法思路

我們有很多學術的方法去解決、突破技術難題,大家都可以去嘗試。也可以通過各種論文去了解先進前沿的技術。但還有很多時候,整個系統的準確率並不是單純的一個算法模塊的準確率。可能你需要嘗試配合一個傳統算法,或者是配合一個流程的設計,甚至必要的時候可以配合人員操作的兜底方式來協同配合,達到真正的場景可用。

這裏提到一個信任機制的建立,比如醫療場景,如果是一個全自動的系統,患者能不能接受這樣一個機器直接給出結論?很多時候我們當然希望它是一個全自動的系統,但是這裏往往要考慮的就是一個場景的容錯範圍,人命關天,就完全不能弄錯了。還有一些零售結賬的場景,質檢上需要9個9,很多這樣的場景,可能目前還是需要一個human in the loop。

——百度資深研發工程師 張洋《產業計算機視覺落地難點與應對》

掌握主流和全面的技術

複雜任務先拆分簡化,抽象問題是關鍵能力

當遇到複雜場景的問題時,將其拆分成一些小的任務與目標。因爲小的任務相對簡單一些,而複雜任務相對難一些,把複雜任務拆分成小任務本身就是一個技術建模的過程。拆分成小的任務之後,針對每一個小任務,我們都可以進行非常細緻的技術選型。

抽象問題的拆分舉例

這在我們實際場景中其實是非常常用的,因爲真實的業務場景它可能不是一個任務,而是衆多任務。比如說文本糾錯、複雜的問答系統、複雜的對話系統等,它可能包含了衆多的子任務。

——百度資深研發工程師&百度文心ERNIE平臺技術負責人 龔健 《產業NLP任務的技術選型與落地》

 

很多油田電力和工礦企業,它裏面存在很多傳統的機械指針式的儀表,這種儀表與數字儀表不同,機械錶無法將表具的讀數實時發送到監控系統,需要人工進行讀表檢查,這種表大部分是用來做監控用的,比如說監控設備的運行是否正常,而且這些表大部分是部署在廠區的各個位置,爲了監測儀器是否工作正常,或者系統是否工作正常,工廠或者是一些企業都要派大量的人力到現場去進行巡檢,檢查表的讀數是否正常,進而去判斷整套系統或者儀器是否正常,這樣的話就會消耗很多企業的人力成本,而且每次巡檢週期長,頻次非常低。實際解決問題之前,需要清晰的梳理出表計識別項目會面臨到的難點問題:

  • 表具種類多,相似度大,樣本採集困難且不易分類

  • 在複雜環境下,讀數精確度不易保證

  • 室外環境惡劣導致讀數難以識別

技術方案拆解:目標檢測+語義分割

所以我們沒選擇直接識別的方案,因爲直接識別會遇到多尺度的問題。我們選用了更爲複雜的方案:目標檢測+語義分割,當我的讀數難度變小了,精確度會得到更好的保證,這是最核心的。同時,因爲模型複雜度的提升,我的推理時間變長了。不過沒關係,因爲在表計巡檢的場景裏,對時效要求並不高。所以很多時候,大家問這樣的方案好不好那樣的方案好不好,還是要首先去回答自己的問題,你的場景到底有什麼樣的限制條件。沒有最好,只有最適合。

——中興克拉科技首席AI系統架構師 黃埔學院二期學員 朱玉石《能源電力傳統儀表綜合無人巡檢》

Last but not least, 優選工具

京東物流最開始自己要做快遞單識別,其工程是非常複雜的。你所在小區的四級地址是什麼?估計很多人沒有清晰的概念,有的用戶名字叫“一個橘子”,收件地址中還附着着大量的附言詞。在這之中我們要做大量的分詞、文本解析、結構化處理、信息的補全、消歧等,最後進行語義相似度的打分和匹配。有監督+無監督的方法結合去應用。整個團隊花了很長的時間,去建立一整套的系統。

京東物流快遞單識別所使用的ERNIE API

完成了這些工作,跨過了這些坑之後,當我遇到百度文心ERNIE,瞬間覺得豁然開朗,覺得它比我更懂我應該做什麼。剛纔說的所有那些很複雜的東西,從以前的Framework轉到飛槳以後,前面三個API其實就搞定了。最後一個API地址識別,我畫了小太陽,對我們的工作效率提升帶來了很大的幫助。很多應屆生同學他們進來就能很快地上手。對於他們來說,一開始覺得這件事太難了,可能很難堅持下來。在新同學還不是特別懂深度學習的原理情況下,能夠把整個技術做出來,能夠有結果,這是件非常讓人興奮的事。

——京東物流智能供應鏈產業平臺研發總監、黃埔學院三期學員 王梓晨《京東物流快遞單智能識別》

聽完這些課程,你是不是對AI產業落地有了不一樣,亦或是更深刻的認識?是不是也想加入其中,成爲推動產業落地的AI架構師?

 

對於從黃埔學院畢業的135名學員,授課老師們一直在強調“AI架構師”要具備從複雜的業務問題抽象出AI技術問題的能力,要對主流AI訓練和部署落地流程有充分的掌握,結合相關算法技術和業務場景需求,做出恰當的AI技術選型,設計高效合理、並具有充分預見性的實現方案。還要在業務場景下建立起以AI技術應用爲核心的完備技術體系,充分發揮AI技術對業務的助力作用,對技術團隊產生很強的技術影響力。

置身其中的技術人都說,AI落地不是學術問題,而是創意問題。

 

關鍵是,如何有創意的使用AI技術。

 

12月1日,百度黃埔學院第四期開放線下正式班申請,需要你帶着“AI項目開題報告”有備而來,與百度T10+架構師一起,面對面探索產業智能化升級的新場景、新未來。

點擊“閱讀原文”立即申請【黃埔學院第四期正式班】,回看六節預科班乾貨視頻,獲取正式班申請材料模板。

????

現在,在「知乎」也能找到我們了

進入知乎首頁搜索「PaperWeekly」

點擊「關注」訂閱我們的專欄吧

關於PaperWeekly

PaperWeekly 是一個推薦、解讀、討論、報道人工智能前沿論文成果的學術平臺。如果你研究或從事 AI 領域,歡迎在公衆號後臺點擊「交流羣」,小助手將把你帶入 PaperWeekly 的交流羣裏。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章