揭祕阿里價值百億的深度學習算法

圖片描述阿里媽媽是阿里巴巴集團旗下的,國內領先的大數據營銷平臺,擁有阿里巴巴集團的核心商業數據。每天有超過50億推廣流量完成超過3億件商品推廣展現,覆蓋高達98%的網民。智能數字化營銷是阿里媽媽重要的營銷形態,其實數字化營銷並不只是我們普遍認爲競價詞拍賣、搜索推薦等技術,在這個社交數據爆炸的時代,我們完全可以利用AI技術加上大數據分析,從用戶的更多數據中分析用戶的行爲,記錄他的喜好,這也 是AI技術在工業界成功的應用場景之一。機器學習技術的應用改變了數字化營銷的效率和形態,阿里媽媽結合機器學習、深度學習等人工智能技術,在內容理解、用戶理解、用戶行爲預估、智能出價、商品週期優化等方面進行數字化營銷的技術和業務創新。

作爲推動工業級深度學習應用的先行者之一,阿里媽媽從 2015 年開始一系列探索,並在 2016 年嘗試了第一代深度學習算法,在後續幾年裏,深度學習算法模型不斷更新迭代,爲阿里媽媽帶來了大量紅利。以阿里媽媽定向廣告場景爲例,深度學習算法直接帶來的收入增長紅利在 2018 年就已經超過百億。

關於深度學習和機器學習在阿里媽媽內部的應用,InfoQ曾經採訪過阿里媽媽深度學習算法平臺負責人朱小強老師。他提到人工智能技術在互聯網行業核心業務實踐應該分爲兩個階段。第一階段從2010-2015年之間,機器學習技術在谷歌、百度等這樣的大公司開始賦能業務,規模化落地。但這個過程中大家發現工業界的數據規模實在太大了,企業需要付出很高的成本去訓練算法模型,所以後來出現了大規模分佈式機器學習架構和Hadoop、Spark 等大數據架構的興起。

第二階段是2016年初開始,以廣告、推薦和搜索爲代表的互聯網公司開始發現,新一輪爆發於學術界和傳統 AI 領域(如語音、圖像等)的深度學習浪潮,也給互聯網技術帶來了全新的機會。

過去的機器學習模型本身相對來講比較固化和簡單,還是偏重以人工先驗設計加工的數據模式爲主,但這一代的深度學習技術帶來了更徹底的變革。首先深度學習本身的模型容量更大、變化更豐富,可以針對具體的場景數據進行模型的自由定製;其次,模型的設計變得更加簡單,基於標準化的深度學習訓練框架可以非常容易地實現一個全新的算法模型並進行大規模的分佈式訓練,普通的算法工程師就能輕鬆完成這個過程。而在以前的大規模機器學習階段,需要非常強大的專業團隊花費大量時間才能定製式地研發出一個工業級可用的新模型算法;此外,當模型訓練出來之後,現在已經有一個非常體系化的流水線來支持任意複雜算法模型快速部署到線上提供服務。
圖片描述
阿里媽媽從2015年底開始進行工業級深度學習的探索,2016 年啓動大規模深度學習框架以及算法的研發,到 2017 年的時候,阿里媽媽已經走在了深度學習的主航道上面,核心算法已經全部深度學習化,取得了顯著的發展。這成爲了業界的一個技術樣本間。今天業界很多企業在看到了這條道路的可行性後,也紛紛跟隨頭部企業的腳步、開啓了大規模的深度學習技術升級的浪潮。

在今年11月的AICon全球人工智能與機器學習技術大會上,朱小強老師將會來到現場跟大家分享深度學習技術在阿里媽媽內部的發展現狀。作爲現任阿里媽媽深度學習算法平臺負責人、兼任定向廣告&信息流廣告排序技術團隊負責人。他主持了三代核心算法架構(大規模、深度端到端、深度實時化)的設計和落地,驅動了深度學習對阿里廣告技術的全面變革與創新,領導了阿里開源深度學習框架X-DeepLearning從0到1的自研、從1到開源演進的全過程。相信到時他一定會帶來很多技術乾貨,感興趣的朋友可以來現場看看。

今年的AICon全球人工智能與機器學習技術大會,將於11月21-22日在北京國際會議中心舉行。顏水成、賈揚清、崔寶秋等AI技術大咖屆時也會來現場,跟大家聊一聊今年在AI商業化場景落地的大背景下,又涌現出了哪些新技術。本次大會我們設立了機器學習、計算機視覺、NLP、AI芯片、搜索推薦、產業互聯網、硅谷AI技術實踐等13+技術專場,細分到AI技術的各個領域,爲大家全方位的展示AI技術在國內目前發展的現狀。
圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章