StartDT_AI_Lab | 開啓“數據+算法”定義的新世界

繼「數據中臺技術匯」欄目推出以來,獲得了不少技術極客的喜愛。作爲AI驅動的數據中臺創導者,深度關注核心算法技術的自研創新、融合探索,故推出全新AI算法欄目「StartDT_AI_Lab」,主要介紹算法團隊所承擔的角色與工作。本文先回顧這些年大數據之路,幫大家理解在奇點雲發展過程中,人工智能技術是如何由業務需求孵化併成長爲產品一部分的,同時爲今後的分享內容做一個宏觀概述。

2013年,一本《大數據》成了不少技術人案頭必備的讀物。它像是一盞照燈,將數字世界的完整尺度突然照亮,這時大家才意識到原來數字世界已經長如此大了。

從彼時起,大數據成了之後幾年最熱門的話題。隨之而出的各類概念,如“DT時代”、“雲計算”、 “DMP”等等,層出不窮。而其中的核心要素就是 “數據” ,數據兩字似乎已成爲技術界的圭臬。很多人將這次由大數據而帶起的技術革新浪潮譽爲“第四次工業革命”,而將數據比喻爲本次工業革命的 “石油”。恍惚間,頗有 “得之則生,弗得則死”之意。隨後幾年,各家公司都掀起了“囤數據”運動,凡是能存入硬盤的,絕不刪除。“不管現在有用沒用,先存着,未來一定有用”的觀念,成了各家公司CIO、CDO們的指導思想。

然而,在“囤數據”運動方興未艾,正推着硬盤價格也一路上漲的發展進程中,卻有一個聲音如幽靈般飄來,並日漸響亮:數據無用!這聲音來自於這一運動中“出師未捷身先死”的烈士們,他們曾是“大數據”最忠實的擁躉,卻在數據價值的追尋中日趨迷茫,最終被“囤數據”、“開採數據”所帶來的成本飆漲壓垮。

數據有用還是無用,成了一個可以討論的辯題。雙方各執一詞,誰也說服不了誰,共同在這DT時代吐出了這樣一句飽含憧憬卻無奈的嘆息:

如果你愛他,請給他數據,因爲數據爲王。

如果你恨他,請給他數據,因爲數據爲亡。

那麼數據到底有沒有用呢?不妨從奇點雲多年積累的數據經驗視角,我們一起來認真審視一下。

如果只是裸數據本身,可能確實是用處不大,正如汽車無法通過灌注原油驅動一樣。

所以從數據中提取的信息纔有用是嗎?也不盡然,因爲提取出來的信息大都支離破碎,並無法直接洞察商業情報。那麼從信息中組合分析得出的商業情報纔是價值點?還不夠,因爲情報本身如果不能轉化爲決策去執行,再多的情報也無法帶來收益。

那以情報爲依據,通過業務經驗分析判斷進行決策,是否就是DT時代的智能商業呢?還不完整,因爲同一業務問題,解法是多元的,決策還需有效評估與優化迭代才能補全數據迴環。

現在,一幅比較完整的數據轉化利用的迴環已經形成,而這也是我們的使命「讓商業更智能」背後的方法論。

StartDT_AI_Lab | 開啓“數據+算法”定義的新世界
有了這一方法論爲依歸,整體建設思路也就基本明晰了。目前大家在已有的文章中,已知道我們的Simba和數據中臺,其在商業智能化迴環中的位置如下圖所示:
StartDT_AI_Lab | 開啓“數據+算法”定義的新世界

顯然,這一產品架構並沒有覆蓋整條商業智能化迴環。尤其,從我們的願景出發,幫助實體商家擁有淘寶一樣的數據化運營能力,其中很重要的一點是幫助實體商家把線下非數字化、非結構化的各類商業場景數字化、結構化並上雲,否則商業智能化迴環將無法覆蓋實體商家的主要商業場景,所謂的商業效益的提升也就無從談起了。這其中缺失的便是本文介紹的重點,也是「StartDT_AI_Lab」的主體工作。爲了實現覆蓋實體商家全面商業場景的完整商業智能化迴環而特別研發的三大智能化引擎。其在產品架構中的位置如下:

StartDT_AI_Lab | 開啓“數據+算法”定義的新世界

現在簡單爲大家介紹一下這三大引擎。

視覺智能引擎,作爲數據入口,顯然是重中之重。其肩負着爲數字世界開疆拓土的重任,有點石成金,化水爲油之魔力。

在對其進行產品定義時,我們主要從三個必然和兩個凡是對其進行了概念描述:

在戰略意義層面:

達成公司願景的必然前提。

·將實體商家線下場景進行數字化並上線。

線下場景在數字化改造中對於實施成本,部署難度,複製性,易用性等方面要求下的必然要求。

信息革命浪潮中的必然途徑。

·拓展互聯網,萬物互聯,全部在線。

在產品定義層面:

凡是實體商家數字化場景需要的。

凡是計算機視覺技術可以發揮比較優勢的。

在產品功能定義方面:

可回溯實時多級標籤策略

·基礎單元->單元屬性->行業行爲屬性->情報摘要,例如人爲一級標籤,穿着衣飾爲二級,是否 試穿某服裝爲三級,當天這件服裝試穿客戶的畫像分析是四級;

·有業務分析需求反向要求線下數字化;

視頻檢索

可以回溯視頻檢索,例如要抽取二級標籤相關的信息,只需要根據一級標籤的時序、位置信息進行結構化升級和搜索即可;

Vision AI + X:從行業中來的特異性視覺模型

比如“雙偷模型”這樣的特異模型;

而關於商業洞察引擎和業務決策引擎,在之前的中臺欄目中已做過相關介紹,在此不再贅述,只做一點補充。在兩個引擎中廣泛使用的大數據分析和預測模型得益於視覺智能引擎提供的線下場景數字化後的結構數據,形成了一系列緊貼實體商家實際商業邏輯和經驗的特有的大數據模型。

從今日起,本欄目將圍繞這三大引擎,自下而上逐一介紹其建構中用到的各類型算法技術和背後的故事,敬請期待!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章