阿里雲探訪,新零售電商想要百尺竿頭的一次技術嘗試

移動互聯網時代以來,人工智能(AI)技術不斷髮展和完善,已逐步從實驗室走向實用,不斷展現出巨大的商業潛力。其中計算機視覺AI技術已成爲發展最快應用最廣的AI技術,並開始在各行各業落地開花,推動各行業不斷升級,逐步走向智能時代。例如,在深度學習技術的推動下,人臉識別已經落地到多個行業場景中,比如刷臉支付,安防監控等。電商行業也是視覺AI技術典型的應用場景,如何提升用戶的購物體驗,如何爲用戶快速匹配其最需要的商品,如何幫助商家快速吸引用戶的注意,如何幫助平臺降低運營成本。視覺AI技術在一個個具體問題中大展身手,不斷推動行業升級。本文將會通過解析AlibabaWood視頻生產工具的算法來介紹視覺AI技術在新零售電商領域中的應用。

新零售視覺5G時代,視頻將逐步成爲信息傳播和分享的主要媒介,視頻內容必將成爲展示商品的主要途徑。通過調研發現,電商,社交,直播等平臺以及普通用戶對視頻內容進行創作需求強烈。在電商平臺,投放商品視頻展示可以增加信息傳播途徑提升引流曝光,使得商品展示更吸睛,提升點擊以及購買轉化。針對同一商品,是否投放視頻展示對各關鍵指標影響非常大,如下圖所示。

9989c5b90f96dedb20d3e717592eeed2c54bdb86.jpeg

						  圖1 單一商品圖像款對比視頻款

但是,製作營銷視頻的門檻並不低,專業視頻製作團隊成本高,週期長。這對於對於需要快速上線大量新品的頭部品牌或者是大量的中小商家來說並不划算。短視頻製作的門檻已經成爲新零售電商的一個痛點。爲了解決這一問題,阿里雲利用達摩院的視覺AI技術推出了AlibabaWOOD製作短視頻製作工具,任何人都可以通過AlibabaWOOD一鍵生成電商營銷短視頻。極大的提升了營銷視頻製作效率,使得商家可以迅速提升店鋪的視頻覆蓋率。

AlibabaWOOD介紹

AlibabaWOOD是阿里云爲了提升電商營銷視頻製作效率和質量而推出的工具。傳統的批量視頻製作通常依賴於設計師提前製作的固定模板,因此,大批量生產的視頻通常千篇一律,缺乏感染力。爲了解決這一問題,AlibabaWOOD充分利用目前最先進的AI技術,拋棄了死板的視頻模板,而是通過智能分析用戶輸入的音視頻素材以及用戶需求,一鍵生成符合投放場景的營銷短視頻,從分析、設計到最後的編碼輸出用時不超過一分鐘,遠遠超過人類製作視頻的速度。並且,得益於AI技術的應用,AlibabaWOOD可以做到視頻風格和內容千人千面,無論是時尚風、科技風還是土味視頻,AlibabaWOOD都可以從容應對。下圖展示了AlibabaWOOD智能生成視頻的核心流程,下一章節也會對其中的核心AI技術進行解析。

9989c5b90f96dedb20d3e717592eeed2c54bdb86.jpeg

		   圖2 AlibabaWOOD智能視頻生成流程

AlibabaWOOD核心AI技術解析

素材解析能力

• 素材質量評估/理解

AlibabaWood利用最新的深度學習技術以及線上海量的電商圖像視頻數據,自研了素材質量評估模型和素材內容理解模型,質量評估模型可以快速準確的濾除不適合製作視頻的圖像視頻素材,保證輸出視頻的質量。而內容理解模型能夠爲智能編排模塊提供全方位的素材標籤,方便爲素材精確匹配智能特效,如下圖所示:

9989c5b90f96dedb20d3e717592eeed2c54bdb86.jpeg

                        圖3 素材質量評估

• 故事線生成
作爲智能編排核心技術,故事線生成模型充分利用素材標籤以及美學和吸引力評分,結合影視行業規範等先驗知識,可以針對不同類型的圖像視頻素材推薦不同的素材排序故事線,如下圖所示。使得生成的視頻運鏡更加合理,並更具吸引力和感染力。

9989c5b90f96dedb20d3e717592eeed2c54bdb86.jpeg

                               圖5 故事線生成示例

• 視頻摘要
通過學習大量在線營銷視頻摘要模式,AlibabaWood適配不同視頻類別的視頻剪輯手法,能夠對用戶輸入的視頻素材進行鏡頭分割,並根據投放場景選擇最佳視頻片段進行剪輯。

9989c5b90f96dedb20d3e717592eeed2c54bdb86.jpeg

                               圖6 視頻摘要示例

智能特效

• 音畫聯動
視頻節奏感可以提升觀看視頻的舒適性。通過智能分析音頻節奏點和視頻內容的視覺“節奏點”,然後通過視頻插幀技術實現視頻播放速率的非線性變換,從而實現音視頻節奏點的完美匹配,使得視頻中的人物能夠隨音樂舞動,極大的提升了視頻內容的吸引力。

• 靜轉動
爲了增強靜態素材主體內容的吸引力,AlibabaWood在自研圖像分割能力的基礎上推出靜轉動等智能特效,這一能力可以自動識別模特展示圖像,然後對模特主體進行摳圖,再對前景和背景內容加入滑動變焦效果,將靜態圖像轉化爲動態的視頻內容,使得內容展示更加生動,並凸顯主體信息。下一代靜轉動技術可以使得運鏡效果更符合透視原理,並讓圖像中模特的肢體真正動起來。

9989c5b90f96dedb20d3e717592eeed2c54bdb86.jpeg

                      圖8 圖像分割示例

多鏡頭靜轉動.mp4

                       圖9 靜轉動示例

• 轉場等特效智能推薦
AlibabaWood聯合設計師打造了可以根據素材內容自動匹配的轉場動畫特效體系。使得生成的視頻動效更加豐富、更加個性化,真正做到千人千面。

Alibabawood產品效果展示

淘寶商品1.mp4

617685864154 (1).mp4

打造自己的AlibabaWOOD!

阿里雲視覺AI開發者創意應用賽向社會各界免費開放所有視覺AI技術接口,邀請全社會的企業打造屬於自己的AlibabaWood。開發者可以任意使用達摩院的技術打磨自己的產品,或者將自己的產品在大賽中展出,作爲主辦方,阿里雲將會爲優秀的作品對接創業資源和孵化環境,更有總計近百萬的獎金和獎品等你來拿。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章