讓機器讀懂視頻:億級淘寶視頻背後的多模態AI算法揭祕
導讀:
本篇文章由阿里巴巴新零售淘系技術部出品,內容大綱如下:
1、多模態在視頻分類算法中的應用探索
2、視頻分類算法中的層次化分類器的設計
3、總結和展望
背景
隨着4G的普及和5G的推出,內容消費的訴求越來越受到人們的重視。2019年互聯網趨勢報告指出在移動互聯網行業整體增速放緩的大背景下,短視頻行業異軍突起,成爲“行業黑洞”搶奪用戶時間,儘管移動互聯網人口紅利見頂,新的增長點難以尋覓,但中國短視頻人均使用時長及頭部短視頻平臺日均活躍用戶均持續增長(如圖1所示)。
圖一
在淘寶,短視頻業務一直以來都是非常重要的業務,是淘寶app從單一的商品導購app走向商品導購+內容消費的多元化app的關鍵所在。相較於單一的商品導購,商品導購+內容消費的模式有效增加用戶粘性,提高用戶的停留時長,最終獲得GMV的持續增長。不僅如此,2019年視頻營銷發展趨勢白皮書指出目前視頻內容的轉發量已達到圖文的12倍,視頻營銷已經成爲品牌最愛的營銷方式,使用視頻