近幾年,隨着“新零售”概念的火熱,越來越多的品牌商及商超零售企業開始引進人工智能技術,探索商品管理、成本控制、用戶體驗等多維度的數字化轉型,轉型中所涉及的貨架陳列分析、智能結算、智能庫存管理、智能貨櫃、電商平臺等以圖搜圖的場景背後的核心技術都離不開商品識別算法。
圖1 商品識別應用展示
然而,相較更加普遍的人臉識別技術來說,商品識別在實際的產業應用中也面臨着其獨有的巨大挑戰:
商品包裝相似:同類別商品口味不同且價格也不同,不同類別商品外包裝相似,都對圖像識別精度具有較高的要求;
干擾因素衆多:同類別商品在識別時容易因角度問題發生變形、摺疊、遮擋等干擾,對識別結果造成影響;
品類更新極快:零售商品通常以小時級別速度更新迭代,每增加新產品時若僅靠單一模型均需重新訓練模型,模型訓練成本及時間成本極大;
針對上述難點,飛槳產業實踐範例庫基於真實零售場景中的數據,推出了智慧商超商品識別範例,可用於商品智能結算等多種場景,提供從數據準備、技術方案、模型訓練優化,到模型部署的全流程可複用方案,有效解決了識別速度和精度要求極高、不同商品相似度極高、模型重訓成本高的問題,大大提高了人工智能在商超零售行業的應用落地可能性。
⭐項目鏈接⭐
https://github.com/PaddlePaddle/PaddleClas/tree/develop/docs/zh_CN/samples
所有源碼及教程均已開源,歡迎大家star鼓勵~
智慧零售商品識別方案
基於PP-ShiTu實現的商品識別方案爲零售場景中商品多類別、小樣本、高相似和更新頻繁問題提供了新的思路,不僅能對多類別商品進行精準識別,也可以滿足對預測效率的極致追求。
圖2 商品識別目標說明
場景難點
數據相似度高:同一件商品,在不同情況下所獲得的商品圖像往往存在相當大的差異;不同商品很可能擁有非常類似的包裝,比如口味不同。
系統性能要求高:需要同時解決檢測和識別兩個任務,選模型和優化時要權衡精度與速度兩方面。
模型泛化性要求高:需要支持對未知類別的商品進行識別,有效支持訓練數據少、新增類別的情況。
方案設計
針對上述難點,經過對模型性能精度和速度的考慮,最終選用了飛槳圖像分類套件PaddleClas開源的圖像識別PP-ShiTu技術方案,並且使用飛槳服務化部署框架Paddle Serving 進行服務化部署。
PP-ShiTu是一個實用的輕量級通用圖像識別系統,主要由主體檢測、特徵學習和向量檢索三個模塊組成。該系統從骨幹網絡選擇和調整、損失函數的選擇、數據增強、學習率變換策略、正則化參數選擇、預訓練模型使用以及模型裁剪量化8個方面,採用多種策略,對各個模塊的模型進行優化,並經過10w+類別數據進行訓練,最終得到在CPU上預測時間僅需0.2s的多場景通用圖像識別系統。
圖3 項目方案說明
模型優化策略和效果
嘗試數據增強、換不同的backbone、選擇不同的Metric Learning方法、採用蒸餾方法進行模型調優,針對不同方案給出實驗效果,模型最終可以達到98.39%以上的Top1 Recall。
同時,爲滿足商品識別場景需要兼具擴展性的要求,本範例還提供了低成本更新檢索庫的識別方案,無需重新訓練模型即可實現對新增類別的精準識別,具體解決方案歡迎大家關注直播課。
圖4 效果展示說明
部署方案
部署方面使用飛槳服務化部署框架Paddle Serving進行部署,滿足用戶批量預測、數據安全性高、延遲低的需求,快速在本地完成部署方案,本次範例包含模型轉換配置到部署請求的全流程講解,歡迎小夥伴們關注直播。
如下圖展示本次商品識別範例在智能結算場景的應用
範例使用工具介紹
PaddleClas是一個提供了從數據處理、模型準備、模型優化、到預測部署全流程工具的圖像分類開發套件。其中的輕量級圖像識別系統PP-ShiTu更是綜合了目標檢測、圖像分類、度量學習、圖像檢索等多重技術,能夠完美解決小樣本、高相似、多類別等產業落地難點,CPU上僅需0.2s輕鬆識別十萬類,而且十分簡單易用,極大地降低開發門檻。
產業實踐範例教程助力企業跨越AI落地鴻溝
飛槳產業實踐範例,致力於加速AI在產業落地的前進路徑,減少理論技術與產業應用的差距。範例來源於產業真實業務場景,通過完整的代碼實現,提供從數據準備到模型部署的方案過程解析,堪稱產業落地的“自動導航”。
真實產業場景:與實際具有AI應用的企業合作共建,選取企業高頻需求的AI應用場景如智慧城市-安全帽檢測、智能製造-表計讀數等;
完整代碼實現:提供可一鍵運行的代碼,在“AI Studio一站式開發平臺”上使用免費算力一鍵Notebook運行;
詳細過程解析:深度解析從數據準備和處理、模型選擇、模型優化和部署的AI落地全流程,共享可複用的模型調參和優化經驗;
直達項目落地:百度高工手把手教用戶進行全流程代碼實踐,輕鬆直達項目POC階段。
精彩課程預告
爲了讓小夥伴們更便捷地實踐和應用智慧零售商品識別技術方案,飛槳開發者技術專家將於4月14日20:30爲大家深度解析從數據準備、方案設計到模型優化部署的開發全流程,手把手教大家進行商品識別落地的代碼實踐。
掃碼報名直播課,加入技術交流羣
推薦閱讀:
本文分享自微信公衆號 - 百度開發者中心(baidudev)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。