2019年8月17日,在阿里雲杭州飛天園區內,參加了AICUG的阿里巴巴AI智能專場的分享,主要的主題包括《PAI機器學習和OCR實踐》、《關於FAQ-QA算法中臺的思考和實踐》、《認識概念圖譜構建與應用》、《搜索場景下的智能推薦演變之路》主要是算法方面,
以下就感受與大家進行分享:
一、阿里雲的動物園:
消息證實:網易考拉確定被阿里巴巴收購,納入動物園版圖,應該會併入天貓
二、產品定位:
機器學習PAI:
一站式機器學習平臺(數據預處理、特徵工程、模型訓練、模型服務),機器學習PASS服務,提供的是底層模型訓練和服務能力
EasyVision:
數據、建模、服務,簡化CV技術研發閉環,降低CV應用門檻
OCR:
自然場景下的文字通常存在傾斜、畸變、玩去、豎直、模糊等失真問題
阿里小蜜:
2015年 推出的to C 智能客服產品,也有針對to B 的賦能產品
概念圖譜:
感知到認知,認知概念圖譜
搜索推薦:
基於搜索業務場景下的排序、召回、數據梳理
三、產品介紹:
PAI:
可視化建模PAI-STUDIO、PAI-DSW(類似notebook)、PAI-EAS(模型在線服務引擎)
參數調整優化工具:PAI-AutoML
小蜜:
智能客服的解決方案:FAQ智能問答、導購、外呼、助理
FAQ問答模塊(易用、可控):基礎模塊,必備的
內部協作機制:業務場景+算法能力
中臺架構:技術架構、能力地圖(模型參數、模型性能)、業務分析方法論、運營平臺
能力地圖:業務定製BERT——多任務學習——模型蒸餾
認知概念圖譜:
Level1、Level2、Level3、instance
細粒度(Level3):高質量細粒度概念
Level1/2:知識圖譜類型、預先定義關聯
Level2/3:基於傳遞關聯、基於概率推斷
Level3/實例:基於規則、基於聚類、基於模型
短語挖掘:無監督(TopMine)、有監督(SegPhrase)、遠監督(AutoPhrase)
應用場景:意圖識別、實體推薦、對話、文檔問答、短視頻、相關性、信息流
搜索推薦:
預置詞
召回:用戶行爲召回、標籤召回、知識圖譜召回、向量召回
排序:基礎相關性、CTR預估、MAB、語義相關性、採樣
話題圖譜:交互式搜索推薦方法的探索,包含話題(包含實體)、本體詞、意圖、知識點、話題理解、知識點整理……
四、名詞釋義:
算法中臺:
提供算法能力,幫助提供更加個性化的服務,增強用戶體驗,爲戰場提供了陸軍支援能力,隨機應變,所向披靡。
數據中臺:
提供數據分析能力,幫助從數據中學習改進,調整方向,爲戰場提供了海軍支援能力。
技術中臺:
提供自建系統部分的技術支撐能力,幫助解決基礎設施,分佈式數據庫等底層技術問題,爲前臺特種兵提供了精良的武器裝備。
研發中臺:
提供自建系統部分的管理和技術實踐支撐能力,幫助快速搭建項目、管理進度、測試、持續集成、持續交付,是前臺特種兵的訓練基地。
組織中臺:
爲項目提供投資管理、風險管理、資源調度等,是戰場的指揮部,戰爭的大腦,指揮前線,調度後方。
字典中臺:
爲項目提供國際、國家、業界等標準規範字典並保持及時更新;