Amazon SageMaker 用戶數量已過萬,AWS 仍在不斷充實完善它

7月31日,AWS技術峯會2019在北京舉行,今年AWS技術峯會以「即刻構建」爲主題,形象地闡釋了雲上服務的快捷性。

AWS副總裁、全球技術與開發者佈道師團隊伊恩 · 馬辛哈姆

在開場演講中,AWS副總裁、全球技術與開發者佈道師團隊伊恩 · 馬辛哈姆(Ian Massingham)針對AWS的優勢和技術進行了主題演講,再次強調AWS的重點是提供給軟件開發人員和構建者更多的工具,讓開發者構建以及擴展自己的應用,重點分享了關於雲遷移、微服務、數據庫、分析、機器學習、IoT等方面的技術佈局及最佳合作實踐。

去年的re:Invent 2018峯會上,AWS就明確了2019年在AI方向主打的戰略:通過平臺和工具讓開發人員低成本的完成項目開發、對機器學習推理服務的重視、對AI工具的開發和重視。本次峯會上,InfoQ很榮幸地採訪到了AWS副總裁、全球技術與開發者佈道師團隊 伊恩 · 馬辛哈姆(Ian Massingham),並聚焦於AWS 機器學習板塊和伊恩進行了交流。伊恩也在採訪中透露,今年的re:Invent 2019還將在機器學習領域發佈更多的重磅發佈和新的消息。

回顧AWS在機器學習上的持續動作,可以看到其近幾年的演進和革新,也可以窺見出其在Machine Learning這項技術上的推進思路:

  • 2015年,AWS首次推出 Amazon Machine Learning服務;
  • 2016年,AWS針對機器視覺和語音交互推出了Amazon Polly 、Amazon Rekognition等API;
  • 2017年,AWS推出了一個更全面的機器學習平臺Amazon SageMaker
  • 2018年,SageMaker新增200多種機器學習新功能和服務;
  • 2019年,AWS推出SageMaker Neo,解決邊緣設備運行的問題,推出深度學習容器對DeepLearning AMI進行補充;爲提升機器學習推理速度,AWS Inferentia將在今年落地。

對於機器學習的火熱,伊恩分享了自己的看法:一是因爲機器學習平臺、框架、軟件的大量涌現,最近才能夠讓非政府的一些技術企業或者是非超大型企業也可以用得起機器學習;另一方面,雲的發展讓機器學習更容易,解決了需要大型計算設備以及數據不足的問題,有了雲,數據的儲存和計算變得更加方便,企業做機器學習方面的嘗試成本就低得多了。

在AWS 機器學習的技術架構中,上層是託管的人工智能或機器學習的應用服務,底層包括計算、存儲在內的基礎架構,中間層則是框架接口以及平臺服務,形成廣泛且深入的功能集合的機器學習技術棧,整個架構構成了用戶可快速在 AWS 構建機器學習服務的基石,SageMaker作爲中間層承上啓下的雲機器學習平臺,位置舉足輕重。

對於SageMaker的作用,AWS希望讓有能力去改進框架和算法的開發者,儘可能少花費精力在那些跟主業無關的事情上,例如數據準備、部署集羣、安裝框架等需要耗費大量精力的事情。

到今天,SageMaker的客戶數量超過一萬,AWS仍在不斷充實完善它。伊恩特別強調了競價實例,“ 我們最近給SageMaker做了一個事情,就是開發者可以用它的Spot Instance競價實例,類似於實例現貨市場,通過Spot Instance競價實例實現打折,它要比按需訂購的EC2的折扣力度大得多,可以用它來做模型的訓練。” 另外對Ground Truth、SageMaker Neo、增強學習(RL)、DeepAR等,伊恩也進行了重點介紹推薦。

除此之外,伊恩透露,由AWS設計的、專用於機器學習的芯片——AWS Inferentia或將在今年年底面世。關於AWS在機器學習芯片方向的發力,伊恩表示,AWS看好機器學習在推理方向的發展,“事實上AWS開發硬件產品唯一的目的就是幫助客戶降低他們使用技術的成本以及後期的運營成本,讓開發人員能夠更多的去使用這些機器學習的技術,爲客戶解決問題。“

對於SageMaker生態下一步計劃,伊恩沒有正面做回答,但是關於SageMaker最好的應用場景,伊恩提到了自己最喜歡的、來自美國一家電信商T-Mobile的應用案例。T-Mobile當前正在使用AWS的機器學習服務來提升自身的客戶服務,其開發出一套用於自然語言理解的機器學習模型,能從大量文本數據中提取信息,包括每天數十萬量級的傳入客戶請求,以及包含可能回答客戶查詢的答案的知識庫。在前期數據標註的過程中,T-Mobile使用Ground Truth自動標記,然後通過機器學習模型預測哪些信息將滿足特定客戶的需求,實時爲代理提供相關信息以確保快速準確地解決每個客戶的問題。

“它會預測客戶會打電話要什麼樣的服務,比如客戶說我想問一下我的賬單,後臺就會了解一下客戶賬戶的信息,通過出現的一些事件,一些合約簽訂等記錄,用這樣的數據來預測客戶打進來可能最想問的是什麼。然後,這個後臺就能夠有相應的人員和資源來應對這樣的問答。比如,後臺發現賬單上一旦有錯誤,那代理之前就會知道,這個可能就是他想要問的問題。只有T-Mobile有這樣自有的數據,它用Sagemaker來培訓它的算法,所以機器學習用私有的數據來做訓練其實是很主流的用途。“伊恩說。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章