變身漫畫道具玩了沒?這樣的 AI 人像特效機器學習服務幫你實現

近期,抖音上一款 “變身漫畫” 的特效刷爆“我的關注”,二次元漫畫樣式的畫風更是讓大家欲罷不能。從明星到路人,從大朋友到小朋友紛紛參與其中,抖音 App 中“變身漫畫”話題頁顯示約有 1851 萬餘人使用該道具。

如今,此類視頻 / 圖片風格轉化特效,畫面細節精緻、色彩溫和,頗受歡迎。其實它並非新鮮事物,通常此類風格轉化是機器學習模型創造出的虛擬場景,主要採用生成對抗網絡(GAN)技術。

生成對抗網絡(GAN)是一種機器學習模型,由深度神經網絡架構構成。 生成對抗網絡(GAN)由生成網絡和判別網絡組成,生成網絡產生“假”數據,判別網絡對生成數據進行真僞判斷,通過卷積神經網絡進行分析,在訓練過程中,兩個網絡持續進行對抗,直至判別網絡無法識別“假”數據,其被廣泛應用於媒體、遊戲、娛樂等領域。

生成對抗網絡抗網絡(GAN)可基於 PyTorch 機器學習框架構建,因涉及從構建到部署的整個機器學習流程,所以⽆法避免機器學習全流程中存在的諸多難題。首先,對於完整的機器學習項目而言,落地是一項紛繁複雜的工作且成本高昂。其次,整個項目從選擇算法、優化算法到參數調節,影響模型準確性的參數有百萬之多。最重要的是,需要開發者和數據科學傢俱有廣而精的專業知識。

因此,一種更爲友好的機器學習服務是如此重要。 而云計算時代的到來,掃清了廣大企業應用人工智能和機器學習的障礙,讓簡化機器學習項目成爲可能,並且開發者又能得到龐大算力、數據存儲等雲能力的支持。根據 Gartner 預測,到 2023 年將有超過 40%的開發團隊將使用自動化機器學習服務。可見,機器學習從業者急需適用於整個機器學習工作流程的雲端服務或平臺。

AWS 全方位支持 AI 在雲端生長

20 多年來,Amazon Web Services (AWS) 在人工智能和機器學習方面進行的大量投入,獲得了國際分析機構的高度認可。根據 2020 年 Gartner 公佈的《雲AI開發者服務魔力象限》顯示,AWS 被評爲該領域的領導者。

AWS 可根據用戶的不同需求,爲開發者和數據科學家提供全方位的機器學習和人工智能解決方案,包括三層的服務堆棧。其中,底層爲機器學習的框架和基礎架構,用戶可以自由選擇 PyTorch、TensorFlow、Apache MXNet、Chainer、Gluon、Horovod 和 Keras 等機器學習框架。頂層爲訓練好的人工智能服務,如視覺類、文字類、語音類等,用戶可以直接調用相關服務,無需過多關注服務背後機器學習模型的複雜流程。

尤爲重要的是中間層,AWS 基於機器學習的核心服務層推出了完全託管服務 —— Amazon SageMaker。 它更像是機器學習從業者的“工具包”,可集中提供用於機器學習的所有組件,貫穿機器學習項目從構建、訓練到部署的整個工作流程,消除了傳統機器學習複雜、昂貴、迭代的弊端,幫助開發人員和數據科學家更快速、高效地將機器學習模型投入實際應用中。

就中國市場而言,隨着越來越多的企業和開發者意識到機器學習和人工智能的潛力,對於機器學習服務的需求愈發迫切。 根據 IDC 預計,到 2023 年中國人工智能市場規模將達到 979 億美元。AWS 適時而爲,2020 年 4 月 30 日 AWS 正式將 Amazon SageMaker 落地中國,在由西雲數據運營的 AWS 中國 (寧夏) 區域和光環新網運營的 AWS 中國(北京)區域上線運營。

Amazon SageMaker 助力機器學習的黃金時代

宏觀來看,機器學習項目整個過程是高度迭代的,需要多方協助。 隨着機器學習項目規模的增加,整個工作流程變得過於複雜,爲此大多數機器學習項目中需要使用多種工具來滿足各個階段工程師的需求。

通常,大多數項目遵循數據科學家進行研究、實驗及驗證,開發者負責模型落地的流程,而最終實現多方協作並非易事。Amazon SageMaker 提供的 Amazon SageMaker Studio 適用於機器學習的完全集成式開發環境 (IDE),其將所有用於機器學習的組件集中在一起,可以有助於提高整體項目的工作效率。

SageMaker Studio 爲所有 Amazon SageMaker 功能和整個機器學習工作流提供統一界面,使用者可以快速上傳數據、創建新筆記本、訓練和調優模型,幫助使用者全面掌控構建、訓練和部署模型的每個步驟。

具體來看,機器學習項目工作流程分爲以下幾大類,AWS 可在各項流程中提供支持:

一、數據準備
機器學習項目的成功依靠優質的模型,優質的模型基於高質量的數據。Amazon SageMaker Ground Truth 可處理丟失或損壞的數據,幫助開發者快速構建和管理高度準確的訓練數據集。並且,Ground Truth 可持續向人工製作的標籤學習,以生成高質量的自動註釋,同時可將數據標記成本降低 70%左右。

二、構建
當數據進行了必要的轉換和篩選處理,開發者又將面臨如何選擇算法與模型的困境。在設計機器學習模型時,雖然目前的一些機器學習自動化方法,已經實現了創建初始模型的功能,但只是停留於開發者的基礎需求,無法滿足開發者對於模型更深層次的需求,比如如何創建模型、改進模型以及獲取相關數據等。

對於 AWS 而言,重視構建環節是夯實機器學習項目的關鍵。爲此,Amazon SageMaker 提供自動構建模型的功能 Amazon SageMaker Autopilot,作爲業內首個對機器學習模型保持控制和可見性的自動化機器學習功能,其可讓開發者完全掌控機器學習模型。一方面,對於缺乏經驗的開發者 Amazon SageMaker Autopilot 可提供千餘種算法、模型和數據。另一方面,經驗豐富的開發者可將它用於開發基礎模型,團隊可以在此基礎上進一步迭代。

同時針對開發者和數據科學家的特定需求,Amazon SageMaker 選擇了最受大家歡迎的工具之一——Jupyter Notebook。 使用 Amazon SageMaker Notebook 可一鍵啓動 Jupyter Notebook ,使用者可以根據需求調整算力,從而快速實現構建模型並有助於增強團隊內部的協作配合。

三、訓練
訓練機器學習模型是脆弱且困難的,通常需要進行多次迭代和不斷調優。 獲得 NIPS 2017 年度時間獎的人工智能研究員 Ali Rahimi,在頒獎典禮上就曾抱怨過模型訓練的脆弱性。假設一個機器學習模型要處理百萬級別的記錄數據,則至少需要數百次迭代。開發者該如何管理這些迭代的模型、訓練數據和參數設置呢?

Amazon SageMaker Experiments 可以幫助開發者組織和跟蹤機器學習模型的迭代。 其將自動捕獲輸入參數、配置和結果,以可視化的形式幫助開發者管理迭代產生的結果。開發者也可自行保留實驗的完整譜系,如出現模型偏離預期結果的情況,開發者可及時回溯和檢查。

當解決了算法和模型的難題,整個項目的開發時間與運營成本自然會大幅降低。 以“大宇無限”公司爲例,採用 Amazon SageMaker 極大的簡化了搭建機器學習系統的構建、訓練和部署流程。從始至終“大宇無限”無需顧慮開發成本與時間成本,算法工程師只需準備數據,估算約節省 70% 的訓練成本。而根據 AWS 給出的資料顯示,Amazon SageMaker 提供託管的 Spot 訓練,最高可將訓練成本降低 90%。

此外,機器學習的發展仍然處於快速變化的進程中,開發者更需要一個開放的平臺。在 Amazon SageMaker 上有着有非常開放的選擇,特別是在中國市場。

(1)對機器學習框架的開放: 上文提到了 Amazon SageMaker 支持的衆多機器學習框架,並且針對 TensorFlow、PyTorch、Apache MXNet 在內的主流框架進行了深度優化。例如,在 256GPUs 下,對 TensorFlow 的擴展效率可以做到 90%,遠高於開源平臺的 65%。值得一提的是,全球範圍內 85% 的 Tensorflow 的工作負載跑在 AWS 上面。

(2)對定製化的開放:Amazon SageMaker 已配備了多種內置算法,用戶可以開箱即用來解決各類應用問題。但同時用戶也可以將自己的算法或模型通過容器的方式用於 Amazon SageMaker,即使是早前的框架 Caffe 也都可通過自帶容器的方式在 Amazon SageMaker 中使用。

(3)對生態系統的開放: 一個機器學習平臺能否具有生命力,關鍵在生態系統。目前,AWS 已經與德勤、中科創達、伊克羅德等 APN 合作伙伴開展了合作,加速 Amazon SageMaker 在中國地區企業級市場的落地。

(4)對開源社區的開放: 考慮到目前很多機器學習負載已經容器化,Amazon SageMaker 爲 Kubernetes 提供了運算符,並保持對衆多開源社區組件的開放性。此外,AWS 還開源了 SageMaker 的部分實現,聯合 Facebook 推出 TorchServe – 業內第一個針對 PyTorch 框架的 model server。

四、部署
機器學習始終因落地部署難而被詬病,如機器學習項目想要“開花結果”,落地部署環節是關鍵,但機器學習所具有的一些特性,卻使得大規模部署十分困難。 這個階段開發者需要處理,編程語言兼容性、算力、可擴展以及模型質量等難題,而對於完全託管的機器學習服務完全不成問題。

Amazon SageMaker 可實現一鍵式部署受訓模型,以便開發者針對實時或批量數據生成預測,並提供適用於 Kubeflow Pipelines 的組件,保持模型的高效與準確。 開發者只需關注應用程序爲此終端節點提供 的 API 調用,即可實現低延遲、高吞吐量推理。同樣是“大宇無限”的案例,使用 Amazon SageMaker 服務後僅用了三個月的時間,“大宇無限”便完成了自身機器學習系統從 0 到 1 的突破。

未來 AI 將如何在雲端生長

隨着人工智能與機器學習的普及,新一輪技術浪潮正在開啓。 無論是創新企業還是傳統企業都意識到需要利用人工智能與機器學習尋求突破和創新,根據 Gartner 在 2019 年對 CIO 的調查顯示,2018 年至 2019 年間,部署人工智能 (AI) 的企業或組織從 4% 增長到了 14%。

可以說,AWS 已經爲機器學習從業人員找到了更高效、更便捷、更迅速的解決方案。AWS 希望將 Amazon SageMaker 打造成通用的產品和服務,通過社區的形式把機器學習的能力交到每一位創建者的手中,真正讓機器學習可以廣泛地、深入地改變人們的生活。

爲了實現這個使命,AWS 受邀參與了 2020 年世界人工智能大會 (簡稱“WAIC”),屆時 AWS 機器學習服務副總裁 Bratin Saha、AWS 傑出科學家 Alex Smola、AWS 首席科學家李沐、AWS 上海 AI 研究院院長張崢、AWS 機器學習產品高級總監代聞,以及諸多 AWS 人工智能業務專家、技術佈道師、典型客戶等行業大咖親臨現場, 爲線上的觀衆朋友分享 AWS 在雲計算、人工智能、機器學習領域的技術領先力和客戶案例。

如果你是人工智能工程師和研究人員、如果你是機器學習的從業者,在實際工作中遇到了難題,需要得到研究領域內意見領袖的獨到見解、亦或是你只是人工智能的愛好者,即可掃描下方二維碼參與大會,與 AWS 一起暢遊 2020 世界人工智能大會,進一步瞭解“當 AI 在雲端生長”。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章