AWS re:Invent第二天:SageMaker开发者工具全家桶闪亮登场

拉斯维加斯时间2019年12月3日,AWS re:Invent大会进入第二天。在早上的主题演讲环节,AWS CEO Andy Jassy再次发布了一连串新服务,简单挑选部分、总结如下,供各位读者参考。

基础架构层

新的EC2实例:M6g、R6g与C6g

这三款新实例采用了第二代AWS定制的ARM芯片——graviton2。有意思的是这次的实例不再以A系列命名(第一代使用graviton的实例名称叫做A1),而是直接放入了M系列、R系列与C系列。

新的EC2实例:Inf1

这款实例专门针对机器学习过程中的推断(inference)负载进行了优化。

新的容器服务:Amazon Fargate for Amazon EKS

Fargate首次在去年发布,可以让上层用户以serverless的方式使用容器。去年仅支持ECS,今年增加了对EKS的支持。

新的网络服务

网络服务的增强目前看来是今年AWS re:Invent的重头,不过Andy Jassy表示后面几天才会深入介绍这一系列的网络服务。目前看到的产品名称有AWS Transit Gateway Multicast、AWS Accelerated Site to Site VPN、AWS Transit Gateway Inter-Region Peering、AWS Transit Gateway Network Manager,有助于客户建立全球性的私有网络。

数据层

Amazon S3 Access Points

配合IAM,管理员可以更加精准的控制哪些应用有权限访问S3上的哪些数据。

Amazon Redshift RA3 Instances with Managed Storage

这个RA3实例的特点是可以把计算资源的使用与存储资源的使用分别计费,那些只使用存储的部分就只需要为存储空间付费,不需要为计算资源付费。

AQUA for Amazon Redshift

这是一个非常有意思的新发布!可以说它是AWS团队为应对未来的性能优化趋势的一个尝试。对于云计算三大核心组件——计算、存储、网络,目前网络是一个很大的性能瓶颈,所以AWS做了nitro系统在这方面做了很多优化。但是除了网络之外,我们看到自从2012年以来至今,CPU的吞吐能力仅仅增加了2倍,而SSD存储的吞吐能力已经增长了12倍,按照这个趋势下去,下一个性能瓶颈将会出现在CPU上,而SSD的吞吐能力将有冗余。这个AQUA的全称叫做Advanced Query Accelerator,是一个查询加速器,加速器的工作原理是把原本放在CPU上处理的查询放到SSD上运行——这也是一种因为nitro系统而成为可能的操作方式。

UltraWarm

数据有冷数据,也有热数据。S3有Glacier针对冷数据的低成本存储,而这次发布的UltraWarm则是针对ElasticSearch上的热数据——那些新鲜的日志文件。因为企业用户常有分析日志的需求,一直放在ElasticSearch上成本又太高,这种情况就可以把这些数据放到UltraWarm上,成本可以降低90%。

数据库产品线新成员:Amazon Managed Cassandra Service

如果你需要在AWS上用Cassandra,那么这个服务可以帮你省下不少维护的功夫。坦白讲在2019年看到这个服务的发布让小编有点吃惊——这说明现在在AWS上运行Cassandra的客户不会在少数。

机器学习

TensorFlow、PyTorch、mxnet

AWS对这三个机器学习框架在AWS上的性能做了全面优化,号称比山景城某司的私有部署环境的性能还要超出20%以上。

Amazon SageMaker Studio全家桶

开发者对集成开发环境(IDE)不陌生,但目前看来针对机器学习的开发者还没有特别合适的IDE。这一次发布的SageMaker Studio号称是针对机器学习开发者的IDE,并且从本次发布的阵营来看,远远不仅仅是一个在线代码编辑器而已!本次发布已经包含如下组件:

  • Amazon SageMaker Notebooks - 用来存放机器学习工作流、代码片段、文档、运行结果等信息

  • Amazon SageMaker Experiments - 一个项目里可以保存多个实验(experiments),不同的实验可以有不同的配置,可以方便的对不同实验进行搜索、比对。

  • Amazon SageMaker Debugger - 一个调试工具,调试结果可以在Notebooks里面查看。

  • Amazon SageMaker Model Monitor - 有的时候,一个模型在2016年、2017年都能做出很好的预测,到2018年却不行了,因为外部环境改变了——比如银行利率的影响因子、乃至于影响方式的改变。这个Monitor工具可以自动检测模型是否仍然可以准确预测,在预测变得不准确的时候发出提醒以及给出可能的猜测。

  • Amazon SageMaker Autopilot - 在春天,你把训练数据列表放到一个csv文件里;到秋天,你收获了一堆模型,可以选一个最好的进行部署。这个自动化机器学习工具是不是像它描述的这么神奇?试试看大概会知道吧。

如果说今天的主题演讲最热门的发布是啥,小编觉得一定就是这套Amazon SageMaker开发者工具全家桶了。

AI应用层服务

Amazon Fraud Detector

如果你有一个用户的历史登录行为数据与购买数据,你把这个数据告诉这个Web服务,这个服务就会告诉你这个用户是不是骗子。

Amazon CodeGuru

如果你在Github或者CodeCommit上做开发,你可以在发pull request的时候同步给这位CodeGuru,然后它就会给你做自动化的代码审查(code review),并且把审查结果发布到评论里。对那些缺乏reviewer的项目来说,这个CodeGuru简直像是一大神器!具体效果如何,还要等那些具体用过的同学们反馈了才知道。无论如何,有code review总是比没有强。而且这个CodeGuru号称自己最擅长做的事情是“找到代码中最拖累效率的那一行”,非常有助于提升整体代码的性能。

Contact Lens for Amazon Connect

Amazon Connect智能客服服务已经上线运行了几年,于是有客户提出各种意见:能不能自动分析客户的通话?客户对我们生气的地方是什么?我能不能搜索客户的历史通话?等等。于是AWS就把一系列服务打了个包,做成了这个Contact Lens数据分析服务。同时,AWS团队意识到这么一个服务其实也可以用在企业的内部数据上、产生新的价值,于是又同时做了另一个服务:

Amazon Kendra

这个Kendra服务的用法是,企业可以把自己过去的内部文档——无论是word还是pdf还是在线文档——授权给该服务,然后添加一些FAQ(常见问题)。之后,该服务会巡逻这些文档、建成索引,生成能听懂人话的问答服务。

至此,AWS在人工智能领域的服务能力又往前走了一大截。

不同部署环境下的AWS

私有云部署AWS Outposts

AWS在去年发布的Outposts服务回应了企业对私有化部署的需求,不过当时还是一个Preview,本次则正式可用了,这意味着以后用私有云的企业客户也可以在私有云环境里使用跟AWS公有云上一样体验的API。另外,VMware Cloud on AWS的部署将在2020年可用。

让没有AZ的城市也能低延迟用上AWS服务的Local Zones

AWS目前虽然在全球已经做了22个区域(Region)、69个可用区(AZ),但全球一共有一万多城市,很多城市用AWS的延时还是比较高的,有一定的用户数量。于是就有了Local Zones:这是一个Region的延伸单元,可以由AWS原有基础架构中就存在的边缘站点(Placement Group)改造而成,也可以新建,配备了EC2、EBS、FSx、VPC、ELB、RDS等最基本的AWS服务,放置在一个城市的周边为该城市的用户提供服务。

让5G用户也能低延迟用上AWS服务的AWS Wavelength

AWS把基础架构延伸到运营商合作伙伴的5G网络边缘,作为一个Wavelength Zone,给5G网络覆盖的用户就近提供Web服务。目前公开的运营商合作伙伴,在美国是Verizon,欧洲是Vodafone,日本是KDDI,韩国是SK Telecom。

延展阅读

AWS re:Invent 第一日新品发布一览

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章