TensorFlow企业版来了,商业AI平台:“这日子没法过了”

谷歌于今年10月份推出TensorFlow 企业版,补足企业市场短板。谷歌的 TensorFlow 机器学习框架于 2015 年开源,并迅速成为最受欢迎的机器学习平台之一。到目前为止,已经被下载 4600 万次。为了占领企业市场,谷歌推出了 TensorFlow Enterprise,包括实施级别的企业级支持和优化的 Google Cloud 托管服务。

TensorFlow Enterprise 最重要功能之一是它将提供长期的技术支持。针对某些版本,谷歌将提供长达三年的补丁程序,所有补丁和错误修复将在 TensorFlow 主线代码存储库中提供。另外,谷歌还将向正在构建 AI 模型的公司提供来自 Google Cloud 和 TensorFlow 团队的工程协助。

同时,TensorFlow Enterprise 也与 Google 自己的云服务深度集成。谷歌在它的公告中写道:“由于 TensorFlow 由 Google 创建并开源,因此 Google Cloud 可以直接从 TensorFlow 团队得到支持和帮助,具有独特的优势”, “加上我们在人工智能和机器学习方面的深厚专业知识,这使 TensorFlow Enterprise 成为运行 TensorFlow 的最佳方法”。

由于目前市场上的商业通用AI平台(软件即服务,下简称商业AI平台)跟AI云服务在功能上高度重合,且商业模式不及云服务,谷歌提供企业版之后,这些AI平台初创企业压力倍增。

大数据和云企业的施压

从2018年到现在,AI行业就频繁传出AI公司倒闭潮的预测。业内不断的有声音认为“90%的AI企业面临倒闭”,“会有一波大的洗牌“。

谷歌的DeepMind在过去三年里,亏损10亿美元,但未来还有10亿的预算投入。AI创业企业,没有谷歌之于DeepMind的背景,就得有自我造血功能,方能活下去。比如当初做“三维视觉感知”的强AI企业,也得朝主流的“深度学习+人脸识别”转移,进入安防行业落地。

而商业AI平台通常的落地场景是金融领域,如银行业的风控、精准营销;零售行业,如智能推荐、销售预测…

如今,大多数企业都在谈数字化转型,为了保持企业的营收持续增长。风控、精准推荐也是主流大数据企业的关键业务。而AI平台型初创企业跟主流大数据企业相比起来优势并不明显。

机器学习流程原型是首先清理数据,然后提取特征,最后经过转换的输入通过一个机器学习模型以创建预测结果。

机器学习算法只是其中一环。数据是机器学习应用的重中之重,数据准备占据了60%以上人天成本。传统大数据企业在数据治理上积累了多年的经验,数据治理能力、数据存储集群管理能力也是一些大数据企业的天然技术壁垒。当商业AI平台落地业务时,还是要面对各种脏数据,需要投入大量人力时间解决数据问题。

挣到钱,有自我造血能力才能活下去,才能进化得更好。与大数据企业同食一块蛋糕,在这些落地场景里,AI平台即服务的优势并不明显,那么盈利能力堪忧。

另外不可忽视的是机器学习平台同样需要管理和维护工具。云服务的优势恰恰是维护容易。且形式灵活,可支持私有云部署。

另外类似谷歌这类的主流云服务功能上不仅提供了精准推荐、预测,还有强AI功能如语音识别和图像处理等功能,这些强AI能力通常也有大厂的AI实验室予以保证。并且云服务可按需付费,商业模式清晰且受过验证。对于谷歌和国内的BAT云服务来说,是在云服务应用广泛的基础上叠加AI能力,比起平台即服务,AI销售压力较小,可有更多的力量投入到长期性的技术研发中。云服务给平台即服务的冲击力同样巨大。

开源的逼迫力量

2015年11月,谷歌第二代深度学习框架TensorFlow横空出世。

2015年注定成为开源的分水岭。谁也不曾料到,后面几年在人工智能领域里,涌起的开源浪潮有多猛烈。

与TensorFlow同一时期,微软亚洲研究院开源机器学习工具包DMTK。

2016年9月百度发布“Paddle”,腾讯也在当年发布Angel。

2016年11月宣布将MXNet作为官方深度学习平台。

2017年1月,Facebook推出机器学习框架PyTorch。2017年,Uber开源了Horovod。

AI框架上承应用、下接芯片,是AI产业的软件支柱,包含几个层次,比如底层的芯片、含数据存储的大数据集群;再一层是计算框架,类似Spark这样的ML框架、TensorFlow这样的DL框架;再往上一层是高级API和分布式调度框架,如Angel;最上一层,是AI业务应用,如推荐系统、智能问答、人脸识别…每个层次均有对应的开源软件可组合使用。

这些开源平台背后技术力量雄厚,且各有优点。

比如TensorFlow基于Python,写的很快并且具有可读性;在多GPU系统上的运行更为顺畅;代码编译效率较高;提供API的支持,可直接解决各种机器学习任务。在工业界,TensorFlow使用率达到最高。

比如Uber 开源参数服务器Horovod通过AllReduce来实现机器间模型同步,由于底层使用MPI、支持RDMA等高性能网络,可以利用带宽并行。同时与主流深度学习打通,Tensorflow,PyTorch等,有良好生态方便上手。

利用开源的项目,开发人员就能完成基本的任务,在开源的推动下,中国出现了近千家AI创业公司,仅次于排名第一的美国。

商用AI平台需要在多个主要环节强于开源软件,才能叫好并叫座。目前开源还是商业化AI平台即服务的强有力的对手,并且这次提供的TensorFlow企业版服务提供了高达3倍的数据读取改进(TensorFlow 读取和缓存文件方式更改的结果)。并且已针对 Nvidia GPU 和 Google Cloud TPU 优化了企业版。TensorFlow企业版针对实际使用的硬件和平台都做了优化,更好的提升了企业AI平台的性能。

AutoML

使用AutoML是目前比较主流的机器学习平民化方法,被一些AI平台当作杀手鐗。同时AutoML被认为是解决十万AI人才缺口的救星。

2018年1月,当时的谷歌云首席科学家李飞飞和谷歌云研发负责人李佳宣告Cloud AutoML的问世。

机器学习涉及到数据预处理、特征工程、模型调参等环节。需要人工选择参数,设计模型,验证调整,如此反复。AutoML让这些自动完成,相当于让AI来设计AI。与专业调参建模相比,AutoML的优势在于使用门槛低,解决一些重复性劳动。

在真实世界里,技术是流动的,永远不会静止,永远不会完结,永远不会完美。–《技术的本质》

目前的AutoML的缺点也是很明显的,首先是一个黑盒的模块,大量的数据预处理、特征或者模型的尝试,专家没有办法干预,因此可能会带来一些效率低下的问题,消耗大量算力,其次是AutoML只能解决确定性的可量化的目标,对于实际情况,需要在多个不同的业务目标(比如准确率和线上延迟)之间进行权衡,以及可能需要涉及到一些不可以明确量化的目标,比如可解释性,这些情况下目前的AutoML是无法有效工作的,甚至有些时候,人也没有办法一下子给出目标,需要不断地探索。

深度学习专家 François Chollet 也曾置评这项技术:“不久之后,AutoML 就会发现他们将面临和强化学习一样的问题:人们会用非常具体的(有缺陷的)方法来解决许多宽泛的问题。”

有些企业的解决方式是引入人机交互的方式,但同样需要专业的人士参与,也不能根本上解决十万AI人才缺口的问题。目前的AutoML并达不到理想效果,还需多年的努力。

下一个趋势是什么

2016年,小米的创办人雷军说过:“站在风口上,猪都会飞”。

2016年初,Alpha Go击败了代表人类出战的李世石。BAT在这一年纷纷开始了AI布局,给予了大量的人力和财力。

中国互联网在过去的15年中,经历过五六个周期,每个周期主题都不太一样。最开始的门户网站,出现了如新浪、网易、搜狐等企业;然后是增值电信业务,腾讯当年靠电信业务上市;再后面是视频网站和社交网站;然后是电商和互联网金融企业,如阿里巴巴、京东。不严格划分,就是三年一个周期。

最近三年,也可以说是AI企业涌起的周期,这条赛道同样出现了几百家甚至上千家创业企业。这三年,有开始的创立浪潮有最后的寒冬衰退。

商用AI平台经历了数年发展,如果现在还没建起明显的技术护城河,没有令人信服的技术优势,对比云服务,功能重合,盈利模式堪忧,靠加强宣传的方式照样解决不了问题。

更不曾想到,在2019年底,谷歌在TensorFlow市场占有率无敌的背景条件下再次推出企业版,强占企业市场。

趁时势可以起大事,但也要在“风口”中炼出真功夫,“风口”过后才是真较量。

在与技术专家的交谈中,对比商业AI平台,专业人士也都表示更看好谷歌的TensorFlow 企业版策略。

回头去看,这是商业AI平台的创建者缺乏远思吗?除商业AI平台之外还有很多AI落地都经过了战略性收缩。

2018年10 月 21 日,特斯拉已经从公司官网的预订页面下架了长期以来提供的“全自动驾驶”选项。马斯克曾在三年前声称,2017 年之前特斯拉将实现全自动驾驶,如今这个目标的实现已无定期。

2015年4月,IBM成立了独立的Watson Health部门;到2016年,IBM第四次转型,Watson被寄予担纲厚望。2019年4月,投资50亿的IBM医疗裁员70%。

微软最初于2015年12月推出了针对iOS和Android的语音助手Cortana(微软小冰)。2019年11月,微软宣布其语音助手Cortana战略性收缩,将在2020年1月31日退出iOS和Android平台(美国除外)。

通用AI一直是顶级AI专家的梦想,也是谷歌DeepMind终极目标。就像前面所说,DeepMind在过去三年里亏损10亿美元,但未来还有10亿的预算投入。这样的投入,对于一般企业来说,是望而却步的存在。

这些AI的小败局,不过就是告诉今天的你,有哪些技术已能见效,有哪些技术目前还不稳定还不理想;有哪些行业属于刚需,有哪些行业还需继续探索。未来还有什么行业值得投入,这将决定AI企业的成败。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章