对话英特尔戴金权：从笔记本到分布式大数据，无缝扩展 AI | InfoQ大咖说

原創

2020-11-23 15:43

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"采访嘉宾 | 戴金权"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在单机环境中，构建算法模型对数据科学家来说不算难事，但如何很方便地将整个分布式架构构建起来、将算法模型应用到生产数据中，却不是那么容易的事情。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"目前，人工智能有不少落地场景，那么落地的难点主要是哪些？这些算法模型在理想的实验室场景和现实中的运行环境上都有哪些差别？大数据和AI的技术架构未来趋势是什么样的？InfoQ大咖说请来了英特尔大数据技术全球CTO、大数据分析和人工智能创新院院长戴金权，他讲述了他对技术的理解和未来趋势的判断。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"视频回放可查看："}]},{"type":"embedcomp","attrs":{"type":"video","data":{"id":"301807","name":"10月28日大咖说从笔记本到分布式大数据，无缝扩展AI","poster":"https:\/\/static001.infoq.cn\/resource\/image\/0f\/3d\/0fd05777f2fdff910954a2b686461a3d.jpg","url":"https:\/\/media001.geekbang.org\/06f1f1ef7fce4573aed7e524d3978f8b\/73a0b49069c641c08eeae3ff886b513f-692ac6f0be32c9b45a8c7c425ad98721-sd.m3u8"}}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"link","attrs":{"href":"https:\/\/www.infoq.cn\/video\/CmFXSlFAAbgTG2zEOETF","title":"","type":null},"content":[{"type":"text","text":"https:\/\/www.infoq.cn\/video\/CmFXSlFAAbgTG2zEOETF"}]}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"InfoQ：今天我们的直播请到了英特尔戴金权老师，您能简单给我们的观众朋友们介绍一下您的个人经历吗？"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"戴金权"},{"type":"text","text":"：经历还挺简单的。我在2002年硕士毕业之后加入英特尔，一开始是做一些大规模的并行计算的工作。到2007年左右，我们开始做大规模的分布式计算，特别是大规模分布式的数据处理。那时候还没有“大数据”这个说法，但是我们开始在Hadoop等开源大数据平台上做了非常多的研发。2014年左右，我们开始聚焦在大数据平台上的各种分布式的机器学习、深度学习，特别是大数据加AI的方向上，一直在做一些前沿技术及应用场景探索方向的工作。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"当年毕业加入英特尔的时候，英特尔在上海的实验室还不是特别大，我们在底层系统上做了很多非常核心的研究工作，比如编译器这种底层基础软件。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"现在很多深度学习的编译器、深度学习的框架等等，其实都会使用非常大量的编译器的技术。将深度学习、神经网络的整个计算进行优化等等，就涉及到非常多的底层的系统级别的软件技术。所以刚加入英特尔的时候所做的那些工作，是我们比较宝贵的经历。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"InfoQ：这么多年，您在英特尔也主导了好多技术产品研发工作，比较印象深刻的有哪些呢？"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"戴金权"},{"type":"text","text":"：可能有几个。其中一个就是，我们差不多2007、2008年的时候开始做Hadoop，差不多在2011年的时候，当时Hadoop已经很流行了，已经有很多人在使用，我们在这个过程中看到了很多用户有很多新的需求，以此我们就开始思考怎么样才能够满足用户新的需求，以及什么是下一代的大数据技术，于是我们就开始投入到了Spark的工作中。虽然那时候Spark还是伯克利的一个PHD项目，但我们觉得Spark可能是一个比较有前景、能够解决这些问题的一个项目。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"当时我们和伯克利的教授和研究生进行了讨论，大家一起合作起来将Spark用到现实中的应用场景中。因此，英特尔应该也算是业界最早的参与到Spark研发过程中的企业，后来和伯克利以及Databricks一起将Spark带成了Apache顶级项目。这个过程中，我们看到下一代的大数据的技术会是什么样子的，并且做了一些前沿的研究，把它变成一个工业级可用的平台，将一个开源软件项目构建成为一个广泛被接受和使用的项目。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在2017年的时候，我们举办了Strata Data & AI Conference北京（我作为联席主席），当时的一个主题就是“大数据十年”。大数据经过了十几年的发展，大家慢慢的会发现以Hadoop为核心的生态平台，已经成为了今天业内大数据分析处理的事实标准。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"这里面有非常多的组件：比如Hadoop里有分布式文件系统、调度管理、数据仓库；比如Spark从某种意义上来说，是一个非常重要的分布式计算引擎；Flink是更加偏向于实时、低延迟的流式计算引擎。在不同的应用场景里面用到不同的计算框架，但是总的来说，它们还是一个大的大数据生态系统的一部分，各个部分互相协作，成为了今天大数据处理分析平台的基础。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"InfoQ：现在业界其实有一种说法，就是说大数据分析跟AI平台融为一体的模式，正在成为一种行业的新趋势。您认为这两种有哪些差异和共同点？为什么未来会是一个融合的趋势呢？"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"戴金权"},{"type":"text","text":"：AI或者深度学习很多是从企业或大学里的研究机构开始的，最开始可能会有一些特定的场景。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"比如说ImageNet基准数据集，可以用它"},{"type":"text","text":"进行分类，进行"},{"type":"text","text":"算法、"},{"type":"text","text":"模型上创新"},{"type":"text","text":"。最"},{"type":"text","text":"开始AI发展"},{"type":"text","text":"可"},{"type":"text","text":"能"},{"type":"text","text":"就是在这方面，但是到了今天其实很大的一个问题是怎么样将算法、模型上的创新，能够真正应用到现实的生产环境当中去。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"现实生产环境会远比在基准数据集上开发模型要复杂得多，而且很多时候还有比如脏数据等各种各样的情况，那么如何将深度学习等AI算法模型应用到现实场景中，这就涉及到一些调整。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"大家可以看到有很大一部分场景，特别是跟搜索、广告、推荐等相关的应用场景，其实是一个典型的大数据流水线系统，通过大数据平台来处理和管理点击数据、交易数据。那么我们做新的AI推荐算法的时候，有很大一部分工作就是处理大规模的数据层，进行特征提取，进行工作流整合，将AI融入到大数据的流水线中。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"另外一类应用就是计算机视觉，它跟推荐又有所不同，是比较特定的一些算法和应用场景；还有自然语言处理也有自己的应用场景。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"但是我们越来越看到，无论是视觉识别还是自然语言处理，现在大家都想把AI的能力嵌入到原来的业务的各个地方，大家有很多的算法、有标注好的数据、有自动标注过程。在文本处理或自然语言处理的过程中，很多人会使用大数据平台做大规模分布式的文本处理，然后再把这些AI算法用进来。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"我觉得发展成融合大数据和AI的趋势，是因为今天AI不再是一个实验室为主的应用场景，而是要进入到一非常复杂的现实生产环境中，让它能够统一的端到端的运行，我觉得发展到了这个阶段，大家就有了这样的一个需求。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"举个例子，我们最近和美国汉堡王有个合作，他们使用深度学习的推荐算法进行点餐，你可能不会想到点个汉堡也会用到这些技术。在企业这一端会对各种各样的算法、模型进行创新，在学术界，又有一些新的方向，如小样本、无标注，AutoML、自监督学习等，来解决比如说深度学习的问题。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"InfoQ：您觉得目前AI在哪些场景上的落地做的不错呢？"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"戴金权"},{"type":"text","text":"：在我看来有几个大的应用场景。第一个场景是刚才提到的搜索推荐这一类，金融、人寿、电商都有应用，特别是在互联网公司里得到了非常广泛的应用。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"第二个场景，我个人把它总结为“时间序列分析”。时间序列分析也有非常多的应用场景，比如说在制造行业进行设备预测性维护。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"第三个场景在电信行业，比如对5G大规模的基站进行维护分析。还包括一些AIops，利用AI管理数据、设备等，对数据中心这些基础设施进行管理。利用收集的Log信息进行分析、预测和报警。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"当然另外就是最开始的计算机视觉，这个可能就不用展开了，这个是非常非常多的、各种各样的应用场景。自然语言处理也是一样，有非常多的应用场景。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"InfoQ：但是企业想要利用好人工智能去做数据分析，自己也需要有一定的基础架构，那么一个典型的堆栈一般会包括哪些部分呢？"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"戴金权"},{"type":"text","text":"：这个问题应该分成两部分来回答，一方面是深度学习或者机器学习的几个堆栈，底层有一些Library，对一些算子进行优化，当然也包括一些编译器自动进行优化。上面有像TensorFlow、PyTorch这些机器学习或深度学习的框架。还有一方面是数据处理这一块，如Spark、Flink、Kafka、Redis这些组件。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"但是我觉得更重要一点，是怎么样构建一个统一的平台，让这些主件能够在一个端到端的工作流里，数据能够非常好的进来存储和处理，以及进行各种数据分析，包括特征工程、建模等等。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"需要有这么一个端到端的流水线，能够将这些不同的组件有机的整合在一起，提供给你的应用开发人员、数据科学家、AI研究人员来进行使用。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"InfoQ：那么英特尔的大数据\/AI平台，在开发中遇到的一些挑战？"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"戴金权"},{"type":"text","text":"：我们有一个开源的项目叫"},{"type":"link","attrs":{"href":"https:\/\/github.com\/intel-analytics\/analytics-zoo","title":"","type":null},"content":[{"type":"text","text":"Analytics"}]},{"type":"link","attrs":{"href":"https:\/\/github.com\/intel-analytics\/analytics-zoo","title":"","type":null},"content":[{"type":"text","text":" "}]},{"type":"link","attrs":{"href":"https:\/\/github.com\/intel-analytics\/analytics-zoo","title":"","type":null},"content":[{"type":"text","text":"Zoo"}]},{"type":"text","text":"，从某种意义上来说，它提供了一个端到端的大数据"},{"type":"text","text":"分析"},{"type":"text","text":"加AI平台，它把各种不同的组件，从TensorFlow、PyTorch等，再到Spark，Flink，包括Ray等，整合成一个端到端的流水线。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"我们希望通过提供这么一个端到端的平台，用户可以在Hive或其他数据仓库进行数据存储，用Spark DataFrames进行处理，在运行TensorFlow模型，在内存中进行分布式的训练和运行推理等等。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"一方面我们用了一些开源组件，另一方面针对英特尔自己的硬件做了优化加速，将这些整合成一个统一的平台，用户可以用这个平台进行处理分析。这是我们最早的一个重点工作，就是说怎么样将这些深度学习等AI算法模型可以直接运行在大数据平台或流水线上，其次还能够无缝的透明的把它扩展到大规模分布式环境中。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"InfoQ：其实我们现在已经进入到这个以数字为中心的世界，但得到分析的数据百分比却不高，您认为这是数据处理行业的一个现状吗？"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"戴金权"},{"type":"text","text":"：我们的确可以看到数据的处理分析"},{"type":"text","text":"确实"},{"type":"text","text":"远远没有达到我们希望的程度。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"我可以举两个例子。一个例子是欧洲的核子研究机构，运行了世界上最大强子对撞机。对撞机差不多25纳秒对撞一次，每秒产生1PB的数据，数据太大导致没法存储处理。我们跟他们有合作，他们希望构建一个深度学习的分类器，把这一PB的数据做各种分类，找到其中可能差不多10GB左右的数据，将它存储下来，然后他们科学家再进行分析。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"另外一个场景是SK电信，针对的是他们的基站。他们可能有几十万个基站，每个基站会产生很多指标，差不多每五秒收集一次。因为这个数据量也是非常惊人的，他们希望挖掘出里面相关的信息去预测网络的质量，去做异常检测，或根因分析，这样的话出状况的时候能定位到问题。我们的合作到今天来说，可能第一步还做得不错，就是我们能把它存下来，收集过来，做一些查询和展示。我们还需要做一些更高层次的分析。目前我们也有一些初步的结果，比如说我们可以通过深度学习等方法做质量的预测等等，但是跟我们想要做的事情相比还差的比较远。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"InfoQ：从概念的验证到这个项目的投产，这个过程有很多的不确定因素，您认为这个过程当中会导致项目失败的原因可能会有哪些呢？"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"戴金权"},{"type":"text","text":"：第一，需要针对应用场景进行定义。我们要构建一个机器学习应用场景的话，首先需要将问题变成一个正确的数学模型。因为"},{"type":"text","text":"机"},{"type":"text","text":"器学习、深度学习就是对虚线进行拟合"},{"type":"text","text":"、"},{"type":"text","text":"优化一些指标，优化的指标需要跟应用的需求一致，这是一个非常关键的问题。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"第二，即使将它归结成了一个已经定义好的问题，但我们还有很多的算法可以选择。这些算法其实在设计"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"的时候，有很多论文，有很多开源的算法，但它们可能都是针对某一个场景某一个数据集进行设计和验证的。机器学习有一个很著名的名言就是“没有免费的午餐”。一个模型并不是在任何场景或任何数据集下都可用，如何将这些实验室设计出来的模型，很好的运用在实际场景中，还需要一个调优的过程。现在的一个挑战是，如果每一个应用场景都需要从头到尾做一遍，我觉得就不太现实，因为投入产出比会很差。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"第三，需要有从数据处理，到模型的实验，再到最后的上线验证的平台，将这些可能有80%的共性的东西进行平台化，再在上面支撑各种不同的场景，不同的算法模型，并且还可以快速的迭代，这个也是一个决定性因素。这决定了大家能不能有效率的将这个应用给做出来，去改进一些产品、商业指标。如果这个代价太大的话，那么改进也是一个失败。做AI应用最后都变成针对某一种场景去做定制，这也是一个很常见的现象。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"我们在实验室里面，可能涉及的模型，可能跟现实中的系统优化的问题不一样。比如说我举一个例子，电信公司建设网络时有一个时间序列预测的需求。我碰到过一些情况，构建的这个时间序列分析的模型开始时工作非常好。当时设计的时候，收集基站过去一个月，或者过去一年的时间的这些指标，进行时间序列预测分析，到使用时却发现优化的目标跟设计时不一样。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"为什么呢？因为一个城市有几十万到几百万个这样子的"},{"type":"text","text":"基站"},{"type":"text","text":"，我们没有可能为每个"},{"type":"text","text":"基站"},{"type":"text","text":"，设计一个训练模型对它进行预测，在实施过程中就没法去应用它。机器学习在场景中，模型问题的定义，跟实际的应用当中有偏差，就会导致做的很多工作不符合要求。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"InfoQ：如果我们以人的视觉来看待从验证到投产的这个过程，那么其中的算法的研究人员，以及应用的工程师，他们应该具备什么样的能力才能更好的保证落地成功呢？"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"戴金权"},{"type":"text","text":"：我觉得现在的这个现状，是算法工程师或者数据科学家构建出一个原型，但到应用中去却存在一堵墙。算法工程师将原型扔过这堵墙，机器学习工程师或者数据工程师再进行改写，构建一个可以运行和部署的程序。然后还得再扔过一堵墙，交给运维人员去运维上线。这还是非常普遍的一个现象。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"我觉得从某种意义上来说，我们希望算法工程师、数据科学家和机器学习的工程师、数据工程师之间能够有一个交叉。作为一个算法的工程师，对模型算法设计非常了解，但是也得知道底层的系统是什么样子的，他所负责的内容是如何运行在这个系统上的。机器学习工程师也得知道上面的算法是长成什么样子的，怎么样能够更好的支持这些算法，现实的生产环境中怎么样去部署。很多公司会是不同的团队，当然也有些公司会是同一个团队，但是不管怎么说，都需要他们有一定的交叉，不同组织架构都能有一个共同的技术目标。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"InfoQ：您认为大数据分析技术未来的趋势会是什么样的？"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"戴金权"},{"type":"text","text":"：我觉得主要有两方面。一方面就是我之前提到，存储数据可能不是最大的问题，有各种SQL的查询、基于图的分析等等技术可以利用起来。另一方面就是如何构建一个模型去做预测分析或一些自动化决策，利用机器学习、深度学习，更好的去分析数据进行数据洞察。将来比较有价值的一些应用场景是，要么数据很少，或者有标签的数据很少，可以用自监督学习这样的方法来解决这些问题。在数据分析领域，图神经网络或者一些增强学习的方法，在某些问题上有比较好的前景。另外一个趋势是模型越来越大，大规模的模型中如何进行数据的自动标注。也需要现有的需求出发，考虑将来的一些灵活性，考虑一些比较新的技术。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Analytics Zoo："},{"type":"link","attrs":{"href":"https:\/\/github.com\/intel-analytics\/analytics-zoo","title":"","type":null},"content":[{"type":"text","text":"https:\/\/github.com\/intel-analytics\/analytics-zoo"}]}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"BigDL："},{"type":"link","attrs":{"href":"https:\/\/github.com\/intel-analytics\/BigDL","title":"","type":null},"content":[{"type":"text","text":"https:\/\/github.com\/intel-analytics\/BigDL"}]}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}}]}

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

22万奖金池已到位，2024天池云原生编程挑战赛正式启动

阿里雲作爲雲原生技術的推動者及引領者，一直走在行業發展的前沿，始終關注業內新方向。爲推動新技術發展，發現創新人才。自 2015 年開始，阿里雲啓動中間件性能挑戰賽，到2020年升級爲雲原生編程挑戰賽，今年正值大賽十週年，我們繼續向全球開發者

2024-06-14 21:13:40

1300万开发者都在关注的大会！WAVE SUMMIT 2024即将来袭

2024年大模型技術迅猛革新，百度作爲前沿科技風向標的代表性企業動向備受關注。中國AI領域頂級開發者盛會WAVE SUMMIT 深度學習開發者大會2024日漸臨近，將於6月28日在北京望京凱悅酒店正式召開。 WAVE SUMMIT 202

2024-06-14 00:26:15

OpenTelemetry 实践指南：历史、架构与基本概念

背景之前陸續寫過一些和 OpenTelemetry 相關的文章：實戰：如何優雅的從 Skywalking 切換到 OpenTelemetry 實戰：如何編寫一個 OpenTelemetry Extensions 從一個 JDK21+O

2024-06-14 12:33:40

MySQL 核心模块揭秘 * 20 期 * MySQL 怎么加表锁？

意向共享鎖、意向排他鎖、AUTO-INC 鎖是 InnoDB 最常用的表鎖，它們的加鎖流程是什麼樣的？作者：操盛春，愛可生技術專家，公衆號『一樹一溪』作者，專注於研究 MySQL 和 OceanBase 源碼。愛可生開源社區出品，原創

2024-06-13 23:59:22

想提高阅读代码的效率？试试这些工具吧！

前言程序員間有句名言——“Talk is cheap, show me the code！”源碼的確相較於言語更接近程序真實的狀態，包含了更多的一手信息。因此，無論是剛開始學習代碼的小白還是久經沙場的代碼大神，不管是學習優秀的開源項目

京東雲開發者

2024-06-13 23:54:57

技术解读华为云CCE Autopilot，k8s集群托管免运维

本文分享自華爲雲社區《華爲雲CCE Autopilot：全面“自動駕駛”時代的引領者》，作者：雲容器大未來。華爲雲隆重推出雲容器Serverless產品CCE Autopilot，引領容器服務進入全面“自動駕駛

2024-06-13 22:57:43

【运维技巧】海豚调度工作流实例卡在正在停止&任务实例卡在正在运行怎么办？

在大數據調度系統中，，大家可能會碰到任務實例狀態更新不及時的情況。對於Apache DolphinScheduler用戶來說，這可能意味着前端顯示的任務狀態與實際情況不一致，即使任務已經在後臺停止運行，前端仍顯示爲"正在運行"。這種現

2024-06-13 21:22:20

Fluid 1.0 版发布，打通云原生高效数据使用的“最后一公里”

作者：顧榮前言得益於雲原生技術在資源成本集約、部署運維便捷、算力彈性靈活方面的優勢，越來越多企業和開發者將數據密集型應用，特別是 AI 和大數據領域應用，運行於雲原生環境中。然而，雲原生計算與存儲分離架構雖然帶來了資源經濟性與擴容靈活性

2024-06-13 21:13:48

云消息队列 ApsaraMQ 成本治理实践（文末附好礼）

作者：家澤、稚柳前言：在 AI 原生應用架構浪潮中，消息隊列需支持大規模數據和複雜 AI 模型訓練與推理場景下的高效異步通信，其成本效益優化也日益受到重視。面對大模型或大數據量，消息量顯著增加，雲消息隊列 ApsaraMQ 致力於降低消

2024-06-13 21:13:40

多款可观测产品全面升级丨阿里云云原生 5 月产品月报

雲原生月度動態雲原生是企業數字創新的最短路徑。《阿里云云原生每月動態》，從趨勢熱點、產品新功能、服務客戶、開源與開發者動態等方面，爲企業提供數字化的路徑與指南。趨勢熱點 ?* 阿里云云原生產品負責人李國強：推進可觀測產品與 OpenT

2024-06-13 21:13:39

JeecgBoot 企业级开源低代码平台，v3.7.0 里程碑大版本发布

項目介紹 JeecgBoot是一款企業級的低代碼平臺！前後端分離架構 SpringBoot2.x，SpringCloud，Ant Design&Vue3，Mybatis-plus，Shiro，JWT 支持微服務。強大的代碼生成器讓前後端代

2024-06-13 13:12:19

DophinScheduler 如何定期删除日志实例？

轉載自東華果汁哥 Apache DophinScheduler 運行一段時間後，實例調度日誌越來越多，需要定期清理。 SQL 錯誤 [1701] [42000]: Cannot truncate a table referenced in

2024-06-12 11:26:18

一个 Clickhouse 集群磁盘损坏恢复数据的案例

通過一個故障案例，理解 ClickHouse 分佈式機制。作者：張宇，愛可生DBA，負責數據庫運維和故障分析。擅長 ClickHouse、MySQL、Oracle，愛好騎行、AI、動漫和技術分享。愛可生開源社區出品，原創內容未經授權不

2024-06-11 23:59:12

还能报名！风靡硅谷开发者的Unstructured Data Meetup 杭州站与您6月15日见面！

"最硅谷"的Unstructured Data Meetup即將來到杭州西溪！衆所周知，AI 三要素包括：算力、算法和數據。數據的價值愈發凸顯，而其中非結構化數據更是備受關注。IDC 預測，到 2027年，全球數據總量中將有超過 86.7

2024-06-12 14:15:35

《网络反不正当竞争规定》9月1日实施，这两类欺诈被重点关注

近日，國家市場監督管理總局公佈《網絡反不正當競爭暫行規定》，自2024年9月1日起施行。《網絡反不正當競爭暫行規定》是爲預防和制止網絡不正當競爭行爲，維護公平競爭的市場秩序，鼓勵創新，保護經營者和消費者的合法權益，促進數字經濟規範持續健康

2024-06-13 00:13:29

24小時熱門文章

最新文章

最新評論文章