从Lambda到无Lambda，领英吸取到的教训

原創

2021-01-07 11:08

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Lambda架构已经成为一种流行的架构风格，它通过使用批处理和流式处理的混合方法来保证数据处理的速度和准确性。但它也有一些缺点，比如额外的复杂性和开发\/运维开销。LinkedIn高级会员有一个功能，就是可以查看谁浏览过你的个人资料(Who Viewed Your Profile，WVYP)，这个功能曾在一段时间内采用了Lambda架构。支持这一功能的后端系统在过去的几年中经历了几次架构迭代：从Kafka客户端处理单个Kafka主题开始，最终演变为具有更复杂处理逻辑的Lambda架构。然而，为了追求更快的产品迭代和更低的运维开销，我们最近把它变成无Lambda的。在这篇文章中，我们将分享一些在采用Lambda架构时的经验教训、过渡到无Lambda时所做的决定，以及经历这个过渡所必需的转换工作。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"这个系统是如何运作的"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"WVYP系统依靠一些不同的输入源向会员提供最近浏览过其个人资料的记录："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"bulletedlist","content":[{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"捕获浏览信息并进行除重；"}]}]},{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"计算浏览源(例如，通过搜索、资料页面浏览等)；"}]}]},{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"浏览相关性(例如，一位高级人员查看了你的资料)；"}]}]},{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"根据会员的隐私设置查看模糊信息。"}]}]}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"下图显示了使用Lambda架构的系统简化图。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"image","attrs":{"src":"https:\/\/static001.infoq.cn\/resource\/image\/46\/c7\/46202854de89e305b7ba2582byyab9c7.png","alt":null,"title":"","style":[{"key":"width","value":"75%"},{"key":"bordertype","value":"none"}],"href":"","fromPaste":false,"pastePass":false}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"首先，我们有一个Kafka客户端，可以近实时地处理并提供会员资料视图活动。当一个会员查看另一个会员的个人资料时，会生成一个叫作ProfileVieweEvent的事件，并发送到Kafka主题。处理作业将消费这个ProfileVieweEvent并调用大约10个其他在线服务来获取额外的信息，如会员概要数据、工作申请信息、会员网络距离(一度、二度连接)等。然后，该作业将处理后的消息写入另一个Kafka主题，这个主题的消息将被Pinot(一个分布式OLAP数据存储，"},{"type":"link","attrs":{"href":"https:\/\/pinot.apache.org)消费","title":"","type":null},"content":[{"type":"text","text":"https:\/\/pinot.apache.org)消费"}]},{"type":"text","text":"。Pinot将处理后的消息追加到实时中。Pinot可以处理离线和实时数据，所以非常适合被用在这个地方。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"与此同时，还有一组离线的Hadoop MapReduce作业在不同的技术栈中执行上述操作，使用的是ETL过的ProfileViewEvent和上述服务处理过的相应数据集。这些作业每天加载这些数据集，并执行数据转换操作，如过滤、分组和连接。此外，如上图所示，离线作业还将处理实时作业不处理的NavigationEvent，这个事件可以告诉我们浏览者是如何找到被浏览资料的。处理后的数据集被插入到Pinot的离线表中。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Pinot数据库负责处理来自实时表和离线表的数据。中间层服务通过查询Pinot获取处理过的会员资料信息，并根据前端API的查询参数(如时间范围、职业等)对数据进行切片和切块。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"这就实现了Lambda架构："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"bulletedlist","content":[{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"实时作业侧重速度，进行不完整信息的快速计算；"}]}]},{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Hadoop离线作业侧重批处理，旨在提高准确性和吞吐量；"}]}]},{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Pinot数据存储是服务层，将批处理和实时处理的视图合并起来。"}]}]}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Lambda架构为我们带来了很多优势，这要得益于实时处理的快速和批处理的准确性及可再处理性。然而，这也伴随着大量的运维开销。随着我们不断迭代产品并增加更多的复杂性，是时候做出改变了。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"我们的挑战"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"众所周知，Lambda架构带来了饱受诟病的运维开销，违反了“不要重复你自己”(DRY)原则。更具体地说，WVYP系统面临以下几个挑战："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"numberedlist","attrs":{"start":1,"normalizeStart":1},"content":[{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":1,"align":null,"origin":null},"content":[{"type":"text","text":"开发人员必须构建、部署和维护两个管道，这两个管道产生数据大部分是相同的；"}]}]},{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":2,"align":null,"origin":null},"content":[{"type":"text","text":"这两个处理管道需要在业务逻辑方面保持同步。"}]}]}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"上述的两个挑战占用了开发人员大量的时间。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"导致系统的演化有很多不同的原因，包括特性增强、bug修复、合规性或安全性的变更、数据迁移等。WYVP的所有这些变更都需要付出双倍的成本，部分原因是因为Lambda架构。更糟糕的是，Lambda架构还带来了额外的问题，因为我们是基于两个不同的技术栈实现大部分的特性，所以新的bug可能会在批处理或实时处理中出现。此外，随着LinkedIn工具和技术栈的不断演化，我们需要不断地跟进，以便能够保持在最新状态。例如，在最近的一次GEO位置数据迁移过程中，我们发现了一些不必要的复杂性。Lambda架构的分层带来了运维上的负担。例如，实时作业在处理消息是会出现延迟，离线作业有时会失败——这两种情况我们都太熟悉了。最终我们发现，这种开销是不值得的，因为它显著降低了开发速度。因此，我们开始努力重新改造WVYP的Lambda架构。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"无Lambda架构"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"我们开始简化架构，移除全部离线批处理作业，并使用Samza开发新的实时消息处理器。我们之所以选择移除离线作业并保留实时处理，主要原因是产品需要近实时的会员资料浏览通知。批处理更适合用在其他一些场景中，例如在A\/B测试中计算业务指标影响。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"新架构如下图所示。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"image","attrs":{"src":"https:\/\/static001.infoq.cn\/resource\/image\/1b\/ca\/1b7e52f844e220216a3bd57841fffcca.png","alt":null,"title":"","style":[{"key":"width","value":"75%"},{"key":"bordertype","value":"none"}],"href":"","fromPaste":false,"pastePass":false}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"新架构的两个主要变化："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"bulletedlist","content":[{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"创建了一个新的Samza作业，用来消费ProfileVieweEvent和NavigationEvent，旧的消费者客户端只消费ProfileVieweEvent。"}]}]},{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"所有的离线作业都被移除，并创建了一个单独的作业，我们稍后将讨论这个作业。"}]}]}]},{"type":"heading","attrs":{"align":null,"level":4},"content":[{"type":"text","text":"Samza作业"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Samza最初由LinkedIn开发，是LinkedIn的分布式流式处理服务，现在是Apache的一个项目。我们选择将现有的实时处理器作业迁移到Samza有很多原因。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"首先，Samza支持各种编程模型，包括Beam编程模型。Samza实现了Beam API（"},{"type":"link","attrs":{"href":"https:\/\/beam.apache.org","title":"","type":null},"content":[{"type":"text","text":"https:\/\/beam.apache.org"}]},{"type":"text","text":"）：我们可以用它轻松地创建数据处理单元管道，包括过滤、转换、连接等。例如，在我们的例子中，我们可以很容易地加入PageVieweEvent和NavigationEvent，近乎实时地计算出视图的来源——这在旧处理器中是不容易做到的。其次，在LinkedIn部署和维护Samza作业非常简单，因为它们运行在由Samza团队维护的YARN集群上。开发团队仍然需要处理伸缩、性能等问题，但在定期维护方面确实有很大帮助(例如，不需要担心机器发生故障)。最后，Samza与LinkedIn的其他工具和环境进行了很好的集成。"}]},{"type":"heading","attrs":{"align":null,"level":4},"content":[{"type":"text","text":"新的离线作业"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"有些人可能会问，为什么我们仍然在无Lambda架构使用离线作业。事实上，从架构转换的角度来看，这并不是必要的。但是，如上图所示，离线作业会读取HDFS里经过ETL的数据，这些数据是由Samza作业通过Kafka主题间接产生的。离线作业的唯一目的是将所有写入Pinot实时表的数据复制到离线表。这样做有两个原因：1)由于数据的组织方式，离线表有更好的性能(离线表的数据段比实时表要少得多，查询速度更快)。2)处理过的视图数据将保留90天，而实时表只保留几天的数据，并通过自动数据清除功能进行清除。新离线作业与旧离线作业的一个关键区别是，新作业在处理逻辑上与实时作业没有重叠，它没有实现Samza作业中已经实现的逻辑。当Pinot能够自动支持从实时表到离线表的文件整合时，我们就可以移除这个作业。"}]},{"type":"heading","attrs":{"align":null,"level":4},"content":[{"type":"text","text":"消息再处理"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"天底下没有无bug的软件，一切事物仍然会以不同的方式出错。对于WVYP，使用错误的逻辑处理过的事件会一直保留在数据库中，直到被重新处理和修复。此外，一些意想不到的问题会在系统可控范围之外发生(例如，数据源被破坏)。批处理的一个重要作用是进行再处理。如果作业失败，它可以重新运行，并生成相同的数据。如果源数据被损坏，它可以重新处理数据。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在进行流式处理时，这个会更具挑战性，特别是当处理过程依赖其他有状态的在线服务提供额外的数据时。消息处理变成非幂等的。WVYP在状态方面依赖在线服务，在消息被处理时需要向会员发送通知(但我们不想发送重复的通知)。如果所选择的数据存储不支持随机更新，比如Pinot，那么我们就需要一个重复数据删除机制。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"我们意识到，要解决这个问题，并没有什么灵丹妙药。我们决定以不同的方式对待每个问题，并使用不同的策略来缓解问题："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"bulletedlist","content":[{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"如果我们要对处理过的消息做一些微小的改动，最好的方法是写一个一次性离线作业，读取HDFS中已处理的消息(就像新架构中的离线作业那样)，进行必要的处理，再推送到Pinot，覆盖掉之前的数据文件。"}]}]},{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"如果出现重大的处理错误，或者Samza作业处理大量事件失败，我们可以将当前的处理偏移量倒回到前一个位置。"}]}]},{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"如果作业只在某段时间内降级，例如视图相关性的计算失败，我们将跳过某些视图。对于这种情况，系统将在这段时间内降低容量。"}]}]}]},{"type":"heading","attrs":{"align":null,"level":4},"content":[{"type":"text","text":"去重"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"重复处理发生在各种场景中。一个是上面提到的，我们显式地想要重新处理数据。另一个是Samza固有的，为了确保消息的至少一次处理。当Samza容器重新启动时，它可能会再次处理一些消息，因为它读取的检查点可能不是它处理的最后一条消息。我们可以在两个地方解决去重问题："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"bulletedlist","content":[{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"服务层：当中间层服务从Pinot表中读取数据时，它会进行去重，并选择具有最新处理时间的视图。"}]}]},{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"通知层：通知基础设施确保我们不会在指定的时间段内向会员发送重复的通知。"}]}]}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"价值"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"Lambda架构已经存在了很多年，并得到了相当多的赞扬和批评。在迁移WVYP的过程中，我们获得了以下这些好处："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"bulletedlist","content":[{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"通过将大部分的开发时间减半，开发速度得到了显著的提升，维护开销也减少了一半以上(实时流程的维护开销比批处理流程少)。"}]}]},{"type":"listitem","attrs":{"listStyle":null},"content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"提升了会员的用户体验。现在在开发过程中引入错误的可能性降低了。我们也有了更好的实时计算(例如，视图源的快速计算，这在以前是不可用的)，可以更快地为会员提供WVYP信息。"}]}]}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"通过释放开发人员的时间，我们现在能够进行更快的迭代，并将精力放到其他地方。在这篇文章中，我们分享了WVYP系统的开发、运行和重新改造过程，希望我们的一些收获能够帮助那些在使用Lambda架构时面临类似问题的人做出更好的决策。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"原文链接："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"link","attrs":{"href":"https:\/\/engineering.linkedin.com\/blog\/2020\/lambda-to-lambda-less-architecture","title":"","type":null},"content":[{"type":"text","text":"https:\/\/engineering.linkedin.com\/blog\/2020\/lambda-to-lambda-less-architecture"}]}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}}]}

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

大数据小白的测试成长之路

引言 22年校招入職京東後，我一直在數據中臺測試部從事測試開發的工作。畢業後，寫的最多的文檔是測試計劃和測試報告，鮮有機會就自己的成長碼字進行回顧和總結。借“up技術人”欄目，也終於是在工作之餘回頭望，對自己這近兩年時光進行一個小總結

2024-04-28 11:17:19

从NoSQL到NewSQL——10年代大数据浪潮下的技术革新

引言在數字化浪潮的推動下，數據庫技術已成爲支撐數字經濟的堅實基石。騰訊雲 TVP《技術指針》聯合《明說三人行》特別策劃的直播系列——【中國數據庫前世今生】，我們將通過五期直播，帶您穿越五個十年，深入探討每個時代的數據庫演變

2024-04-28 23:12:26

“百团大战”下，20年代的国产数据库如何乘风破浪？

引言在數字化浪潮的推動下，數據庫技術已成爲支撐數字經濟的堅實基石。騰訊雲 TVP《技術指針》聯合《明說三人行》特別策劃的直播系列——【中國數據庫前世今生】，我們將通過五期直播，帶您穿越五個十年，深入探討每個時代的數據庫

2024-04-28 23:12:24

如何从0到1设计诊断系统

引言在整車電子電氣體系中，診斷系統的設計扮演着至關重要的角色，負責支持整車的刷寫、故障排查和EOL(End of Line)等關鍵操作。這一重要性在於這些操作的實現都依賴於診斷系統的全面支持。因此，在設計診斷系統時，必須確保

2024-04-26 22:43:26

华为云Stack8.3面向香港正式发布，六大亮点激发云上跃迁

本文分享自華爲雲社區《華爲雲Stack8.3面向香港正式發佈，六大亮點激發雲上躍遷》，作者：華爲雲頭條。 2024年4月23日，在華爲雲香港峯會2024上，華爲混合雲副總裁胡玉海面向香港市場發佈華爲雲Stack8.3，提供110+本地

2024-04-26 10:33:21

对接HiveMetaStore，拥抱开源大数据

本文分享自華爲雲社區《對接HiveMetaStore，擁抱開源大數據》，作者：睡覺是大事。 1. 前言適用版本：9.1.0及以上在大數據融合分析時代，面對海量的數據以及各種複雜的查詢，性能是我們使用一款數據處理引擎最重要的考量

2024-04-24 22:33:08

重磅新品发布！云耀数据库HRDS，享受轻量级的极致体验

本文分享自華爲雲社區《重磅新品發佈！雲耀數據庫HRDS，享受輕量級的極致體驗！》，作者：GaussDB 數據庫。所謂，凡有井水處，即能歌柳詞。大數據時代，凡有數據處，必有數據庫。隨着業務需求的不斷擴大和數據量的激增，數

2024-04-23 22:32:33

沙特2030年愿景和对中国IT企业的市场机会分析

沙特2030年願景和對中國IT企業的市場機會分析前言：最近“開源老DJ，帶你去沙特”欄目第一期已經播出，收到了不錯的反響。見COPU官網的回顧。（https://mp.weixin.qq.com/s/3B0jNVhybxTF1xPiy

2024-04-23 22:24:54

大模型将进一步推动AI数据发展，行业数据类型更加丰富

爲支撐加快推進新型工業化，發展新質生產力，探索數據要素與智能算力網絡協同發展路徑，促進數字技術與實體經濟深度融合，中國信息通信研究院作爲新型基礎設施建設者，科技創新的領軍者，在2024星火生態大會期間，舉辦了"數據要素及智能算力網絡創新專題

2024-04-29 00:55:15

1 名工程师轻松管理 20 个工作流，创业企业用 Serverless 让数据处理流程提效

作者：嶽洋、陳德全、劉靜娜北京語勢科技有限公司成立於 2023 年 6 月，語勢科技定位爲“智能投資時代的主題入口”，在資管行業從以機構爲核心轉向以用戶爲核心的變革時代，通過打造主題投資引擎，賦能普惠投資一體化，打造以投資者和資管機構爲主

2024-04-28 21:12:22

赋能开发者，腾讯云与你共探AI提升十倍生产力之路

引言 AI 技術發展迅速，對於開發者而言，AI 既可能是提高生產力的神兵利器，也可能成爲職業生涯潛在的“威脅”。開發者如何與 AI 協同進化，提升個人能力和價值；如何利用提高 AI 生產力，推動企業創新，實現降本提效

2024-04-28 11:11:17

京东广告研发——效率为王：广告统一检索平台实践

1、系統概述實踐證明，將互聯網流量變現的在線廣告是互聯網最成功的商業模式，而電商場景是在線廣告的核心場景。京東服務中國數億的用戶和大量的商家，商品池海量。平臺在兼顧用戶體驗、平臺、廣告主收益的前提推送商品具有挑戰性。京東廣告檢索平臺

2024-04-25 23:17:47

RocketMQ 之 IoT 消息解析：物联网需要什么样的消息技术?

前言：從初代開源消息隊列崛起，到 PC 互聯網、移動互聯網爆發式發展，再到如今 IoT、雲計算、雲原生引領了新的技術趨勢，消息中間件的發展已經走過了 30 多個年頭。目前，消息中間件在國內許多行業的關鍵應用中扮演着至關重要的角色。隨着數

2024-04-24 23:40:04

“企业创新新引擎”数据库专项赋能会，让云原生技术普惠千行百业！

本文分享自華爲雲社區《“企業創新新引擎”數據庫專項賦能會，讓雲原生技術普惠千行百業！》，作者： GaussDB 數據庫。 4月19日，由福州軟件園科技創新發展公司和華爲技術有限公司聯合主辦的HCDG城市行福州站——“企業創新新引擎”數據庫專

2024-04-24 10:32:53

如何增强Java API 的导入和导出性能

前言 GrapeCity Documents for Excel (以下簡稱GcExcel) 是葡萄城公司的一款服務端表格組件，它提供了一組全面的 API 以編程方式生成 Excel (XLSX) 電子表格文檔的功能，支持爲多個平臺創建、操

2024-04-23 10:23:02

24小時熱門文章

最新文章

從Lambda到無Lambda，領英吸取到的教訓

最新評論文章