作业帮PB级低成本日志检索服务

原創

2021-11-05 16:13

{"type":"doc","content":[{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"日志是服务观察的主要方式，我们依赖日志去感知服务的运行状态、历史状况；当发生错误时，我们又依赖日志去了解现场，定位问题。日志对研发工程师来说异常关键，同时随着微服务的流行，服务部署越来越分散化，所以我们需要一套日志服务来采集、传输、检索日志。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"基于这个情况，诞生了以ELK为代表的开源的日志服务。"}]},{"type":"heading","attrs":{"align":null,"level":3},"content":[{"type":"text","text":"需求场景"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在我们的场景下，高峰日志写入压力大（每秒千万级日志条数）；实时要求高：日志处理从采集到可以被检索的时间正常1s以内（高峰时期3s）；成本压力巨大，要求保存半年的日志且可以回溯查询（百PB规模）。"}]},{"type":"heading","attrs":{"align":null,"level":3},"content":[{"type":"text","text":"ElasticSearch的不足"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"ELK"},{"type":"text","text":"方案里最为核心的就是"},{"type":"text","marks":[{"type":"strong"}],"text":"ElasticSearch"},{"type":"text","text":"，它负责存储和索引日志，对外提供查询能力。"},{"type":"text","marks":[{"type":"strong"}],"text":"Elasticsearch"},{"type":"text","text":" 是一个搜索引擎，底层依赖了"},{"type":"text","marks":[{"type":"strong"}],"text":"Lucene的倒排索引技术"},{"type":"text","text":"来实现检索，并且通过"},{"type":"text","marks":[{"type":"strong"}],"text":"shard"},{"type":"text","text":"的设计拆分数据分片，从而突破单机在存储空间和处理性能上的限制。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"• 写入性能"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":" "}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"ElasticSearch写入数据需要对日志索引字段的倒排索引做更新，从而能够检索到最新的日志。为了提升写入性能，可以做聚合提交、延迟索引、减少refersh等等，但是始终要建立索引，在日志流量巨大的情况下（每秒20GB数据、千万级日志条数），瓶颈明显。离理想差距过大，我们期望写入近乎准实时。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"• 运行成本"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":" "}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"ElasticSearch需要定期维护索引、数据分片以及检索缓存，这会占用大量的 CPU 和内存，日志数据是存储在机器磁盘上，在需要存储大量日志且保存很长时间时，机器磁盘使用量巨大，同时索引后会带来数据膨胀，进一步带来成本提升。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"•对非格式化的日志支持不好"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":" "}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"ELK需要解析日志以便为日志项建立索引，非格式化的日志需要增加额外的处理逻辑来适配。存在很多业务日志并不规范，且有收敛难度。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"总结：日志检索场景是一个"},{"type":"text","marks":[{"type":"strong"}],"text":"写多读少"},{"type":"text","text":"的场景，在这样的场景下去维护一个庞大且复杂的索引，在我们看来其实是一个性价比很低的事情。如果采用ElasticSearch方案，经测算我们需要几万核规模集群，仍然保证不了写入数据和检索效率，且资源浪费严重。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"日志检索设计"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"面对这种情况，我们不妨从一个不同的角度去看待日志检索的场景，用一个更适合的设计来解决日志检索的需求，新的设计具体有以下三个点："}]},{"type":"heading","attrs":{"align":null,"level":3},"content":[{"type":"text","text":"1. 日志分块"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"同样的我们需要对日志进行采集，但在处理日志时我们不对日志原文进行解析和索引，而是通过日志时间、日志所属实例、日志类型、日志级别等日志元数据对日志进行分块。这样检索系统可以"},{"type":"text","marks":[{"type":"strong"}],"text":"不对日志格式做任何要求"},{"type":"text","text":"，并且因为没有解析和建立索引（这块开销很大）的步骤，写入速度也能够达到极致（只取决于磁盘的 IO 速度）。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"image","attrs":{"src":"https:\/\/static001.infoq.cn\/resource\/image\/03\/21\/03df897547bb9a63ab8f10980a53f821.png","alt":null,"title":"","style":[{"key":"width","value":"75%"},{"key":"bordertype","value":"none"}],"href":"","fromPaste":false,"pastePass":false}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"简单来说，我们可以将一个实例产生的同一类日志按时间顺序写入到一个文件中，并按时间维度对文件拆分. 不同的日志块会分散在多台机器上(我们一般会按照实例和类型等维度对日志块的存储机器进行分片)，这样我们就可以在多台机器上对这些日志块并发地进行处理，这种方式是支持横向扩展的. 如果一台机器的处理性能不够，横向再扩展就行。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"那如何对入日志块内的数据进行检索呢？这个很简单，因为保存的是日志原文，可以直接使用 grep 相关的命令直接对日志块进行检索处理。对开发人员来说， grep是最为熟悉的命令，并且使用上也很灵活，可以满足开发对日志检索的各种需求。因为我们是直接对日志块做追加写入，不需要等待索引建立生效，在日志刷入到日志块上时就可以被立刻检索到，保证了检索结果的"},{"type":"text","marks":[{"type":"strong"}],"text":"实时性"},{"type":"text","text":"。"}]},{"type":"heading","attrs":{"align":null,"level":3},"content":[{"type":"text","text":"2. 元数据索引"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"接下来我们看看要如何对这么一大批的日志块进行检索。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"首先我们当日志块建立时，我们会基于日志块的元数据信息搭建索引，像服务名称、日志时间，日志所属实例，日志类型等信息，并将日志块的存储位置做为value一起存储。通过索引日志块的元数据，当我们需要对某个服务在某段时间内的某类日志发起检索时，就可以快速地找到需要检索的日志块位置，并发处理。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"image","attrs":{"src":"https:\/\/static001.infoq.cn\/resource\/image\/16\/06\/16fd67096b1b93e91ed5b4eb7914c706.png","alt":null,"title":"","style":[{"key":"width","value":"75%"},{"key":"bordertype","value":"none"}],"href":"","fromPaste":false,"pastePass":false}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"索引的结构可以按需构建，你可以将你关心的元数据信息放入到索引中，从而方便快速圈定需要的日志块。因为我们只对日志块的元数据做了索引，相比于对全部日志建立索引，这个成本可以说降到了极低，锁定日志块的速度也足够理想。"}]},{"type":"heading","attrs":{"align":null,"level":3},"content":[{"type":"text","text":"3. 日志生命周期与数据沉降"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"日志数据以时间维度的方向可以理解为一种时序数据，离当前时间越近的日志会越有价值，被查询的可能性也会越高，呈现一种冷热分离的情况。而且冷数据也并非是毫无价值，开发人员要求回溯几个月前的日志数据也是存在的场景，即我们的日志需要在其生命周期里都能够对外提供查询能力。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"对于这种情况，如果将生命周期内的所有日志块都保存在本地磁盘上，无疑是对我们的机器容量提了很大的需求。对于这种日志存储上的需求，我们可以采用压缩和沉降的手段来解决。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"image","attrs":{"src":"https:\/\/static001.infoq.cn\/resource\/image\/75\/16\/75f67436650eedd2191c05ae2311d216.png","alt":null,"title":"","style":[{"key":"width","value":"75%"},{"key":"bordertype","value":"none"}],"href":"","fromPaste":false,"pastePass":false}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"简单来说，我们将日志块存储分为本地存储(磁盘)、远程存储(对象存储)、归档存储三个级别; 本地存储负责提供实时和短期的日志查询(一天或几个小时)，远程存储负责一定时期内的日志查询需求(一周或者几周)，归档存储负责日志整个生命周期里的查询需求。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"现在我们看看日志块在其生命周期里是如何在多级存储间流转的，首先日志块会在本地磁盘创建并写入对应的日志数据，完成后会在本地磁盘保留一定时间(保留的时间取决于磁盘存储压力)，在保存一定时间后，它首先会被"},{"type":"text","marks":[{"type":"strong"}],"text":"压缩"},{"type":"text","text":"然后被上传至远程存储(一般是对象存储中的标准存储类型)，再经过一段时间后日志块会被迁移到归档存储中保存(一般是对象存储中的归档存储类型)。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"这样的存储设计有什么好处呢? 如下面的多级存储示意图所示，越往下存储的数据量越大，存储介质的成本也越低，每层大概为上一层的 1\/3 左右，并且数据是在压缩后存储的，日志的数据压缩率一般可以达到"},{"type":"text","marks":[{"type":"strong"}],"text":"10:1"},{"type":"text","text":"，由此看归档存储日志的成本能在本地存储的"},{"type":"text","marks":[{"type":"strong"}],"text":"1%"},{"type":"text","text":"的左右，如果使用了 SSD 硬盘作为本地存储，这个差距还会更大。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"价格参考："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"embedcomp","attrs":{"type":"table","data":{"content":"\n\n\n\n\n\n

\n

存储介质

\n\n \n

\n

参考链接

\n\n \n\n\n

\n

本地盘

\n\n \n

\n

https:\/\/buy.cloud.tencent.com\/price\/cvm?regionId=8&zoneId=800002

\n

对象存储

\n\n \n

\n

https:\/\/buy.cloud.tencent.com\/price\/cos

\n

归档存储

\n\n \n

\n

https:\/\/buy.cloud.tencent.com\/price\/cos

\n\n \n\n"}}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"image","attrs":{"src":"https:\/\/static001.infoq.cn\/resource\/image\/a5\/fa\/a5605a4fba90fc5a1712d77d65a5c9fa.png","alt":null,"title":"","style":[{"key":"width","value":"75%"},{"key":"bordertype","value":"none"}],"href":"","fromPaste":false,"pastePass":false}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"那在多级存储间又是如何检索的呢? 这个很简单，对于本地存储上的检索，直接在本地磁盘上进行即可。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"如果检索涉及到远程存储上的日志块，检索服务会将涉及到的日志块下载到本地存储，然后在本地完成解压和检索。因为日志分块的设计，日志块的下载同检索一样，我们可以在多台机器上并行操作; 下载回本地的数据复制支持在本地缓存后一定的时间后再删除，这样有效期内对同一日志块的检索需求就可以在本地完成而不需要再重复拉取一遍(日志检索场景里多次检索同样的日志数据还是很常见)。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"对于归档存储，在发起检索请求前，需要对归档存储中的日志块发起取回操作，取回操作一般耗时在几分钟左右，完成取回操作后日志块被取回到远程存储上，再之后的数据流转就跟之前一致了。即开发人员如果想要检索冷数据，需要提前对日志块做归档取回的申请，等待取回完成后就可以按照热数据速度来进行日志检索了。"}]},{"type":"heading","attrs":{"align":null,"level":2},"content":[{"type":"text","text":"检索服务架构"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在了解上面的设计思路后，我们看看基于这套设计的日志检索服务是怎么落地的。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"日志检索服务分为以下几个模块:"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"• "},{"type":"text","marks":[{"type":"strong"}],"text":"GD-Search"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"查询调度器，负责接受查询请求，对查询命令做解析和优化，并从"},{"type":"text","marks":[{"type":"strong"}],"text":"Chunk Index"},{"type":"text","text":"中获取查询范围内日志块的地址，最终生成分布式的查询计划"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":" "}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"GD-Search"},{"type":"text","text":"本身是无状态的，可以部署多个实例，通过负载均衡对外提供统一的接入地址。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"• "},{"type":"text","marks":[{"type":"strong"}],"text":"Local-Search"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"本地存储查询器，负责处理"},{"type":"text","marks":[{"type":"strong"}],"text":"GD-Search"},{"type":"text","text":"分配过来的本地日志块的查询请求。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"• "},{"type":"text","marks":[{"type":"strong"}],"text":"Remote-Search"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"远程存储查询器，负责处理"},{"type":"text","marks":[{"type":"strong"}],"text":"GD-Search"},{"type":"text","text":"分配过来的远程日志块的查询请求。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":" "}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"Remote-Search"},{"type":"text","text":"会将需要的日志块从远程存储拉取到本地并解压，之后同"},{"type":"text","marks":[{"type":"strong"}],"text":"Local-Search"},{"type":"text","text":"一样在本地存储上进行查询。同时"},{"type":"text","marks":[{"type":"strong"}],"text":"Remote-Search"},{"type":"text","text":"会将日志块的本地存储地址更新到"},{"type":"text","marks":[{"type":"strong"}],"text":"Chunk Index"},{"type":"text","text":"中，以便将后续同样日志块的查询请求路由到本地存储上。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"• "},{"type":"text","marks":[{"type":"strong"}],"text":"Log-Manager"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":" "}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"本地存储管理器，负责维护本地存储上日志块的生命周期。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":" "}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"Log-Manager"},{"type":"text","text":"会定期扫描本地存储上的日志块，如果日志块超过本地保存期限或者磁盘使用率到达瓶颈，则会按照策略将部分日志块淘汰（压缩后上传到远程存储，压缩算法采用了"},{"type":"text","marks":[{"type":"strong"}],"text":"ZSTD"},{"type":"text","text":"），并更新日志块在"},{"type":"text","marks":[{"type":"strong"}],"text":"Chunk Index"},{"type":"text","text":"中的存储信息。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"• "},{"type":"text","marks":[{"type":"strong"}],"text":"Log-Ingester"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":" "}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"日志摄取器模块，负责从日志 kafka 订阅日志数据，然后将日志数据按时间维度和元数据维度拆分，写入到对应的日志块中。在生成新的日志块同时， "},{"type":"text","marks":[{"type":"strong"}],"text":"Log-Ingester"},{"type":"text","text":"会将日志块的元数据写入"},{"type":"text","marks":[{"type":"strong"}],"text":"Chunk Index"},{"type":"text","text":"中，从而保证最新的日志块能够被实时检索到。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"• "},{"type":"text","marks":[{"type":"strong"}],"text":"Chunk Index"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":" "}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"日志块元数据存储，负责保存日志块的元数据和存储信息。当前我们选择了"},{"type":"text","marks":[{"type":"strong"}],"text":"Redis"},{"type":"text","text":"作为存储介质，在元数据索引并不复杂的情况下， redis 已经能够满足我们索引日志块的需求，并且基于内存的查询速度也能够满足我们快速锁定日志块的需求。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"image","attrs":{"src":"https:\/\/static001.infoq.cn\/resource\/image\/e6\/cf\/e654a6bb062cbf193a470c655d9111cf.png","alt":null,"title":"","style":[{"key":"width","value":"75%"},{"key":"bordertype","value":"none"}],"href":"","fromPaste":false,"pastePass":false}},{"type":"heading","attrs":{"align":null,"level":3},"content":[{"type":"text","text":"检索策略"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在检索策略设计上，我们认为检索的返回速度是追求更快，同时避免巨大的查询请求进入系统。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"我们认为日志检索一般有以下三种场景:"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"1. 查看最新的服务日志"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"2. 查看某个请求的日志，依据logid来查询"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"3. 查看某类日志，像访问mysql的错误日志，请求下游服务的日志等等"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在大部分场景下，用户是不需要所有匹配到的日志，拿一部分日志足以处理问题。所以在查询时使用者可以设置 limit 数量，整个检索服务在查询结果满足 limit设置的日志数量时，终止当前的查询请求并将结果返回给前端。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"另外 "},{"type":"text","marks":[{"type":"strong"}],"text":"GD-Search"},{"type":"text","text":"组件在发起日志块检索时，也会提前判断检索的日志块大小总和，对于超限的大范围检索请求会做拒绝。（用户可以调整检索的时间范围多试几次或者调整检索语句使其更有选择性）"}]},{"type":"heading","attrs":{"align":null,"level":4},"content":[{"type":"text","text":"性能一览"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"使用 1KB每条的日志进行测试，总的日志块数量在10000左右，本地存储使用NVME SSD硬盘，远程存储使用S3协议标准存储。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"• 写入"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"单核可支持 2W条\/S的写入速度， 1W 条\/S的写入速度约占用 1~2G 左右的内存，可分布式扩展，无上限。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"• 查询(全文检索)"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":" "}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"基于本地存储的1TB日志数据查询速度可在3S以内完成"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"基于远程存储的1TB日志数据查询耗时在10S间。"}]},{"type":"heading","attrs":{"align":null,"level":3},"content":[{"type":"text","text":"成本优势"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"在每秒千万级写入，百PB存储上，我们使用十几台物理服务器就可以保证日志写入和查询。热点数据在本地nvme磁盘上，次热数据在对象存里，大量日志数据存储在归档存储服务上。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"1. 计算对比"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"因为不需要建立索引，我们只需要千核级别就可以保证写入，同时日志索引是个写多读少的服务，千核可以保证百级别QPS查询。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"ES在这个量级上需要投入几万核规模。来应对写入性能和查询瓶颈，但是仍不能保证写入和查询效率。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"2. 存储对比"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"核心是在保证业务需求下，使用更便宜的存储介质（归档存储vs本地磁盘）和更少的存储数据（压缩率1\/10vs日志数据索引膨胀）。能有两个量级的差距。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"作者介绍："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","text":"吕亚霖，作业帮基础架构 - 架构研发团队负责人。负责技术中台和基础架构工作。在作业帮期间主导了云原生架构演进、推动实施容器化改造、服务治理、GO 微服务框架、DevOps 的落地实践。"}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"text","marks":[{"type":"strong"}],"text":"专题推荐："}]},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null}},{"type":"paragraph","attrs":{"indent":0,"number":0,"align":null,"origin":null},"content":[{"type":"link","attrs":{"href":"https:\/\/www.infoq.cn\/theme\/97","title":"xxx","type":null},"content":[{"type":"text","text":"《作业帮AI+大数据技术实践》"}]}]}]}

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

企业IT架构治理之道| 京东云技术团队

一、什麼是架構和治理 1.1 架構的起源開篇還是要說說大家理解的架構，何爲架構，架構跟我們的工作和生活有什麼關係。英文Architecture本源來自於拉丁語，最早起源於建築領域，建築是文明社會一個重要的標誌，同時也是人類社會最早形

2024-05-07 23:17:13

数仓安全：数据脱敏技术深度解析

本文分享自華爲雲社區《GaussDB(DWS)安全管理之數據脫敏原理與使用方法介紹》，作者： VV一笑。 1. 前言適用版本：8.2.0及以上版本 GaussDB (DWS)產品數據脫敏功能，是數據庫產品內化和夯實數據安全能力的重要

2024-05-10 23:30:54

爱奇艺数据湖实战 - 实时湖仓一体化

01 概述數據是洞察用戶、市場、運營決策的基礎資料，在愛奇藝被廣泛應用在推薦、廣告、用戶增長、營銷等場景中。愛奇藝大數據業務之前採用 Lambda 架構，滿足海量

愛奇藝技術產品團隊

2024-05-09 01:18:23

京东科技数字化营销能力的演进与最佳实践| 京东云技术团队

1.導讀在當今數字化時代，全球互聯網用戶已超過50億人，中國的互聯網用戶數量更是達到10.5億，這爲企業提供了巨大的市場機遇和挑戰。根據市場研究公司的最新報告，全球數字營銷費用支出預計將在未來五年內進一步大幅增加，這表明數字化營銷已成爲

2024-05-07 23:17:11

如何设计与构建 FinOps 流程、团队、体系与目标

作者：景祁前言近幾年隨着雲計算的迅猛發展，企業 IT 數字化轉型也已經進入“深水區”，對於用好雲的關注度逐漸提升。《Flexera 2023 年雲計算現狀報告》顯示，雲成本管理優化躍居雲管理團隊下年度待辦清單的榜首。FinOps（財務運

2024-05-11 21:15:06

神策数据：详解保险 OMO 一体化的关键步骤

近年來，保險行業數字化發展相關政策陸續發佈，推動着保險行業基於業務與科技發展的實際需求，加速數字化轉型，將數字保險高質量發展持續提升至新的高度。本文將圍繞保險數字化，詳細解讀險企實現 OMO 一體化的關鍵步驟。一、洞察：雙利見底，

2024-05-11 22:04:29

以全要素数据资产连接为核心的数据治理与运营

“數據中臺新範式”雲端峯會，深入解析湖倉一體、批流一體、治理與運營“三位一體”的數據中臺新範式特徵，普元信息大數據首席顧問李書超在峯會發表演講《以全要素數據資產連接爲核心的數據治理與運營》。以下爲演講提綱及完整視頻，添加元寶微信，還可

2024-05-09 13:12:55

【开启报名】同学看过来，Apache DolphinScheduler开源之夏课题任务正式发布！

如果你還擁有着一張有效的“學生證”，在這個充滿機遇的夏天，我們誠邀你加入一個充滿挑戰和機遇的開源冒險——開源之夏。這不僅是一個簡單的編程開發活動，假如你成功參加並結項之後，還能獲得中科院軟件所官方頒發的證書和獎金，簡直太有趣啦！ Apa

2024-05-09 11:55:30

01-电商商品中心解密：仅凭SKU真的足够吗？

在電子商務系統中，SKU（Stock Keeping Unit，庫存單位）和SPU（Standard Product Unit，標準產品單位）是兩種不同的概念，它們共同用於商品管理和庫存控制。雖然理論上可以只使用SKU來管理商品，但在實際應

2024-05-07 01:08:03

电子合同一站式解决方案 | 京东云技术团队

一：平臺定位和優勢（爲什麼建） 1.1、平臺定位由京東科技業務中臺主導發起，聯合法律部、安全部共建，旨在爲業務提供電子合同管理的中臺化能力，當前已形成一套成熟的“全線上、全生命週期電子合同管理系統”，可提供包括合同模板創建、模板預覽、

2024-05-06 23:16:37

详解GaussDB(DWS)中的行执行引擎

本文分享自華爲雲社區《GaussDB(DWS)行執行引擎詳解》，作者：yd_227398895。 1.前言 GaussDB（DWS）包含三大引擎，一是SQL執行引擎，用來解析用戶輸入的SQL語句，生成執行計劃，供執行引擎來執行；二是執行引

2024-05-11 11:30:53

攻击者正在利用AI，对保险公司发起大规模欺诈

保險欺詐一直是保險行業面臨的重要挑戰之一，尤其隨着技術的進步，欺詐者也在不斷更新其手段，利用AI技術，包括生成式模型、機器學習和數據分析工具等欺騙保險公司，而AI技術的應用正成爲他們的新工具，使其犯罪行爲更加隱蔽和複雜，挑戰保險行業的防欺詐

2024-05-10 00:55:17

AI 001 号员工通义灵码入职阿里云丨阿里云云原生 4 月产品月报

雲原生月度動態雲原生是企業數字創新的最短路徑。《阿里云云原生每月動態》，從趨勢熱點、產品新功能、服務客戶、開源與開發者動態等方面，爲企業提供數字化的路徑與指南。趨勢熱點 🥇 Cloud Native Day - Indonesia 成

2024-05-07 21:12:05

CCE云原生混部场景下的测试案例

本文分享自華爲雲社區《CCE雲原生混部場景下在線任務搶佔、壓制離線任務CPU資源、保障在線任務服務質量效果測試》，作者：可以交個朋友。背景企業的 IT 環境通常運行兩大類進程，一類是在線服務，一類是離線作業。在線任務：運行時間長，服

2024-05-07 10:33:03

如何通过前端表格控件在10分钟内完成一张分组报表？

前言：當今時代，報表作爲信息化系統的重要組成部分，在日常的使用中發揮着關鍵作用。藉助報表工具使得數據錄入、分析和傳遞的過程被數字化和智能化，大大提高了數據的準確性及利用的高效性。而在此過程中，信息化系統能夠實現對數據的實時監控和更新，爲管

2024-05-06 10:22:56

24小時熱門文章

Spring Cloud 部署时如何使用 Kubernetes 作为注册中心和配置中心

最新文章

最新評論文章