大数据架构由哪些模块组成

  大数据也不是近几年才出现的新东西,只是最近几年才真正意义上变得热门、火爆!而这要得益于互联网信息技术的快速发展,网络改变世界、改变生活,大数据技术的应用让这样的改变更为深刻。今天我们就再来了解一下,大数据架构的组成模块都包含了哪些。

大数据架构由哪些模块组成

 

  大数据架构的组成模块都包含了哪些

 

  1、数据收集模块

 

  主要负责收集各种数据源的数据,包括日志文件、网络请求、数据库、消息队列等,并将这些数据转换为文件或者消息向后传递。

 

  2、数据转存模块

 

  主要负责将数据定时传递到分布式存储或者实时传递给下游的数据处理程序。

 

  3、ETL模块

 

  主要负责数据的清洗、格式和内容的处理和转换、数据分级分拣、加载至数据仓库等。

 

  4、数据仓库模块

 

  这是整个架构的核心,数据仓库是数据有组织的集中存储的地方,负责数据的存取和管理。

 

  5、元数据管理模块

 

  主要负责记录和约束数据仓库中数据的含义和格式,控制着数据的生命周期和数据质量。

 

  6、分析引擎模块

 

  数据分析师交互多的模块,主要负责执行各种分析语句或代码,完成各种分析任务。

 

  7、作业管理与调度模块

 

  负责分析作业的管理和定时调度,包括作业的增删改查、查看修改历史、设置调度定时和执行引擎等。

 

  8、资源分配与调度模块

 

  主要负责在多作业同时运行的场景下,有效协调和分配集群的资源,使资源利用率大化。

 

  大数据量的分析使得数据更有了价值,运营有了通过大数据的分析可以做出精确的营销计划,通过收集用户的操作日志,分析用户行为,给出用户精确和有价值的推荐。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章