strom:http://storm.apache.org/index.html
实时计算系统,持续计算,速度快,每秒百万tuble,
tuble:元组 数据结构,使用 逗号分隔,
stream:一系列的tuble
spout:水龙头 数据源
bolt:螺栓,逻辑处理单元,spout数据传给bolt,bolt处理后为新的tuble ,可以filter,MapReduce,group
topology:无环有向图。只能kill-9
tasks:spout和bolt的执行过程就是task,
works:工作节点,storm和worker之间均衡分配任务,监听job ,start stop进程
stream group :控制tuble如何流动。
storm 架构:
nimbus 核心组件, master node,主要运行toplogy 在work node分发数据,监控故障,指派task给worker node
supervisor :有多个处理进程,代理task给所有的work进程,work进程孵化出足够的线程 task 接受nimbus 分发的指令,监督worker进程,完成task
storm 搭建:
sh storm nimbus &
sh storm supervisor &
sh storm ui &
netstat -ano |grep