hive 、spark 、flink之想一想

原創

原创

2024-03-27 01:22

hive

1：hive是怎么产生的？

2：hive的框架是怎么样的？

3：hive 执行流程是什么？

4：hive sql是如何把sql语句一步一步到最后执行的？

5：hive sql任务常用参数调优做过什么？

spark

6：spark 是怎么产生的？

7：spark 框架是怎么样的？

8: spark的DAG是什么？

9：spark中的app，job,stage,task是什么？有什么好处？

10：spark的RDD是什么？与dataframe有什么区别？

11：spark 执行流程是什么？

12：spark sql是如何把sql语句一步一步到最后执行的？

13：spark 与mapreduce的区别是什么？

14： spark的反压原理是什么？主动还是被动？

flink

14：flink是怎么产生的？

15：flink的框架是怎么样的？

16：flink 的内存模型说一说？

17：flink的cp ,sp说一说原理，有什么区别？你们是怎么设置cp的相关参数？

18：flink的四个图是什么？分别都是什么环节对应什么图？

19：flink反压机制，你是如何理解的？你是如何定位、并有什么方案解决？与spark的反压有什么区别？

20：flink的barrier对齐和非对齐是怎么理解的？

21：flink的精准一次和至少一次是怎么理解的？

22：flink任务消费或者写入kafka时，并行度不一致有什么问题？

23：flink如何保证数据一致性？

24：flink对于kafka新增分区时，消费有什么问题吗？

25：flink消费kafka的offset是怎么维护的？自动提交？

26：flink任务如何设置TM，JM的并行度？

27：flink任务做过什么调优？

28：flink任务大状态时做过什么优化？

29：你们用flink做过实时数仓吗？你们的上下游的环境都是什么？全链路时效是多少？

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

hive 、spark 、flink之想一想

hive

spark

flink

EXCEL中下拉菜单中添加新选项或者删除选项

Python 爬虫：Spring Boot 反爬虫的成功案例

京东科技数字化营销能力的演进与最佳实践| 京东云技术团队

Java中止线程的方式

[转帖]Oracle Exadata 学习笔记之核心特性Part1

《最新出炉》系列入门篇-Python+Playwright自动化测试-43-分页测试

HTTP协议相关文档

git 將其中一個文件恢復到之前的版本

「Java開發指南」如何用MyEclipse搭建GWT 2.1和Spring？（一）

界面組件DevExpress Reporting中文教程 - 如何按條件顯示頁面水印？

程序員不存在了……嗎？

眼看他搭中臺，眼看他又拆了

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結