原创 EMR上如何進行流式SQL調試

1.前言從EMR-3.21.0版本開始,EMR正式發佈了Spark Streaming SQL功能,支持使用Spark SQL進行流式數據處理。經過兩個版本的迭代,不少用戶反饋當使用SQL進行流式作業開發時,查詢結果正確性的調試過程比較麻煩

原创 【譯】用SQL統一所有:一種有效的、語法慣用的流和表管理方法

現在還沒有一個統一的流式SQL語法標準,各家都在做自己的。本文在一些業界應用的基礎上提出了一個統一SQL語法的建議。Spark同樣存在這個問題,社區版本在流式SQL上遲遲沒有動作。EMR Spark在今年上半年提供了自己設計版本的流式SQL