台部落牛肉圓粉不加蔥

一、Join 邏輯計劃生成和 Join 相關的邏輯層的優化規則主要包含以下幾種： ReorderJoin EliminateOuterJoin 👍🏻DPP 動態分區裁剪以及 👍🏻PushDownPredicates 中和 Join 相關

2022-11-09 13:48:04

GlobalPartitioner GlobalPartitioner 分區器會將上游所有元素都發送到下游的第一個算子實例上(SubTask Id = 0) ForwardPartitioner 發送到下游對應的第一個task，保證上下游

2021-11-04 07:32:27

由前文我們知道，StreamGraph 表示一個流任務的邏輯拓撲，可以用一個 DAG 來表示（代碼實現上沒有一個 DAG 結構），DAG 的頂點是 StreamNode，邊是 StreamEdge，邊包含了由哪個 StreamNode 依賴

2021-05-30 19:06:52

一、作業生成及提交整體流程上圖爲一個 Flink 作業的提交流程，主要可以分爲以下幾個步驟： Client 將作業 code 生成 StreamGraph（在 Batch 模式下，生成的是一個 OptimizedPlan，這裏暫不展開

2021-05-18 06:00:19

javacc 會根據 parser.jj 中定義的相互穿插的 Token、Java 代碼來自動生成 org.apache.calcite.sql.parser.impl.SqlParserImpl 的代碼。本文期望以一個簡單的 Select

2021-05-18 06:00:19

本文爲 Spark 2.0 源碼分析筆記，其他版本可能稍有不同創建、分發 Task一文中我們提到 TaskRunner（繼承於 Runnable）對象最終會被提交到 Executor 的線程池中去執行，本文就將對該執行過程進行剖析。

2020-09-26 15:19:56

崗位描述：研發高性能實時分佈式數據分析引擎，包括需求調研，系統分析設計，核心模塊實現，調優與維護。主導核心技術問題攻關，解決世界級的數據實時計算處理難題，識別和解決潛在的技術風險。集成多種分佈式計算和存儲引擎，並結合業務場景做深度定

2020-08-14 19:49:55

Delta Lake is an open-source storage layer that brings ACID transactions to Apache Spark and big data workloads. 一、Del

2020-06-14 19:10:35

Spark Sql Aggregate 源碼剖析本文基於 Spark 2.3.0 源碼，其他版本實現可能會略有不同縱觀 Spark Sql 源碼，聚合的實現是其中較爲複雜的部分，本文希望能以例子結合流程圖的方式來說清楚整個過程。這裏

2020-06-14 19:10:35

一、概念 1.1、GlobalLimit case class GlobalLimit(limitExpr: Expression, child: LogicalPlan) 全侷限制，最多返回 limitExpr 對應條 records。

2020-06-14 19:10:35

擴展閱讀： Apache Kylin 概覽 - 簡書可能是全網最深度的 Apache Kylin 查詢剖析 - 簡書一、Overview 1.1、通過 Kylin 查詢其中 olap_model_660776971659583

2019-05-28 18:39:34

閱讀本文前，請先閱讀： Apache Kylin 概覽 - 簡書 Apache Kylin 查詢流程源碼剖析 - 簡書一、概覽如上圖，sql text 到物理執行計劃主要分幾個階段： sql text -> parsed Sq

2019-05-28 18:39:34

Apache Kylin 介紹一、什麼是 Kylin Apche Kylin 是 Hadoop 大數據平臺上的一個開源 OLAP 引擎。它採用多維立方體（Cube）預計算技術，可以將某些場景下的大數據 SQL 查詢速度提升到亞秒級別。相對

2019-05-08 18:23:37

Delta Lake is an open-source storage layer that brings ACID transactions to Apache Spark and big data workloads. 一、Del

2019-05-07 18:36:58

分佈式計算系統研發崗位描述: 基於金融級業務場景，設計和實現高效、實時、智能的分佈式計算引擎；分佈式計算平臺的完善和優化，從穩定性、性能和功能等多方面進行架構設計實現和優化；深入理解業務，幫助業務解決問題的同時，從中提煉出通用和潛在

2019-02-28 13:35:26