1. merger小文件
set spark.sql.hive.mergeFiles = true;
2. 緩衝小表
set spark.sql.autoBroadcastJoinThreshold = 838861000;
set spark.sql.shuffle.partitions = 1000;
1. merger小文件
set spark.sql.hive.mergeFiles = true;
2. 緩衝小表
set spark.sql.autoBroadcastJoinThreshold = 838861000;
set spark.sql.shuffle.partitions = 1000;
01 概述 數據是洞察用戶、市場、運營決策的基礎資料,在愛奇藝被廣泛應用在推薦、廣告、用戶增長、營銷等場景中。愛奇藝大數據業務之前採用 Lambda 架構,滿足海量