12-02 面试素材 数据倾斜 🚨 数据倾斜调优 面试题 数据倾斜是 Hive/Spark shuffle 的性能杀手,会导致任务卡顿、超时或 OOM。文章从参数配置、Map/Reduce 阶段实操入手,给出 Map Join、AQE、自适应分区、随机打散、拆分大 Key、替代 distinct 及小文件治理等优化方案。 18 0 0