12-04 面试素材 数据建模 🏗️ 维度建模理论 文章系统梳理 Kimball 维度建模:维度+事实、总线架构与一致性维度/事实;对比范式建模及三范式;讲解星型/雪花/星座模型;结合 ODS→ADS 分层与四步流程,并介绍事实表类型与 SCD 处理方案。 22 0 0
12-02 面试素材 面试问答 📊 数据质量 & 数仓业务价值 场景题 文章梳理数据质量长期跟踪体系:从问题盘点、规则管理、DWD明细与ADS汇总建模,到看板展示与监控闭环;并总结数仓对业务的四大价值:增长分析、质量稳定、查数提效与成本优化。 13 0 0
12-02 面试素材 数据倾斜 🚨 数据倾斜调优 面试题 数据倾斜是 Hive/Spark shuffle 的性能杀手,会导致任务卡顿、超时或 OOM。文章从参数配置、Map/Reduce 阶段实操入手,给出 Map Join、AQE、自适应分区、随机打散、拆分大 Key、替代 distinct 及小文件治理等优化方案。 19 0 0
12-02 面试素材 数据建模 📚 数仓建模 面试场景题 梳理数仓分层核心:以空间换时间,ODS接入、DWD清洗明细、DWM维度退化轻汇总、DWS统一口径聚合、ADS画像应用,并总结建模五要素、开发流程与分层评价维度。 16 0 0