01-08 面试素材 Hive 字节 Hive面试核心知识点笔记 📚 本文从字节面试官视角梳理数据开发岗Hive高频考点:Hive定位与Metastore、内部/外部表,分区分桶与视图原理及场景,Join/开窗等SQL实操,性能优化与参数调优,并总结数据倾斜、小文件等常见问题解决思路。 19 0 0
11-19 数开知识点 Hive 📘 企业级 Hive 调优指南(Hive on MR) 本文介绍 Hive on MR 的性能调优思路:集群层面优化 YARN 的内存、CPU及容器分配上下限;作业层面按 SQL 调整 Map/Reduce 资源;并结合 Explain 执行计划分析 Stage 与算子树,定位扫描、Join、聚合等瓶颈。 9 0 0
11-19 数开知识点 Hive 📘 Hive 文件格式与压缩机制详解 文章介绍 Hive 常见存储格式 TextFile、ORC、Parquet 等对性能与压缩的影响,重点对比行式/列式存储,说明 ORC 更适合 Hive、Parquet 兼容多引擎,并给出文件级与 MR 过程压缩配置建议。 6 0 0
11-10 数开知识点 Hive 🐝 Hive 知识体系与高频面试要点 本文梳理 Hive 核心知识:架构与执行引擎、与传统数据库差异;内部/外部表及四种 By;常用函数与 UDF/UDTF、窗口函数;MapJoin、分区列存、小文件与数据倾斜优化;字段分隔符、Tez 优点、元数据备份及 UNION 区别。 38 0 0