03-11 面试素材 大数据组件 🚀 大数据开发 核心八股 文章梳理大数据核心知识体系:涵盖 HDFS 架构与读写、HA及小文件治理;MapReduce 原理与 Shuffle;Yarn 调度与架构;Spark 组件、RDD/DAG、Stage/Shuffle、调优排错与数据倾斜、Join 策略;Doris 架构与存储;数仓分层建模;Hive 架构与优化。 11 0 0
01-15 面试素材 实习面经 🎯 海亮集团 数开实习面经 文章复盘了数仓/数据开发面试:涵盖数仓分层与维度建模、SQL优化与平台原理、指标管理与数据治理、Spark/Hive与BI、SQL实操及实习问答,并梳理自身薄弱点与待补齐知识。 25 0 0
01-14 面试素材 实习面经 📝 字节数开面试 八股复盘 汇总大数据面试高频:数据倾斜定位与打散/广播方案,Spark OOM排查调参;涵盖排序算法、MySQL连接、PySpark实战及ClickHouse/ES对比。 21 0 0
01-11 面试素材 实习面经 📝 字节跳动 大数据开发实习生 面试经历整理 文章总结两场数据方向面试:商业产品与技术、泛TikTok数据平台搜索。涵盖自我介绍、项目深挖、数仓分层、数据倾斜、Spark Shuffle/Hive/ClickHouse等知识点,并包含有序数组统计、连续登录、7日移动平均等手撕与实操题。 32 0 0
01-08 面试素材 Hive 字节 Hive面试核心知识点笔记 📚 本文从字节面试官视角梳理数据开发岗Hive高频考点:Hive定位与Metastore、内部/外部表,分区分桶与视图原理及场景,Join/开窗等SQL实操,性能优化与参数调优,并总结数据倾斜、小文件等常见问题解决思路。 19 0 0
12-24 面试素材 实习面经 📌 字节跳动大数据开发面经 3️⃣ 文章汇总大数据/数仓面试高频点:项目按业务域、目标或数据来源划分;Hadoop 体系(HDFS/YARN/MapReduce)与适用场景;MapReduce 全流程及 Shuffle 作用;维度建模方法、事实表与维度表区别,星型/雪花模型取舍;去重方案与 count distinct、group by 差异。 18 0 0
12-24 面试素材 实习面经 🚀 字节跳动大数据开发面经 2️⃣ 文章汇总大数据/数仓面试高频点:数据倾斜成因与治理、CTE执行与物化、Spark Stage划分及宽依赖算子、Hive内外表差异、HDFS小文件问题与优化,并附SQL手撕题(时间段借书、连续登录)及二分统计有序数组元素次数。 13 0 0
12-24 面试素材 实习面经 🎯 字节跳动大数据开发面经 1️⃣ 文章围绕大数据/数仓面试高频点,梳理项目深挖回答框架:职责流程、指标口径对齐、数仓分层、数据质量与性能优化、业务落地与效果验证;并总结SQL开窗函数、复杂聚合(Grouping Sets等)及Python/Java基础与UDF要点。 20 0 0
12-21 面试素材 SQL 🎯 SQL 热门面试题:连续天数 & 留存率分析 整理3道高频SQL题:连续回答/登录天数统计与11月新用户次日留存。讲解日期偏移法、窗口函数、去重与跨天活跃处理,附MySQL代码与方言适配要点。 34 0 0
12-16 面试素材 实习面经 📋 亚信科技数据开发面经 文章汇总两份数据开发面经要点:涵盖SQL能力展示、表关联/JOIN分类、CASE WHEN与开窗排序函数;并延伸到项目STAR讲述、数据去重、数仓分层与分层价值、SCD处理、ETL流程、星型/雪花模型及Hadoop生态组件。 10 0 0
12-11 面试素材 面试问答 ✨ 全方面面试题解答 文章系统梳理数据侧岗位面试高频题:个人介绍、项目闭环表达与量化成果;数仓分层建模、指标体系与治理方法;Hadoop/Spark/Hive、数据倾斜与一致性等八股;SQL考点、架构选型、开放题及面试加分避坑技巧。 16 0 0
12-11 面试素材 面试问答 📅 数仓面试全攻略 文章系统拆解数仓岗位四轮面试要点:一面看基础与真实性,二面重项目深度与解题能力,三面聚焦业务价值与软实力,HR面考察适配与稳定;并给出简历量化、自我介绍、知识模块(数仓/SQL/组件/场景题)及复盘心态方法。 10 0 0