12-21 面试素材 SQL 🎯 SQL 热门面试题:连续天数 & 留存率分析 整理3道高频SQL题:连续回答/登录天数统计与11月新用户次日留存。讲解日期偏移法、窗口函数、去重与跨天活跃处理,附MySQL代码与方言适配要点。 34 0 0
12-16 面试素材 实习面经 📋 亚信科技数据开发面经 文章汇总两份数据开发面经要点:涵盖SQL能力展示、表关联/JOIN分类、CASE WHEN与开窗排序函数;并延伸到项目STAR讲述、数据去重、数仓分层与分层价值、SCD处理、ETL流程、星型/雪花模型及Hadoop生态组件。 10 0 0
12-14 数开知识点 面试问答 📝 用户标签画像体系 文章围绕用户标签画像体系展开:解释标签的概念、七大分类与五种属性类型,并说明标签与指标的组合逻辑。进一步介绍标签加工流程、宽表建设与管理方式,以及画像生成与应用场景,强调合规采集与精准运营价值。 18 0 0
12-11 面试素材 面试问答 ✨ 全方面面试题解答 文章系统梳理数据侧岗位面试高频题:个人介绍、项目闭环表达与量化成果;数仓分层建模、指标体系与治理方法;Hadoop/Spark/Hive、数据倾斜与一致性等八股;SQL考点、架构选型、开放题及面试加分避坑技巧。 16 0 0
12-11 面试素材 面试问答 📅 数仓面试全攻略 文章系统拆解数仓岗位四轮面试要点:一面看基础与真实性,二面重项目深度与解题能力,三面聚焦业务价值与软实力,HR面考察适配与稳定;并给出简历量化、自我介绍、知识模块(数仓/SQL/组件/场景题)及复盘心态方法。 10 0 0
12-10 面试素材 实习面经 💼 京东数据开发面经 汇总网络面试题与答法,覆盖一到三面:SQL窗口/连续、Hive架构与优化参数、数据倾斜/Join及Shuffle优化、HDFS读写流程,并含HR自我优缺点等问题。 31 0 0
12-09 面试素材 数据治理 📚 存储资源治理 本文聚焦数仓存储资源治理:以表元数据与血缘为基石,识别临时/无用/空表;通过Parquet+Snappy、分区生命周期、二级分区拆分及全量改增量降本;以量化指标与打分体系评估,并通过持续监控长期维护。 11 0 0
12-09 面试素材 数据治理 📊 报表治理 文章围绕报表治理展开:针对资源成本失控、无效报表泛滥与查询慢、权限乱等痛点,提出先梳理血缘与使用量、再与业务确认价值,分级下线或优化任务与表,并通过OLAP/预计算/Flink提速,配合权限隔离与定期巡检实现长效治理。 10 0 0
12-08 面试素材 数据治理 📚 数据质量治理 文章聚焦数据质量治理实战,围绕基线破线、DQC无效告警与Bug工单三大痛点,给出全链路识别方法与可落地方案,并建立效果评估指标体系,结合阿里、网易案例提升交付准时率与数据可信度。 15 0 0
12-08 面试素材 数据治理 🎯 数据分区与链路场景优化 回顾事实维度与分层体系,聚焦分区优化痛点与原则,给出6种实战拆合分区、视图与拉链表方案,并总结链路设计与DWS取舍,强调上线前预留弹性、减少扫描与小文件,提升下游效率。 9 0 0
12-08 面试素材 数据治理 📊 数据治理之计算资源治理 梳理计算资源治理痛点(延迟、过载、降本、冗余)及小文件、调度错配、DQC浪费等问题;按安全优先推进Spark3升级调优、清理无效规则/任务、优化调度;以成本与交付SLA量化成效,建立周期化治理。 9 0 0