Loading......

rawley

rawley

rawley

149 篇文章

加入于 2025-09-25

文章列表 (149)

简历提问 - ChatGPT版

简历提问 - ChatGPT版

文章从技术 Mentor、业务 Leader 与 HR 三视角梳理数据开发核心：用户标签体系全链路建设、生命周期与偏好标签设计、Spark 性能优化、数仓分层与数据治理；并总结大盘指标沉淀、协作排期、沟通与成长方法。

面试素材

#面试问答

2025-12-10

49

0

📚 存储资源治理

📚 存储资源治理

本文聚焦数仓存储资源治理：以表元数据与血缘为基石，识别临时/无用/空表；通过Parquet+Snappy、分区生命周期、二级分区拆分及全量改增量降本；以量化指标与打分体系评估，并通过持续监控长期维护。

面试素材

#数据治理

2025-12-09

54

0

📊 报表治理

📊 报表治理

文章围绕报表治理展开：针对资源成本失控、无效报表泛滥与查询慢、权限乱等痛点，提出先梳理血缘与使用量、再与业务确认价值，分级下线或优化任务与表，并通过OLAP/预计算/Flink提速，配合权限隔离与定期巡检实现长效治理。

面试素材

#数据治理

2025-12-09

53

0

📚 数据质量治理

📚 数据质量治理

文章聚焦数据质量治理实战，围绕基线破线、DQC无效告警与Bug工单三大痛点，给出全链路识别方法与可落地方案，并建立效果评估指标体系，结合阿里、网易案例提升交付准时率与数据可信度。

面试素材

#数据治理

2025-12-08

56

0

🎯 数据分区与链路场景优化

🎯 数据分区与链路场景优化

回顾事实维度与分层体系，聚焦分区优化痛点与原则，给出6种实战拆合分区、视图与拉链表方案，并总结链路设计与DWS取舍，强调上线前预留弹性、减少扫描与小文件，提升下游效率。

面试素材

#数据治理

2025-12-08

45

0

📊 数据治理之计算资源治理

📊 数据治理之计算资源治理

梳理计算资源治理痛点（延迟、过载、降本、冗余）及小文件、调度错配、DQC浪费等问题；按安全优先推进Spark3升级调优、清理无效规则/任务、优化调度；以成本与交付SLA量化成效，建立周期化治理。

面试素材

#数据治理

2025-12-08

51

0

✨ 数据表合规治理

✨ 数据表合规治理

文章围绕数仓数据表“难用、难找、不规范”痛点，系统讲解合规治理：从问题根因与ROI评估出发，提出制定标准、下线废表、公共指标下沉、治理ODS穿透、烟囱表重构五步法，并给出看板考核、长期维护机制与求职量化写法。

面试素材

#数据治理

2025-12-08

52

0

📌 数据质量

📌 数据质量

数据质量是数仓生命线。文章从成因与痛点出发，提出上线/变更规范、代码审核、探查比对、DQC监控、基线SLA与问题闭环，推动上下游协同，实现可靠交付。

面试素材

#数据治理

2025-12-08

52

0

🎯 数仓开发流程场景题

🎯 数仓开发流程场景题

本文汇总数仓面试4类高频场景题：2天交付报表、多需求冲突协调、跨行业快速上手、0-1搭建数仓；提供矛盾拆解、分步落地、并行协作、DQC校验及面试金句。

面试素材

#面试问答

2025-12-08

48

0

📚 数仓开发流程详解

📚 数仓开发流程详解

本文围绕数仓开发全链路展开：先厘清上下游与对接角色，再按“需求调研→数据域划分→总线矩阵→指标定义→模型设计→开发上线”拆解流程，并给出数据质量校验、DQC监控、倾斜治理等避坑点与面试表达技巧。

面试素材

#面试问答

2025-12-06

57

0

9 / 15