04-22 项目实战🖨️ 红米Note13Pro+ 测评反馈分析:来自B站弹幕与评论的数据洞察 本文分享了作者大二上做的一个数据分析项目,起初记录在飞书云文档中,现保存至博客记录。2024年为母亲选购红米Note 13 Pro+后体验不佳,作者通过分析B站相关测评视频的弹幕与评论,运用情感分析与主题模型等方法进行数据挖掘。项目揭示了该机型的真实口碑与受众特征。 66 0 0
11-05 项目实战🖨️ 电商数仓🧰 DolphinScheduler 简介与入门 Apache DolphinScheduler 是分布式可扩展的可视化 DAG 工作流调度平台,支持多任务类型与监控告警。介绍其核心架构(Master/Worker/ZK/API/UI)、三种部署模式(单机/伪集群/集群)及安全中心配置要点(租户、用户、队列、告警、环境、令牌)。 47 0 0
10-28 项目实战🖨️ 电商数仓🧰 🌏 电商数仓项目全链路架构详解 文章从全局视角梳理数据全链路体系:数据由端与业务系统产生,经 DataX/Maxwell/Flume+Kafka 采集汇聚至 HDFS,再以 Hive 构建 ODS-DWD-DM-ADS 分层数仓,最终同步至 MySQL 并用 BI 可视化,实现数据闭环与业务价值输出。 55 0 0
10-24 项目实战🖨️ 电商数仓🧰 📘 数据仓库建模与维度建模笔记 笔记梳理数据仓库建模意义,比较 Inmon 的 ER 与 Kimball 维度模型;详解事务/周期快照/累积快照三类事实表及可加性;总结维度表设计、星型/雪花模型,以及慢变维快照与拉链表处理。 38 0 0
10-20 项目实战🖨️ 电商数仓🧰 数据仓库 概念 架构 学习重点 梳理数仓:面向分析决策的多源历史数据系统;介绍ODS→ADS五层分层及采集、调度、可视化组件,区分离线/实时数仓,并给出建模、SQL、调度的学习顺序。 40 0 0
10-13 项目实战🖨️ 电商数仓🧰 SGG电商数仓6.0概要 项目搭建用户行为与业务数据采集平台,规划ODS-DWD-DWS-ADS分层并进行维度建模,支撑电商核心主题近100项指标。通过Kafka消峰、修复零点漂移、SCD拉链表与分区分桶ORC优化,提供即席查询与Superset可视化服务。 139 0 1