日常生活中,我们常遇到这些现象:查询商品后,淘宝、小红书持续推送相关好物;和同事聊完某话题,短视频平台就推送相关内容;月初充话费时,会收到专属优惠券——这些都离不开用户标签画像体系的支撑。
大数据时代,企业为实现“千人千面”的精准服务与高效运营,需通过用户行为数据构建标签体系,核心价值在于:精准识别用户需求、减少无效投放、提升用户参与度,同时为商业决策提供数据支撑。但需注意:用户数据的收集与使用需遵循合规性原则。
📚 核心知识点一:用户标签的本质与分类
1. 什么是用户标签?
标签是对用户多维度属性的结构化描述,通过整合用户的基础信息、行为轨迹、偏好特征等数据,形成可用于分析的“用户符号”。一个用户可被打上近百个标签,每个标签对应一个数据字段,最终实现“用户立体化描摹”。
2. 标签的核心分类(七大维度)
-
基础信息标签 📌:用户核心属性,包括基本信息(年龄、性别、地域、IP、设备信息)和身份信息(平台等级如 SVIP/VIP、资质认证如蓝 V/ 大 V),是标签体系的基础。
-
社交属性标签 👥:反映用户社交行为特征,如粉丝量、关注数、私信互动频率、好友关系链等。
-
行为偏好标签 🎯:基于用户内容交互行为生成,如短视频停留时长、点赞 / 收藏 / 转发的内容类型、搜索关键词偏好等(例:常刷赛车比赛内容则打上“赛车爱好者”标签)。
-
行为属性标签 📱:用户在平台的具体操作记录,如发布内容、一键三连(B 站)、评论、关注账号等。
-
营销活动标签 🎁:用户参与平台活动的特征,如活动参与次数、优惠券使用情况、活动转化率等。
-
消费能力标签 💰:评判用户付费潜力的指标,如客单价、最高消费金额、消费频率、付费类型等。
-
用户体验标签 ⚠️:反映用户平台使用感受,如举报记录、投诉内容、客服咨询反馈、满意度评分等。
📚 核心知识点二:标签的属性类型与特征
标签属性是标签的“数据形态”,共分为五类,需注意与“指标”的区别:标签与指标是包含关系,指标可直接转化为标签,标签也可由多个指标组合生成。
📚 核心知识点三:标签与指标的关联——以“社区活跃用户”为例
标签可由多个指标组合生成,以“最近 7 天社区活跃用户”标签为例,需通过多维度指标综合判断,具体逻辑如下:
“最近 7 天社区活跃用户”标签的指标组合逻辑:
-
连续登录天数>3 天(反映基础使用频率);
-
近 7 日发布作品≥2 个(反映创作型活跃);
-
近 7 日点赞 + 收藏 + 转发>15 次(反映内容消费型活跃);
-
近 7 日评论数≥10 条或有高赞评论(反映互动型活跃);
-
近 7 日参与社区活动≥1 次(反映活动参与度)。
满足任意 1 条即可判定为活跃用户,计算逻辑:IF(条件 1∨条件 2∨条件 3∨条件 4∨条件 5,1,0)
📚 核心知识点四:标签的加工流程与实现方式
1. 标签加工核心流程(角色分工)
-
需求发起:业务方(运营)提出目标人群需求(如“杭州地区 VIP10+ 活跃用户”);
-
口径定义:数分 / 数据产品明确标签业务口径(如“活跃”的判定标准),统一数据逻辑;
-
开发实现:数仓同学基于口径开发标签宽表,关联多源数据;
-
标签落地:将标签同步至标签平台或用 Excel 维护,供业务方使用。
2. 标签宽表建设的两种模式
-
模式一:按标签类目建表根据标签一级类目(基础属性、社交属性等)分别建立 ADS 表,优势是分类清晰,便于精准查询(如“用户举报”标签直接查用户体验表);劣势是跨类目查询需多表关联,操作繁琐。
-
模式二:用户 360 宽表(推荐)整合业务方高频使用的核心标签,建立一张用户级宽表,主表为用户维度表(dim_user),关联直播、内容发布、行为日志等表。优势是单表即可定位用户全景信息,支持灵活查询;需定期下线无效标签,保持表结构精简。
3. 标签开发技术示例(SQL逻辑)
-
示例 1:最近 30 天发布量:LEFT JOIN 内容发布 DWS 表(target_30d),通过 user_id 关联,直接提取发布量字段;
-
示例 2:最近一次发布时间:从 DWD 表中按 user_id 分区,按发布时间倒排,取第一条数据(RN=1)作为最近发布时间;
-
示例 3:年龄段标签(多枚举):CASE WHEN 年龄 18-21 THEN '18-21 岁' WHEN 21-23 THEN '21-23 岁' ... END。
📚 核心知识点五:标签管理与画像生成
1. 标签管理方式
-
标签平台管理(推荐):建立标签域(一级类目)、标签分组(二级类目),支持新建标签、字段映射、版本管理,运营可通过“拖拉拽”圈选人群,无需写 SQL;
-
Excel 维护(简易版):按一级类目建 sheet 页,记录标签名称、业务口径、维护人、上线时间、版本等信息,适合小团队使用。
2. 画像的本质与生成
画像是多个标签的组合呈现,通过标签平台或 SQL 筛选,将符合条件的标签聚合,形成目标用户群体的“全景样貌”。例如:“杭州 +25-30 岁 +VIP10+ 近 7 天活跃 + 偏好美妆”的用户画像,可直接用于美妆电商推广。
高效生成建议:将 ADS 标签表同步至 OLAP 引擎(如 Doris),通过平台配置实现画像的实时计算与圈选,提升运营效率。
📚 核心知识点六:标签画像的核心应用场景
-
精准营销:定向推送优惠券、活动信息(如给高消费用户推奢侈品专场);
-
风险拦截:通过“高频举报”“垃圾广告发布”等标签,识别违规用户;
-
产品迭代:基于用户偏好标签优化功能(如给创作型用户强化剪辑工具);
-
用户分析:做专题分析(如“90 后用户消费习惯”),支撑战略决策;
-
AB 实验:按标签划分不同客群,对比实验效果(如不同推送话术的转化率);
-
付费模式优化:根据用户付费习惯调整定价(如给高频小额付费用户推月卡)。
🎯 核心总结
用户标签画像体系的核心是“以数据为基础,以业务为导向”——通过多维度数据提炼标签,再通过标签组合生成画像,最终服务于精准运营与商业价值提升。关键环节包括:清晰的标签分类、明确的业务口径、高效的宽表建设、灵活的管理平台,三者缺一不可。