分享

美团 付晴川:机器学习在美团用户画像中的应用

 无名小卒917 2016-11-28

机器学习在美团用户画像中的应用 付晴川


  • 什么是用户画像?
  • 为什么要做用户画像?
  • 如何做用户画像?



什么是用户画像?





为什么需要用户画像?


为什么需要用户画像?

  • 用户体验,在对的时间获取对的服务!
  • 运营效率,更精准高效的活动策略制定!
  • 营收提升,获取更多的潜在优质客户!
  • 自动化,数据应用接口标准化/通用化!


如何来做用户画像?


架构 – 系统概览


架构——细节解读

  • 统一特征提取框架
  • 1. 多工程师/多个模型“自给自足”,特征分散。 2. 存在人力/计算资源冗余。
  • 1. 特征统一提取/集中存储——大一统特征库。 2. 支持no-coding/配置化提特征。
  • 1. 建模周期: 3~4周下降到1~2周。 2. 人力/计算冗余减少2倍(估算值)


架构——细节解读

  • 用户画像统一接口多系统项目
  • 1.数据挖掘成果需要友好统一的输出接口: 可视化+API
  • 1. 用户标签体系WEB可视化 2. 用户标签索引/实时查询 3. 报表自动化
  • 1. 成果推广加速/沟通成本降低 2. 传统用户问卷调查报报告周期1个月,utvs系统10分钟!


需要做横跨多个产品线的特征提取!


用户特征体系


算法 – 用户特征


算法 – 特征与效果实例 用户职业标签: 学生身份识别


算法 - 问题及常用模型


实践 - 问题及常用模型---实例

  • 有车一族标签挖掘
  • 1. 汽车服务推广活动需要精准圈定有车人群降低营销成本。
  • 1. 样本:问卷调查正样本+随机负样本 2. 特征:信息增益特征离散化+卡方/信息增益/互信息等特征选择 3. 模型: try SVM/MaxEnt/LR => SVM
  • 1. 离线评测:P93%,R85% 2. 线上对比:推送打开率提升3倍,下单率提升5倍!


实践 - 问题及常用模型---实例

  • 常住地标签挖掘
  • 1. 决策支持:酒店需要分析用户下单与地域关系,决定是否上异地推荐模块。
  • 1. 样本:问卷调查 2. 模型: try LR/SVM/RF/GBDT=> LR 3. 多个LR模型组合
  • 1. 离线评测:P96%, R73% 2. 线上对比:新上异地模块点击率超越历史最佳“名店抢购”1个百分点!


实践 - 关于算法工程师的段子

  • 提出假设->收集数据->训练模型->解释结果
  • 提出假设->收集数据->预处理->预处理->训练模型->调试->调试->重新收集数据->预处理->收集更多数据->调试->调试->调试->…>放弃


实践 - 分享:那些年踩过的坑






    本站是提供个人知识管理的网络存储空间,所有内容均由用户发布,不代表本站观点。请注意甄别内容中的联系方式、诱导购买等信息,谨防诈骗。如发现有害或侵权内容,请点击一键举报。
    转藏 分享 献花(0

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多