数据思维与数据驱动
1.大数据的概念
大:不是数据量的”大”,而是宏观的,覆盖面广
全:强调多种数据源
细:细节精准,多维度数据
时:实时采集实时分析
不是截面的静态的,而是时间序列多维度的
信息的四个层次
经验——>新事物
过去——>未来
数据—-离散元素
信息—-连接元素
知识—-组织信息
智慧—-应用知识
2.大数据的本质
作者提出了 数据驱动理念 大数据的本质是消除不确定性
3.数据驱动的价值
驱动决策
驱动产品智能
4.企业内部数据驱动现状
1.时间效率低下
2.数据可视化问题,仪表盘只能看到宏观数据
3.无法跨越数据孤岛藩篱
4.理想中数据驱动———>流的观念
5.大数据时代到来的条件
1.数据采集能力增强
2.数据处理能力增强
3.数据意识的提升
数据驱动的环节
1.数据的采集与埋点
困惑:如何采 采哪些 用什么手段
传统的三个途径:第三方统计工具 通过业务数据库做统计分析 web日志统计分析
数据采集的现状:
科学的数据采集和埋点方式
可视化/全埋点 代码埋点 导入第三方辅助工具
数据的准确性:
2.数据建模
传统的数据模型
多维数据模型——->数据分层的金字塔模型
多维事件模型:
Event实体 :描述了一个用户在某一个时间点及某个地方以某种方式完成了某个具体事情
User实体
多维事件模型的探索
用户行为查询平台 logdata平台 用户行为数据
3.数据分析方法
行为事件分析
漏斗分析:——>属性关联
用户从起点到终点各个阶段用户转化率
留存分析:
对产品上线及新功能上线时,用户留存率的分析
分布分析
点击分析
用户路径
用户分群(用户信息标签化)
属性分析
4.指标体系的构建
第一关键指标法
第一个阶段:MVP阶段—-确定用户需求
第二个阶段:增长阶段—-关注留存指标和引荐指标
第三个阶段:营收阶段—-如何规模化及实现快速盈利
海盗指标法
acquisition(获取) activation(激活) retention(留存) revenue(营收) referral(引荐)
数据驱动产品智能
1.基于机器学习的用户智能
回归算法
分类算法:离散
聚类算法:聚类的标准
关联算法:连续的关联规则挖掘
2.用户画像
user persona:主要来源于产品和运营对客户的理解调研与认知
user profile:基于真实积累的用户行为 结合具体业务场景产生的一系列标签
3.个性化推荐