一个好的数据看板,要贴合业务,用简单的方式达到真正数据驱动业务的目标。本文作者对数据看板、数据埋点及适用情况进行了分析,一起来看一下吧。
一个好的数据看板要贴合业务,用简单的方式达到真正数据驱动业务的目标。
一、明确数据看板的定义
数据看板面向的主要用户为公司内部人员,其目的是便于相关人员快速准确地了解掌握公司业务发展情况,并能够针对数据变化作出业务决策,在此基础上数据看板需呈现公司当前业务相关或运营管理相关数据以及图表等。
二、明确数据看板的适用对象
数据看板面向的是公司内部的绝大多数人员,但不同角色的用户对于数据的关注点不同数据的呈现方式也是不同的,例如战略看板需重点指标突出、主次分明故尽量以显著数字的形式展现。
数据看板中的数据要与用户角色进行匹配并权限隔离,以此达到不同的角色默认可进入的看板页面是不同的。
三、构建数据指标分析体系
数据指标体系:一个良好的数据指标体系要能够满足以下四点:贴合业务核心价值目的、可反应业务真实情况、数据可拆解可比较、可推动决策指导行动;
数据指标&纬度:在满足以上四点的基础上采用枚举法与业务人员定义好分析框架后,需定义完整的数据指标并进行数据纬度的下钻;
数据统计口径:数据口径指的是对数据如何计算的定义,需与业务部分达成共识形成一套标准的数据口径;若无法全局统一需清晰描述出数据区别及影响范围;
数据统计周期和频率:在确定好数据指标以及统计口径后,需根据数据指标随时间波动的幅度、是否深度影响业务来确定数据统计频率是天极、小时级、分钟级等;统计周期是否需要时间周期卷积来确定是否需要使用T-N*权重的数据来统计T日数据指标。
四、数据看板的展示形式
数据看板的展示形式在能够满足业务的需求的同时要能够达到高效、简单的特点:
- 简单高效,优先满足查询效率,而不是酷炫的交互
- 信息具有强关联性而不是孤立的一个数据,具体就是要有环比、同比来体现变化
- 数据图表的刷新频次和统计频次要符合业务的需求以此基础上决定是否实时更新
- 选用的数据能够体现出趋势和规律,对于无趋势特性的数据,直接展示数字比较好
- 对于不同的数据指标,不同的数据特性需要选用合适的图表
- 数据波动、对比、排序,不同的衡量方式也应该选择其对应的图表类型
第一类: 趋势型
折线图、面积图等能很好地体现数据趋势,常用于显示随时间变化的数值;
折线图、面积图有便于展示多个类别(项目)数据的趋势变化,不显得过于拥挤。
1)折线图
统计图表,常用来表示数值随连续时间间隔或有序类别的变化。
从数据上来说,折线图需要一个连续时间字段或一个分类字段和至少一个连续数据字段。
2)面积图
或称区域图,是一种随有序变量的变化,反映数值变化的统计图表,原理与折线图相似。也可用于多个系列数据的比较。
面积图可以表达数据的总量和趋势。不仅可以清晰地反映出数据的趋势变化,也能够强调不同类别的数据间的差距对比。
3)桑基图(Sankey Diagram)
一种特定类型的流程图,图中延伸的分支的宽度对应数据流量的大小,起始流量总和始终与结束流量总和保持平衡。比如能量流动等。
适合:用来表示数据的流向。
局限:不适用于边的起始流量和结束流量不同的场景。比如使用手机的品牌变化。
相似图表:和弦图,展现矩阵中数据间相互关系和流量变化,数据节点如果过多则不适用。
有时也被称为“冲积图”,是一种表现流程的示意图,用于描述一组值到另一组值的流向。
分支的宽度对应了数据流量的大小。这种图包含流入、流出的节点,以及曲线型的边,往往呈现出彩带一般的效果。使用桑基图时,应注意变量的归类和颜色的选择,避免太过花哨、影响阅读。必要时建议加入交互功能。
第二类: 对比型柱状图&条形图
条形图和柱状图表达的数据的形式基本相同,都是矩形条对不同类别进行数值比较的统计图表,数值则决定了柱子的高/长度。
1)条形图
条形图由于是横向的,所以更适合用于一些类别名称比较长的数据,这样就可以显示完整;而柱状图会因为太长变成45度显示,或是省略部分内容,影响美观。
条形图可以做成横向的旋风图,进行对比,很漂亮,也比较直观;柱状图不行。
柱状图可以与折线图配合次坐标轴,做成复合型图表,如双轴图;条形图在这点上想实现比较费力。
2)柱形图
作为基本的图表形式,二维柱状图(条形图)常用来比较数值的大小,直观地了解不同的类别在数值上的差异。
适用:对比分类数据。
局限:分类过多则无法展示数据特点。
相似图表:
- 堆积柱状图:比较同类别各变量和不同类别变量总和差异。
- 百分比堆积柱状图:适合展示同类别的每个变量的比例。
3)分组柱状图
分组柱状图,又叫聚合柱状图。当使用者需要在同一个轴上显示各个分类下不同的分组时,需要用到分组柱状图。
跟柱状图类似,使用柱子的高度来映射和对比数据值。每个分组中的柱子使用不同的颜色或者相同颜色不同透明的方式区别各个分类,各个分组之间需要保持间隔。
分组柱状图经常用于不同组间数据的比较,这些组都包含了相同分类的数据。
4)堆叠柱状图
常被用于比较不同类别的数值。而且,它的每一类数值内部,又被划分为多个子类别,这些子类别一般用不同的颜色来指代。
如果说柱状图可以帮助我们观察“总量”,那么堆叠柱状图则可以同时反映“总量”与“结构”。即,总量的数据以及它是由哪些部分构成的。进而,我们还可以探究哪一部分比例最大,以及每一部分的变动情况等等。
5)百分比堆叠柱状图
每根柱子是等长的,总额为100%。
柱子内部被分割为多个部分,高度由该部分占总体的百分比决定。因此,与普通的柱状图或堆叠柱状图不同,100%堆叠柱状图不显示数据的“绝对数值”,而是显示“相对比例”。
但同时,它也仍然具有柱状图的固有功能,即“比较”,我们可以通过比较多个柱子的构成,分析数值之间的相对差异,或者得出数值变化的趋势。
6)南丁格尔玫瑰图
又名鸡冠花图、极坐标区域图。
尽管外形很像饼图,但本质上来说,南丁格尔玫瑰图更像在极坐标下绘制的柱状图。
只不过,它用半径来反映数值(而饼图是以扇形的弧度来表示数据的)。
但是,由于半径和面积之间是平方的关系,视觉上,南丁格尔玫瑰图会将数据的比例夸大。
五、确定数据看板的优先级
完整的数据指标体系会涉及到许多指标需求,需求是等级的根据数据处于业务需求的不同计算和层级来确定数据开发的优先级;处于核心业务相关的数据看板需优先保证数据的可用性和准确性。
六、数据看板上线复盘
任何需求和产品上线一段时间后都要及时复盘功能是否好用得到相应的反馈,使用率可通过数据埋点看该项功能的的使用情况等。
七、数据埋点
埋点的目的是为了获得足够准确的数据,以观察用户行为,进而对产品做出评判。只要产品需要观察数据,就需要提前埋点。
1)埋点原则
前期埋点要全,后期定时删除。
- 前期埋点全:前期产品不稳定时,埋点要埋全——尽可能杜绝上线后发现数据缺失。
- 后期定时删除:产品或者需求得出明确的结论后,定时整理删除不再需要或者不重要的 event。
- 不要想当然:了解数据统计平台后埋点,杜绝埋点后数据在统计平台中的呈现方式与预期差别过大。
- 名称要起好:难以理解,总是折返跑并名称重复。
数据平台的统计事件是有限资源,合理使用。常用的几个平台事件数量上限都是500条左右。1.0.0版本,不仅需要了解产品核心指标以及核心功能的使用情况,还需要关注用户的行为,对核心功能的使用路径。此时,本着不遗不漏的原则,需将所看到、想到、接触到的所有页面的展示、浏览、点击等行为全部记录下来。尽可能防止在上线之后,想到了新的数据目标但却没有记录。
2)埋点规则
事件筛选主要依靠参数字段来进行过滤,因此在设计埋点时,把需要拆分的维度当做参数来设计,会便于后续的数据筛选和计算。
3)达成共识
- 基础事件:埋点的数据统计基础——新增用户首次打开、应用升级等。
- APP事件:每个app自己指定的事件埋点——应用开启、浏览行为、用户点击等行为。
- 通用参数;所有事件都会上报的参数——手机系统、所在国家、当前版号等。
- 事件参数:指定事件上报的参数。