hello 大家好,相信在我们日常的工作中,常会遇到一些问题需要「数据分析」的帮助:
比如在进行方案设计时需要知道用户行为数据来辅助决策;再比如实验结束后,发现指标下跌但不知道原因;以及不知道方案上线后应该监测什么数据来验证设计的有效性等等诸多场景。
那今天就通过这篇文章来帮助大家了解数据分析的基本方法。
*声明:下方列举的例子和方法,是我个人在工作中常用的数据分析方法,世界上没有一种方法适用于所有人,这里提供的方法也仅供大家参考,希望每个人都可以根据自身情况因地制宜因人而异开展实践。
更多数据分析干货:
在学习任何一样东西前,要先了解它的定义:
百度百科中对数据分析的定义是-“数据分析是指用适当的统计分析方法对收集来的大量数据进行分析,将它们加以汇总和理解并消化,以求最大化地开发数据的功能,发挥数据的作用。数据分析是为了提取有用信息和形成结论而对数据加以详细研究和概括总结的过程。”
定义中提到数分是收集数据、整理消化并发挥作用的过程,那结合我们自身的设计行业,数据分析在设计全流程可以发挥什么作用呢?
设计前:发现问题,发现机会点,了解不同人群用户习惯等等
设计中:辅助在多个设计方案中决策
项目上线后:方案 ab 测试,复盘总结经验,推测 ab 结果的原因,验证设计价值等
在日常工作中,从获得数据到作用于实践的整个数据分析的流程是:
- 确认问题和目标:明确要用数据去回答什么问题
- 知道要看什么数据
- 获取/提取数据
- 对获得的数据进行清洗和处理
- 对获得的数据进行可视化
- 将数据应用在业务中,回答第一步中的问题,和进一步的思考与解释
今天,我们在短短一篇文章中无法展开讲每个流程怎么做,因此今天我们就聚焦回答这个流程中最最核心的一个问题,也就是第二步——“怎么知道自己要看什么数据??”
为什么只聚焦这一个问题?原因是其他的流程节点在各类数据分析的课程中都有详细的讲解,并且这些都是可以通过快速阅读课程掌握的“技能”,而今天我们聚焦的“明确要看哪些数据”问题,是展开整个分析的思维核心所在。
为方便理解,我们先引入「三位设计师」例子。
为了让之后的描述更易懂,让我们先来引入 3 个例子/场景,大家尝试带入下方例子的主人公视角,思考在下方的例子中,到底要收集什么数据,来帮助主人公解决问题?
设计师小 A 遇到的问题:在设计餐厅列表的筛选时,针对「餐厅品质」与「价格区间」的筛选方案,线上是将二者合并到一个筛选弹窗中,而产品经理发现这两个筛选都很高频,希望将这两个筛选分成两个筛选入口都平铺在列表上,此时对筛选的方案二人有所争论。小 A 难以决策到底哪种更好?
设计师小 B 遇到的问题:在餐厅详情页改版中,进行了三种改动:1.删减了部分用户不关注的标签,2.为了首屏屏效,压缩了首屏中点评的高度,3.增加了餐厅亮点介绍模块。在即将上线时,他不知道如何衡量/度量的每一个改动点的数据效果,不知道如何证明这些设计改动是有效的?
设计师小 C 遇到的问题:在一次大刀阔斧的全流程改版中,针对用户下单的每一步(频道-列表-详情-填写-订单)进行了全面的优化,既有页面框架的优化又有信息的精简,最终的实验数据是下跌的,但却不知道数据不好的原因?
让我们带着上述三个人的问题进入下个环节,在遇到了上述问题之后,接下来我们就要去思考,该收集什么数据来回答这些问题。
现在,我们就来介绍数据分析流程中最重要的一步——如何知道自己要看什么数据。不同的场景需要看的数据复杂程度不同,我自己在工作中最常用的明确自己需要哪些数据的方式主要有三种:
1. 在简单场景下,你可能只需要看某一个数据
如果我们遇到的只是一些很简单的问题,例如只是需要看某个功能的使用率,那只用去收集个别指标数据即可。
为此,我们需要提前了解各类数据指标的定义和通常的用途。下图为大家列出了常用的数据指标和其含义。
举个「简单场景」的例子,在上方设计师小 A 的例子中,设计师小 A 遇到的问是相对简单的场景,他遇到的问题是在设计餐厅列表的筛选时,针对「餐厅品质」与「价格区间」的筛选方案,线上是将二者合并到一个筛选弹窗中,而产品经理发现这两个筛选都很高频,希望将这两个筛选分成两个筛选入口都平铺在列表上,此时对筛选的方案二人有所争论。小 A 难以决策到底哪种更好?
于是他决定去看以下数据:「餐厅品质」的筛选 UV、「价格」的筛选 UV,以及用户组合同时使用二者的筛选 UV。最终发现使用「餐厅品质」筛选的人,和使用「价格」筛选的人中,大多数人都是组合同时在使用两个筛选,因此最终考虑将这两个筛选放在同一个面板中。
2. 在复杂场景下,你可能需要使用常见的「模型」,来帮助自己明确要看什么数据
数据分析模型就是“指标的合集体”,模型存在的意义是“指导我们在什么场景下可以组合地、有逻辑地去看一组数据”,让自己更有章法地收集数据。
下方列举了互联网行业常见的数据分析模型。
当然除了根据模型知道自己需要看什么数据,也可以根据这次关注的「页面模块」的类型,来判断这种类型的模块通常会关注什么数据,如下图提到的不同类型模块关注的数据指标通常不同。
来源于「神策数据」《互联网业务数据分析实战》
接下来我们继续以之前提到的设计师小 B 为例子,看下他是如何运用模型来明确自己要收集什么数据的。回顾设计师小 B 遇到的问题:
在餐厅详情页改版中,进行了三种改动:1.删减了部分用户不关注的标签,2.为了首屏屏效,压缩了首屏中点评的高度,3.增加了餐厅亮点介绍模块。在即将上线时,他不知道如何衡量/度量的每一个改动点的数据效果,不知道如何证明这些设计改动是有效的?
于是他套用了专门度量用户体验的 GSM 模型,来推出为了评估设计改动带来效果,需要收集哪些数据。如下图,在 GSM 模型表格中的每一栏中填写后,他就对要收集什么数据来评估改动效果了然于心。
3. 当面对模型无法解决的场景,可能需要「自建模型」来明确要收集什么数据
当面对更复杂的场景时,如果用我上述的模型都无法回答你要收集什么数据时,你就需要自己来建立模型了,大家不要被“自建模型”这个字眼恐吓到,它其实非常简单,跟我一起往下看。
什么场景会连常用的模型都无法解决呢?比如就像我之前提到的设计师 C,他面对的问题是:在一次大刀阔斧的全流程设计改版中,最终的实验数据是负的,但是却不知道实验数据差的原因,要对实验数据进行归因分析。他想要推测可能是哪个改动最终导致了数据下降。
此时,用常用的模型无法解答,怎么办?
答案是——“像侦探一样思考!”
让我们来回忆一下曾经看过的推理片/侦探片,一名侦探为了找到真相事实,常用的思考方法之一是“先在脑中发散出所有可能性假设,然后逐一用能收集到的数据佐证每个假设是否成立,不断收集线索,不断验证假设是否成立”。(当然真实场景会比这复杂的多,这里只是想举例子说明数据分析就像侦探推理一样,先穷举发散一切假设,再收集证据来验证)
因此我们在面对非常复杂的问题时,也可以从一个结局出发(如实验数据下跌这个结局),穷举发散一切原因,并寻找数据来验证原因是否成立。
有人可能会问:怎么穷举原因呢?毫无章法的随便发散?
不,而是有方法的去发散,在发散时,可以用到「结构化」和「公式化」的思维进行发散。「结构化」意思是:我们在发散原因时,事情 A 和它的原因上下之间必须呈因果关系/依赖关系,相互独立完全穷尽,并且每一个论点都是可验证的。「公式化」意思是指可以按照计算公式的方式发散。如下图。
现在让我们带入设计师 C 的视角,思考当我们面对一次大刀阔斧的设计改版时,当最终数据下跌时,该如何找到数据下跌的原因。
小 C 在发现数据下跌后,开始发散穷举数据下跌的原因:
第一轮发散:先排查不同渠道、不同用户群体、新客老客之间是否有差别,最终收集数据后它发现 App 站内渠道的数据下跌。
第二轮发散:小 C 沿着 app 站内这条思路,从页面漏斗中排查原因,发现在详情页上向填写页转化这层漏斗数据下跌。
第三轮发散:既然详情页向下级页面的转化降低,那开始思索到底是哪个模块导致的呢?于是在穷举详情页所有能够跳转下级页面的路径后发现,其中详情页的套餐 A 模块向填写页的转化下降,最终将原因收窄到这个模块中。
之后,结合本次对「套餐 A」的改动点:本次实验将卡片上的标签弱化并减少展示排数,同时展示的标题、副标题都更少了,猜测是这些改动点导致的数据下降,最终再结合定性用户调研后发现,用户确实认为自己关注的信息看不全导致下单犹豫。
最终在这一层层发散之下,小 C 终于找到了导致数据下跌的原因所在:
以上就是本文的全部内容,感谢大家的阅读!
参考资料:
- 《七周成为数据分析师》系列课程,作者:秦路
- 《互联网业务数据分析实战》系列课程,作者:张涛
复制本文链接 文章为作者独立观点不代表优设网立场,未经允许不得转载。
发评论!每天赢奖品
点击 登录 后,在评论区留言,系统会随机派送奖品
2012年成立至今,是国内备受欢迎的设计师平台,提供奖品赞助 联系我们
商用级AIGC绘画创作与技巧
已累计诞生 689 位幸运星
发表评论 为下方 8 条评论点赞,解锁好运彩蛋
↓ 下方为您推荐了一些精彩有趣的文章热评 ↓