通向优秀数据分析师的六个阶梯

很多同学都在问:”数据分析从0到1的文章看多了,咋样才能从1到10,从普通到优秀呀!”,今天一起讨论一下 。“优秀”是一个形容词,只有清晰了参照物,才能知道到底什么是“普通”,什么是“优秀” 。今天就从“普通”讲起,想通往“优秀”,需要迈过6个阶梯 。
第一阶:搞数据数据分析最怕啥?
没思路?
没模型?
没图表?
都不是!
数据分析最怕:没数据!无论是做啥分析,搞数据,始终是第一位的工作 。尽可能多地搞数据,是第一位要求 。不然一切免谈 。
只不过,同数仓开发不同,数据分析关注的数据,是面向业务主题的 。数据服务的产品、运营、销售、营销、售后部门,到底有什么数据,需要什么数据,是数据分析师必须梳理清楚的 。
具体来说,包括:指标/维度两部分 。如何衡量是否清晰?可以问自己,以下问题是否清楚 。

1、我服务的部门是……
2、该部门属于利润中心/成本中心
3、该部门的KPI指标是……
4、该部门的主要流程是……
5、该部门流程中,已采集数据是……
6、该部门现有过程指标是……
7、该部门组织架构是……
8、该部门服务对象分类是……
9、该部门常用分类维度是……
其中:
1、2、3是用来明确主要KPI指标的,这是数据分析的源头和关键
4、5、6是用来搭建过程指标体系的,解释KPI指标如何达成
7、8、9是用来筛选关键分类维度的,当KPI指标波动,从这些维度做拆解
很多同学习惯于在现有宽表上跑数,向上不清楚业务流程、业务目标,向下不清楚数据来源、数据采集,每天忙着按需求单跑数,连跑的数是啥意思都不懂 。这样就限制死了自己的发展空间,无法进一步提升能力了 。
 
通向优秀数据分析师的六个阶梯

文章插图
 
第二阶:定基线做到第一阶,至少能看懂自己跑的数据了,知道每个数据是用在哪个部门,哪项工作 。下一步最关键的是……?
有的同学可能不假思索地说:建模!还没到这一步哈 。下一步关键的是:定基线 。知道自己看的数据,常规形态是啥样的 。知道什么算正常,什么算不正常 。
这一步非常重要!因为数据本身没有含义,数据+标准才有含义 。而并非所有指标,业务方都会给出标准的 。很可能,只有销售数据才有具体到每天的考核标准,其他数据得凭经验、凭常识、凭分析定出基线(如下图) 。
 
通向优秀数据分析师的六个阶梯

文章插图
 
很多同学无法解读数据,做的分析不被业务认可,都是因为没有跨过这一台阶 。最常见的,看到指标跌了,盲目做了一堆交叉,然后业务方轻飘飘地:“这是正常波动” 。
然而第二天又有同样幅度波动,业务方却急着烟熏火燎:“这么大波动你都看不到吗!”……被这么折腾几次,就会信心全无,怀疑人生 。所以想进步,就不能被业务方牵着鼻子走,得自己有定基线能力 。
第三阶:拆因素跨过第二阶后,数据分析师已经对业务常见走势,有充足的了解 。并且,自己有能力做判断,就能识别出异常状态 。并非所有的异常都不可控,有相当多的异常是可观测因素导致的,比如宏观环境,比如营销动作、推广计划 。此时,要先有能力先把这些明显可识别的“白犀牛”整明白,再来谈其他“黑天鹅”问题 。
看到这里,肯定有同学会说:“老师,这个简单,我的PEST,SWOT,4P已经按捺不住了,来吧!”然鹅,没卵用 。你看那么多PEST的文章,有一篇教过你怎么量化P、E、S、T四个指标不???
 
通向优秀数据分析师的六个阶梯

文章插图
 
所以这一台阶,叫“拆因素”,即把这些影响业务的因素,拆解到可以量化的,能用一个或几个数据指标表现,并能与内部数据结合分析的程度 。拆因素可能有若干数据形态,比如:
1、0、1形态:有XX因素、没有XX因素
2、分类形态:同一事件,ABC三种状态
3、连续形态:能用一个连续型指标,代表该因素
具体怎么拆,是需要大量分析工作做基础的,最后能沉淀下来的,就是最有价值的经验 。


推荐阅读