有时候会听到有人说:「我终于学会用R了」,「我终于学会用SAS了」......
高兴之余,我不免要说,这可能有点伪命题的意思。R、SAS、Excel等等都只是工具,使用工具是为了解决某种问题,而问题本身有往往有不同的场景(不可穷举),有可能你会用工具解决这个问题,却不会用工具解决另一个问题,所有前面说的「学会」,往往有伪命题的意味在里面。
更大的伪命题是——以为学会了数据工具的基本操作,就等于搞定了数据问题,可以高枕无忧了。其实,有可能有的人仅仅是个「数据工具使用者」。比如,很多企业里可能有这样的场景:不同业务部门的人,纷纷向技术支持部门的某个数据工程师提出数据需求,该数据分析师处于长期响应数据需求的疲惫状态。这里之所以说是「数据需求」,是因为其中的业务成分不高,更多的偏重数据统计层面的工作,比如统计按固定年龄分档计数的需求,或者直接导出满足某些规则的名单的需求。
当然,熟练使用各种数据工具(包括商业化的数据工具,以及数据相关的编程语言,如Python等)是非常重要的,也可以帮助从业者更快的入手,更快的沉浸到数据当中去(能接触到海量数据,往往是十分令人兴奋和愉悦的)。但还需要了解,数据工具仅仅是数据从业路上的一部分,更完整的拼图应该包括:数据思维、数学理论知识、数据工具,三个部分。
数据工具:从广义上讲,包括商业数据工具、云端的数据工具、各种数据相关的编程语言。
数学理论知识:包括统计学、概率论、线性代数、微积分等等,是门槛比较高的一块。
数据思维:这一块经常被人提及,却又没人可以说得清楚。我倾向于这样理解——数据思维,就是「通过数据驱动的理念去解决业务问题的思维」,这里的业务问题可以是商业层面的问题,也可以是个人层面的问题。比如,这个月产品的月活跃用户下降是什么原因?papi酱的粉丝和罗辑思维的粉丝有什么不同?我是个卖衣服的微商,我应该怎么细分我的顾客呢?
如果还是感觉有些笼统,那还可以继续把数据思维进行分解,如下图:
你仅仅是个数据工具使用者吗?
①. 数据敏感度、数据模型思维
看到一个数据马上有所反应(是高了,是低了),听到一个事情,闹中马上涌现出相关的数据实体和关系。这里会涉及到数据库和数据仓库的一些理论知识。
②. 把业务问题转化为对应的数据问题的思维
首先,需要理解业务问题本身,然后可以找到解决这个业务问题的数据方法、模型。现实中,确实存在一些基本功很扎实,却无法发现或理解业务问题,进而只能被动响应需求的情况。这个问题的解决,还是需要多关注生活细节,多积累相关问题解决案例。
③. 分析推理思维
这种思维,更像一个逻辑驱动下的导火索,因为a,所以b,然后c。一般的分析推理过程符合 发现问题 ? 维度细分 ? 对比 ? 回溯 的过程。
④. 大数据思维
在海量数据的基础上,通过机器学习算法所体现的智能性,去解决分类、聚类、回归等问题。篇幅有限,不细说。
上面四个要素的关系是:在充分理解数据的基础上,围绕业务问题,通过分析推理、大数据思维等数据方法,尝试去解决问题。就像上面的逻辑关系图一样。
另外,还有一种更泛化的数据思维的说法,把企业的数据文化、数据化的组织结构、数据本身的积累和管理也纳入其中,这是个更大的话题,今天不再赘述了~~~