BI 软件的强项是将这些业务数据汇总起来,无需编程即可绘制出可供长期监控的可视化报表,同时实现随时更新,而不是传统管理咨询的一份静态报告。传统咨询提供的报告,往往在出炉的第一天就过时了。
1.2数据科学
反观数据科学,如果站在一个数据工程师的立场上,BI 软件做的事情其实也属于数据分析的范畴,任何数据洞察,数据挖掘工作都需要涉及到这些通用维度的基本统计。但在这种浅层分析的基础之上,数据科学家可以通过带入较强的人为干预和行业性输入,做到许多高于 BI 的数据洞察。而将这些洞察落地,运用至具体产品设计,营销方案,会员体系和售后服务中,便可以像互联网公司一样,实现以数据驱动业务。
因此,诱发新用户建立品牌意识,进行二次购买的窗口为 3-4 个月的换季档,而对老客户的消费唤醒窗口期则更短,以 1-2 个月为最优。这是一个很典型的数据工程师利用自己的行业知识和经验来实现数据洞察的例子,也是 BI 软件无法做到的。首先研究复购间隔是消费品行业独有的场景,更重要的是想要完成这个洞察,其中所涉及的统计工作具有很强的定制性,也较为复杂,需要编写统计脚本或是使用多条复合 SQL 来实现,数据工程师的价值也在此有了体现。
除了复杂和高定制性的统计逻辑外,对于非结构化数据的处理和挖掘也并非 BI 软件的强项。对于大型消费品公司来说,全电商渠道的运营已经成了常态,每日来自京东,天猫,唯品会,一号店,聚美这些大型电商平台的订单数高达数万个。而这些订单中的邮寄地址里包含了巨大的信息量,比如用户所在的城市,地理位置,甚至是身份,职业,消费能力等等。通过程序和地图 API 将这些邮寄地址转化为经纬度后,可以对用户群做大量的精细研究。
但我们平时所谈论的 “BI” 很多时候其实指是软件厂商所提供的 BI 软件 / 套件,用于实现业务报表和统计监控的功能。暂且不提厂商们是否有故意偷换概念的嫌疑,BI 软件和数据科学还是有着比较大的差异。可以说 BI 软件通过高度抽象的方法,提供了一种非常便利的数据汇总,统计,可视化的工具,从而完成了数据科学的一部分工作,而许多深层次的,带有行业性的,高于 BI 软件的分析与洞察,仍然需要数据工程师的参与,以及特定数据系统的支撑来共同完成。
总结
与传统的管理咨询公司相比,在 BI 层面,大数据的相关技术胜在算力:数据整合能力、实时处理能力以及呈现能力。