近期,网易云有多场关注数字化转型创新又落地业务的直播,如果你刚好工作忙错过了,或者听完不过瘾,还需要直播笔记,那一定不能错过这个系列——我们将复盘直播内容,划好重点,干货十足!
《网易大数据“数据生产力”系列直播课程干货回顾》
以下是正文:
先做一下自我介绍,我这边是网易的大数据架构师沈少仪,从事大数据这个行业已经有一段时间了。很高兴有机会和大家聊一下数据分析的一些故事。整个分享由四个部分组成:首先会从数据分析的历史开始跟大家讲一下大数据分析的前世今生。之后我们再去引入到为什么我们需要大数据分析师、需要数据分析?即数据分析的整体应用,包括用数据分析可以为企业、为我们日常带来哪些变革?最后我们通过一个案例讲一下企业如何去建立一个为自身业务赋能的数据分析体系。
一、细数数据分析的前世今生
整个分享从数据分析的历史开始,数据分析最早可以追溯到1676年的一个叫做《政治算术》的典籍,它是由英国古典政治经济学家威廉·配第,也被称为政治经济学之父通过利用实际的一些数据资料,包括数字和一些重要尺度的统计方式,对英国、法国、荷兰三国的国力和国情进行了一个对比分析。为了更好的了解这三个国家的一个状态,他通过这种方式开创了数据分析师的雏形。
到1890年,美国科学家赫尔曼·霍尔瑞斯利用了一个电动器来读取卡片上的洞。那么为什么是这样做?当时他们需要对美国人口进行一个整体统计,整个工作原本耗时需要8年,赫尔曼就想偷懒,于是他就开始通过电动机的方式来读取卡片,从而利用计算机加快了对数据的处理,把工作时间从原有的8年缩短到1年。这是人类首次利用机器自动进行数据处理,我将数据处理从原有的人工方式到自动化的过程。
时间到了1958年,IBM的计算机科学家汉斯·比德·罗恩撰写了一篇文章《A Business Intelligence System》,开始阐述了商务智能的价值和潜力,正式提出了商务智能的概念。到20世纪90年代的时候,商务智能1.0的整个技术框架开始搭成,这是为什么呢?因为当时随着数据仓库技术的发展,存储在各个地方的业务开始变得非常简单,人们就开始希望通过这些数据对自己的整体业务进行一个分析。
这个阶段有一个非常有代表性的案例,可能很多人都已经听过了,就是啤酒与尿布的故事。
这个故事是说20世纪90年代,当时在沃尔玛超市的一个管理人员在分析超市销售数据的时候,发现一个很奇怪的现象,在某种特定情况下啤酒和尿布这两件看上去毫无关系的一个商品,经常会出现在同一个购物篮里,而且这种现象往往出现在一些年轻男子身上,他就非常的费解。他想去看一下到底是为什么?于是他就去采访了这些青年男子,发现他们其实都是各个家庭的年轻父亲,而那个时候在美国的家庭环境中,通常是年轻的母亲在家里照看婴儿,这时候就需要父亲出门去购物。而当父亲在购买尿布的时候,进超市只买尿布他们可能会觉得有点单调,那么同时的话他就会给自己买一两罐啤酒。管理人员在发现了这个现象之后,就决定把啤酒和尿布放在一起销售,从而帮助超市获得了很好的商品销售收入,去更好的发展它的整体业务。
这时就引出了数据分析,对于当前企业的业务,包括营销有多大的帮助。人们发现数据分析可以很好地提升业务的时候,这时企业中对于数据的诉求就开始慢慢地增长了,比如说公司总裁希望知道公司目前的整体情况如何,各个指标又是什么情况,从而他可以更好地把握当前公司的整体发展方向以及运营情况。同时财务负责人希望知道公司财务运营的数字是否良好。对于不同的业务负责人来说,也希望知道当前的业务整个发展状况如何,知道这些情况之后,更好地去了解每一个指标的完成情况,哪条业务是相对来说是非常合理的一个值得发展的业务,哪些业务可能需要去进行一些调整和改变。同时行政的负责人也希望通过一些数据去了解员工当前的情况,各个部门绩效是否达标等。为了满足这些诉求,企业开始制作日常的报表来满足各个部门日常业务分析的诉求。
到21世纪,传统的BI工具已经没办法满足不停发展的业务,互联网的兴起使得人们获得信息的速度以及信息的传递都变得很快,这时整个业务的发展包括市场也在不停的变化,之前传统那种报表型的分析工具已经很难满足企业日渐增长的数据分析的诉求,这时候敏捷BI的概念会被提出来。
敏捷BI对商务智能1.0进行了一个升级的概念,在这个基础上它提升了对于复杂性和时效性的一些数据的处理能力,从而把BI变成了一个不再是锦上添花的软件工具,而是可以通过数据分析让企业的增长率得到更好地提升。这就是商务智能2.0的场景。
在这个场景上的话,跟传统的BI有什么区别?这边有两张对比图,传统BI是以原有的一个水晶报表Cognos为代表的传统报表。它是怎么构建的?其实就是业务方提出了一个需求,开发人员对需求进行一个分析,然后再去分析当前的需求需要哪些数据去建立一个数据模型,最终把这个数据抽取出来去构建一个整体的数据分析报表,再去给到最终的分析人员。这时会出现一个什么问题呢?我们大家会发现,在需求方跟真正的实施方之间,它是有一个断层的,这个断层会导致很长一段时间的需求沟通的不匹配,往往报表刚做好之后,另外一个分析的需求就会提出来,最终要达到一个可以让双方都满意的固化报告分析的状态,往往需要4~8周的时间。这个时间是很难满足当前业务的,因为现在可能每个月业务都会有变化。那么我们就会提到敏捷BI的过程。
二、为什么我们需要大数据分析
敏捷BI其实是以用户为导向的一个过程, BI首先是以智能分析算法为主,通过简易敏捷的操作方式帮助用户很快上手,从而需求提出方、形成方以及最终呈现方都是同样的人,这样用户可以直接通过拖拽的方式进行整体的操作,更好地去满足自身的分析需求。
因为本身它非常简易,所以一旦需求有一些变化的时候,它可以去更好地进行调整。这就是为什么我们把敏捷BI称之为一个探索化的模式,因为这个模式过程中我们并不需要一定有一个很明晰的需求,大致需要分析哪些地块的一些数据,需要分析哪些度量,包括一些指标,这样它就可以更好地探索它现有的数据中蕴含的一些故事。
敏捷BI的诞生对整体的传统业务分析形成了颠覆性的影响,它一改之前我们的分析场景割裂,实现全部业务模块打通。比如之前我在分析一个公司业务的时候,人事就分析人事的部分,财务就分析财务的部分,可能仓储物流、库存都有自己的一个分析状况,但是每个场景它是割裂出来的,这样就会导致分析结果比较单一,也很难去体现企业整体的运营情况。通过敏捷BI可以实现全部业务模块打通,比如说商品采购,采购完之后,可以直接追溯商品入库的情况。入库之后再去追溯仓储物流的情况,以及最终到了一个客户手上的状态,包括客户如果进行了退货,又可以去通过退货的节点反过来追溯到底哪个供应商提供了这个商品,可以进行多维度的全面分析,去实现整个业务链条的一个追溯。
在这个过程中,数据分析可视化已经从原有的工具变成一个平台。在这个平台上可以去实现什么呢?比如说我可以有底层的商务系统,一些来自于网络上的数据,包括自己的Excel数据,可以把这些数据全部接进来,在我的数据引擎上面进行整体汇总,去把这些所有的线条连接在一起,通过一些可视化的、敏捷的建模方式,快速地实现想要的数据分析应用的报表。
有些同事可能会更多的在外面跑业务,也可以给他提供一个移动端的访问,让他可以实时看他的数据。另外也可以把它很好地嵌入到自有的业务系统里面去,包括钉钉、企业微信里面,更好地去满足我们当前对于数据的诉求,以及通过一些数据智能的方式去帮我们找到一些业务的增长点。
讲到这我们就要强调一下整体的应用可操作性。这边我截取了我们网易有数的一个报表制作的视频,在视频里面可以看到整个报表并不需要底层的代码,通过一些拖拖拽拽的所见即所得的方式,就可以很方便的构建一些我想要的报表,比如说我们会去做一个银监会管委会的年报,这个年报其实就可以很方便的把之前做好的一些模型里面对应的数据通过拖拽的方式去引入到整个的分析报告里面。可以实现所有人都是一个数据分析师的理念。
在这个过程中加入一些智能化的分析,在分析里面我们可以去检索一下自身的模型,比如说想要看一下当前的不良贷款率,我只需要通过一些自然语言的输入,就可以很好地把这些内容划分开来,更好的服务我们未来的业务,能让我们的业务有它自己的一个分析想法的话,我们就可以更好的去直接去进行分析,并不需要太花太多的时间在沟通上面去,可以更快地把握我们业务当前的情况。
这里我们会通过一些可配置的方式去快速实现,也可以通过输入一些地图、参考线的方式,包括美观度、颜色的调整。在保证我们报表美观度的情况下,同时可以提升我们整体报告的可读性和分析性。另外在敏捷BI的状况下,我们会去预置很多已有图表组件,通过这些组件可以实现筛选器的筛选,去实现我们对于业务探索的功能。以及做一些维度切换,从不同角度去发现数据中蕴含的一些故事。包括构建一些前端的排序,可以更好的从多方位了解当前数据的状况,以及我们可以从多颗粒度的方式对数据进行分析,包括上卷下钻的分析。比如我看到华北的信息,我就可以看到华为下面各个省市的信息,更方便我们的管理层一步一步下钻,定点到一些分析的内容,还有一些明细表的跳转,一些比较复杂的数据挖掘的语句。
通过这种方式,我们就可以对业务进行赋能。整个的赋能过程可以划分为三个层级,最高层级是我们已有报表体系最主要去满足的层级,就是我们整体的一个是管理层的一些需求。针对管理层的需求,我们需要对数据进行全面的分析去保证准确的信息能传达到管理层这边。在这之下是数据分析师的层级,他们的核心作用是挖掘数据中蕴藏的一些故事,因此需要一个灵活、稳定、高效的平台,可以帮助他们更好地分析数据里面的内容,进行数据的探索。最底层是一线员工,我们拿零售来举例,会有一线的客服人员,包括店长等会有一些数据的诉求,可以保证他们能够实时把握当前营业情况,更好地去为最终的业务进行调整,这时他们就需要一个易用、智能和快速的解决方案。这部分我们会详细展开来讲。
这是我们网易的一个案例,是一个总经理的驾驶舱,在总经理整个的驾驶舱里面,我们是会把所有的信息进行一次性的全部展现,可以一目了然的看到就当前整个企业的运营情况,当然为了方便展示这边数据是我们伪造出来的。
在这个过程中,一旦他对一个服务部的信息感兴感,想看到当前上市的情况,就可以进一步的进行数据的深挖,我们可以看到就是说每个服务部它当前上市的一个上市进度,那么在上市进度里面,可以通过不同的颜色去表达,比如用红色来表达当前时间进度,已经完成了对应的目标,绿色则表示当前时间进度并没有完成对应目标。
通过这种颜色方式,我们定位到浙江和广西发现并没有完成当前的业务,我还得再进一步深入分析,比如说浙江当前每个月的上市状况是什么样子?有哪些是积压的,有哪些是超卖的,目前整个已上市的最终结果如何?有这些明细的情况,管理层可以更明确的知道,可能是前半个月他并没有去,因此会有一些影响。那么我再定位到这半个月的时间,去定位到当前运营的状况和问题。
对于分析师来说,我们可以提供一个灵活高效的数据分析师工作台,在这个平台里面,可以一些通过自助分析的工具,通过读取指定模型,就可以快速去实现报表的制作。在报表制作的时候,可以去深挖一些维度、一些成绩的细分调整,去逐步探索发现当前数据中蕴含的故事,最终得出数据分析的结论。在这个过程中,可以通过一些上卷下钻的能力,进一步抽丝剥茧,看当前的数据里面有什么样的故事。
对于一线人员,比如说我们可以给他们创建一些一线的移动助手,在助手里面我们可以设置好诸如当前业绩、门店类型等信息,一线的同学一步步往下看,可以看到更明确的一些数字,他就可以更好地去把握当前业务的状态。如果看到当前销售状况相比上个月有了一些提升,这是好的;一旦有些不足的地方,可以更好的去了解到底是哪些不足,方便及时对运营模式进行调整,快速响应当前需求。整个数据分析的体系,可以帮助企业深挖当前数据的故事,通过数据转化为整体的数据生产力,从而作为企业进一步提升的养料和肥料。
展开来讲,第一步,我们可以帮助企业更加了解用户。在数据分析过程中,可以对数据进行深挖,比如建立用户画像,包括用户分层,哪些用户属于比较有潜力的客户?哪些用户属于铁杆用户?哪些用户属于需要花精力维系的用户?针对不同客户,制定不同的营销计划,实现更精准的营销和广告投放。
通过对当前用户的分析,营销的分析,内部人力、原料支出的分析,可以找到当前企运营的短板和冗余点,进一步去拉低当前的企业运营成本。另外也可以推动流程的优化,去看业务的各个环节之中存在哪些瓶颈,存在哪些浪费,在这方面去进行整体的优化,可以更好地提升当前业务的效率。
同时我们可以收集市场上一些内外部的信息,去了解当前市场的行情,这时我们可以拿它跟对应产品进行对比,更好地去了解当前市场动向,进行市场定位,拥抱市场变化。
有了这些信息的加成,对于管理者来说,他可以更清楚地了解企业的现状,以及当前内外部的情况,可以作为依据结合他原有的经验去找到相应的规律,从而做出正确的决策,同时规避一些未来可预期的风险,帮助企业更好地预测未来的发展方向。
三、案例分析:网易严选,高效数据分析体系为业务赋能
接下来我们通过一个案例来讲一讲如何构建属于自己的数据分析体系?我们使用网易严选作为案例,来给大家分享一下网易严选是如何去建立一个高效的数据分析体系的?
网易严选是网易旗下的原创生活类自营电商品牌,相信大家很多人都或多或少都会使用过这个产品。网易严选是2016年4月正式面世的,也是国家所谓的ODM模式,即原始设计制造供应商模式的电商。作为16年面世的ODM电商品牌,它的数据体系建立和最终的展现,以及对于其他内部一些企业运营的帮助,都是非常典型的。
一开始,大家可以看到网易严选,是因为它必须要严格去把控从原料、生产、质检,以及销售、售后各个环节。所以它整个的业务链路包含了从研发开始,到采购、生产、物流、仓储、销售以及配送到消费者之间整个的业务链路。这些链路的话,在开始sku数量不多的时候,还是比较好保证的,但是随着sku数量的增多,我们会发现供应商,包括整个生产、物流、仓储以及最终到客户的管控压力越来越大。那么网易严选去构建整套的数据分析体系,最终目的是什么呢?它的最终目的是实现线上零售业的精益运营。通过精益运营,它可以进行供应商的一些优化,整个仓储原材料生产的一些优化,物流的优化,以及最终业务上的优化,最终实现降本增效。
为了实现需求,他们提出来第1点需求,通过数据去支持产品从研发、分销、市场、运营、仓配、采购各个环节的一些诉求,为什么?因为如果仅按照原有人工的方式,他们已经很难去做了。首先需要大量的人工,同时很容易出错,这就需要通过数据去实现一个自动化管理体系的应用。
第1步做的就是对整体业务进行梳理,去梳理当前每条链路中大致有哪些环节,每个环节都会产生哪些数据?每个环节需要注意哪些点?通过对这些信息的分析,可以更好的帮助他们去绘制一个整体业务流程图,去把握他们当前业务的整体状态。
对业务整体状态进行梳理之后,第2步要做的是对整体规范体系的梳理。为什么要树立规范体系?正常来说大家会通过各个底层的业务系统辅助管理,大家就是业务的各个环节,这些业务系统首先是相互割裂的,其次彼此之间数据也没有连通,所以各个系统之间的业务数据格式、模式相对并不统一,需要有统一的规范。
在规范好之后,第3步需要通过一些方式把这些数据打通,拿生产企业来说,会有一些批次的原材料进来,这些批次原材料会按照批次去存在对应的数据仓库里面,这时我们就可以通过批次的方式,去把供应商管理的内容跟我们仓储的数据进行对接,而商品的条码和编码我们又可以通过编码的方式进行统一,这就是规范体系的过程。
只有规范好体系之后,我们才可以建立一个统一的一体化数据分析链路,进而构建我们的数据中心,去构建为了各个不同的业务应用去分析的数据模型,最终实现数据应用的展现,去建立一个顶层的业务分析应用系统,去帮助严选更好的进行数据的分析、应用的分析。下图是数据分析体系建立以后,当前严选的整体架构。
数据中心用的是网易自己的大数据中心网易猛犸,在数仓基础之上通过网易有数这个BI工具帮助业务分析师更好地服务业务人员。业务分析师在对整体业务进行探索发掘之后,会提炼出一些对应的图表,目前严选内部已经有将近25,000张表,日均uv 280个,去满足不同的业务场景,日均pv 70,000次左右。通过这种方式,更好地为前端业务提供服务。拿出严选当前的分析体系,可以看到在整个人选分析状态中,其实是把HR、日常的财务,产品管理成本,大客户管理、大类目、渠道、市场、风控,以及物流、供应链状态全部进行了封装和梳理,更好的支撑他们当前的日常分析体系。下面我们挑选几个严选有代表性的分析案例跟大家分享一下。
这是严选地区销售的案例分析,我们会去构建一些阶段性指标,包括当前销售额的占比,可以发现华东、东北两个地区是主要的销售点,在销售点上面我们进一步打开来看,通过有数拥有的智能分析过程,我们可以进行对比分析。
我们单独把华东和东北的两个数据拿出来,可以看到华东的销售额是明显是高于东北的。同时华东和东北加起来占所有地区销售额的34%,这是很大的一个比例。我们再想去看一下这两个地区的差异,我们把对应子类别的数据拿出来,会发现在大多数类目的销售中华东确实明显高于东北,但在桌子类目的销售过程中,东北的销售额要远远高于华东。这样的话,我们可以进一步去调整华东跟东北不同地区的备货,广告的投放,进一步去提升它这方面的优势。
另外我们还可以从销售的方式进行分析,可以看到在华东的公司,他们更喜欢次日达的邮寄方式,那么我们可以在这方面进行一些调整。而在订单的销售额差异上,我们会发现两边的差异相对来说比较平缓。这就是通过一种智能的方式,帮助大家一目了然的去分析不同地区的销售状态。
我们也可以用科学的方式对客户进行分层,这边的话我们拿了一个零售比较通用的RFM模型,我们去收集客户最近一次的消费状态以及消费频率与消费金额,通过这三个不同维度,我们可以去把客户进行分层。
比如有一些已经流失的客户,以及存在潜力的客户,部分的新客户,一般维持的客户,哪些是需要重点唤回的客户,哪些是重点价值的客户,包括需要重点深耕以及挽留的客户?针对这些客群进行不同的划分,我们就可以针对这些状态为未来的营销进行新的规划,比如新用户可能给他推送一些优惠券,包括他感兴趣的广告,进一步提升,看看他后面有没有重要的消费或状态;对于一些重要唤回的客户,我们可以去了解他当前的兴趣点,了解他当前需要买的一些物品,通过这种方式可以给他推送一些优惠券和对应的广告,更好地将他们唤回进一步的消费;有些重要价值的消费,比如有些客户已经我们严选 APP上面浏览了很多关于锅具的信息,同时某个锅具他已经看了好多次,这些数据都会在我们的后台进行汇总,系统会自动分析,我们可以知道这个客户当前感兴趣的是某品牌锅具,针对的诉求我们可以推送对应的优惠券来促使他成单单的落地。通过这些方式可以更好地去定位客户价值,包括定位客户当前的需求,进一步提升营销精准性以及有效性,同时节省营销成本。
在客户下单之后,正常来说严选尽量保证在两天之内把订单送到客户手上,我们会对整个从支付到妥投的平均耗时进行监控。大家可以看到是正常的,也就是说监控妥投的时间为40个小时左右,一旦我们发现妥投时间高于了40小时,我们就会及时去定位到具体的交付单号,看它在支付到妥投的环节中在某些地区是否会存在一些阻碍,进一步通过一些可行策略,包括业务的优化尽可能降低这方面的时间损耗。通过这种方式我们可以更好地为客户提供服务,提升客户粘性。
整个严选的业务的驱动,是构架在网易有数之上的。通过网易有数,它构建了一整套场景化的业务驱动应用,包括对于管理层来说的移动数据工具台,对于市场来说的推广和渠道管理系统,包括一些产品运营、用户行为分析平台,以及供应链协同的决策系统,还有一些商品数据的运营平台。通过这些平台,更好的去把控当前客群的状态,同时对一些即将买断货的商品,可以自动提醒对应业务人员及时补货了,减少因备货不足而导致的销售损失。
在整个体系构建好之后,严选通过这种方式去进行一些精准化、精细化的营销,包括利用用户的画像,包括自身营销的状态,以及对应库存的状态,去精准定位用户的喜好,去实施去设置活动。对于这些活动,我们会有一些用户分析,通过分析,直接对应不同的客群去设计不同的活动,去起到包括挽回老客户挽回、挖掘新客户以及重点客户推荐,更好的满足客户对于服务的满意度。
我们打开严选可以发现给每个人的推荐商品也是不同的,这也是通过数据分析的方式,让了解到客户当前的喜好。通过喜好的标签给不同的客户推荐不同的产品,包括电商定价广告的投放,实现更精细化的运营,帮助严选更好的实现当前的整体营销。严选在构建这么一套数据分析平台的过程中,主要是为了让自身的业务更快速、更灵活的去感知市场,同时背靠大数据优势形成的产品设计和理念,整个平台构建好之后,它实现了整个品牌自成一脉,更好地实现它原有的独特风格,同时也大提高了整个供应链的运作效率。
这边我们列举了一些成果,比如严选在建设整个数据分析平台之前,从一个供应商下订单到产品设计再到最终售卖的时间是120天,在构建好之后,因为它准确地把握了商品市场信息,由此预测到未来市场的趋势,这样在进行产品设计的时候考虑到整体的需求,减少了设计所需要的时间。同时在生产环境、质量监控上进行优化,最终实现从建设前的120天,大幅度降低到建设后的30天。
在用户从支付到妥投的过程,在严选刚开始建立的时候平均时间是68.2小时,通过整个的分析,我们优化了各个不同的仓储备货、仓储节点以及各个节点之间的物流线路,把这个时间降低到39.7个小时,从而实现整个销售额8倍的提升,客单价提升了92%,更好的吸引住了客户,并很好地满足客户整体的需求。
这次给大家分享的是如何通过数据分析和数据可视化,让企业或者是每一个店铺的每个决策都有数据支撑,更好地为企业的数据生产力提供服务的内容,非常感谢大家聆听!
来源:网易云