大家好,我是周方。
大家最近有买房或者装修的可能会了解我们公司,博洛尼是一家做智能家居的公司。
我们主要做整体厨房或者全屋定制,简单来说就是您买了房子想住,把房子钥匙交给我们,中间只需要看一下方案,其他都不用管了。
一、智能家居的产品特性
中国房子最大的特点是,一栋楼内各个户型都有差异,小的几平米,大的话十几平米。而且不同家具有审美、使用频率的差异。
比如说厨房,有人在厨房最常用的东西是冰箱,放的东西只有啤酒和饮料,大部分家庭放的可能是蔬菜水果之类的。
另一个是地区、湿度和海拔的差异,同样的产品规格、型号不能适用于千家万户。定制化家具的风格和工艺是核心。 风格决定产品的调性,工艺决定产品适合的地域。在北京卖的很好的东西,如果不改动同样放在上海卖,就行不通了。
因为我们不仅要做产品的定制化,还要考虑整体的颜色、布局搭配,所以我们的产品线会很复杂。所以我们会分析不同的产品适合的地区、人群。
比如一个看起来很古典的东西,如果像90后、00后推销的话,成功率很低,但放在特定的门店成功率就会比较高。
我们会把产品分为正单和维护单。正单中分为卖的好与不好的产品,卖的好的产品要么是价格合适,要么是美感好,要么是特别实用。
如果卖的不好,除了考虑改进外,还要考虑是不是应该不再生产了,这样可以节省非常多的物料。
维护单的最大特点是因地域原因导致的工艺不合格,会陷入无限期维修的情况。这个时候就要考虑是改进工艺还是修改此产品的地域匹配。
二、数据分析经历的变迁
于是我们对这些情况进行数据分析,最开始做的时候是15个人,以人工的方式加班赶出来的报表。
因为表格数据量大的时候速度会特别慢,当时我们每个人都配备了配置较高的工作站。比如就衣帽间的款式数据,我们就有几万个。
我们公司数据分析经过了四代变迁。 第一代是纯手工化,我们公司成立的比较早,那个时候图纸是手绘的,尺子、画格统计,计算器、算盘、笔、A4纸是我们最常用的东西,所有的销售数据、报表都是手写的。
后来我们成功的上升到了Excel时代,那个时候我们发现终于有一个不错的工具,至少能保证行列不会错,结果不会算错。
但是发现文件传来传去,因为版本的差异,导致差两行,在数据上就差几万块钱。这个说得轻一点是工作疏忽,重一点是不负责任。
后来业务系统搭建比较全了以后,大家说以后我们不要再通过Excel传递数据了,可以用报表工具统一从业务系统中取数,保证大家的数是一致的。
这里其实是我们遇到最大的坑,报表工具选的不好,还不如回到纯Excel时代。
我们确实更换过三个报表工具,不断的从一个坑跳到另一个坑里去,又不断的从一个坑跳到另一个坑里去了。
我们选择永洪有两个原因,一个是因为我们看好他们的服务,二是因为永洪产品迭代是比较快的。
目标是纯BI时代,最大的好处是所有的条件都是显性的,我用最简单的分子和分母来表示,在Excel+BI的报表时代分子是不确定的,可能会有人为的因素把有些字段删除或隐藏。
在纯BI时代的时候是显性的,其他人可以通过报表看出来哪些被筛掉了,至少可以保证我们开高层会议的时候,大家讨论的事情是在同一个数据基础上的。
三、永洪产品落地的两个方面
我们是一家装修公司,所以我们是一个传统的公司,我们的IT人员占比大概是1:150,我们的IT人员对于业务的支持精力不足。
再加上业务变化速度快,比如做某个活动,要求数据要及时反馈,不然公司很难知道活动方案是否有效,如果需要调整,数据不能及时展现,等报表出来,活动已经结束了。在最开始,对于这点我们很难响应的。 去年年初我们开始考虑更换BI工具过程,我们考虑到底是沿用之前的工具还是换新的。
我们有这样几个思考:
1. 换工具是不是能解决目前无法处理的问题? 2. 我们要换成哪家供应商? 3. 更换会带来哪些风险?如果有风险,这个风险有多大,能不能及时弥补。
如果不换的话,沿用之前的工具最大的好处是,学习成本几乎为零。是否可以跟供应商商量一下,通过版本升级就可以解决,还是会有其他的解决方式。后来我们经过了一些内部论证决定还是换了。
更换也是经历过的漫长的过程,首先是供应商初筛,后来选择了4家供应商进行POC的测试,拿前一个月的实际数据进行POC,再进行内部的评审。在今年4月份跟永洪达成了合作伙伴关系。整个落地的过程主要分两个方面来讲。
1.深度调研
为什么要深度调研呢?从我这么多年的经验来看,需要将80%的精力放在调研里面,要深入地了解哪些数是该要的,哪些是不该要的,在这一过程中我们发现了巨量的“脏数据”。
常规的脏数据是比如重复的、空的、或者是不合理的数据。
但是更多的“脏数据”是什么呢?是不符合业务分析逻辑的数据。
我们的物料有几万种,我们把每一种物料根据明细都做了不同的命名,但进行分析的时候是需要把某十几种、某几十种进行合并的。
最开始我们要手工用Excel表格处理,以经验进行数据合并。
后来我们是怎么做这个事情呢?有些简单的、不合理的数据我们可以通过ETL进行清洗,但是更多的数据我们是通过业务角度进行清理的,这个可能是我们的特例,我们的系统都是自己开发的。
在我们行业的IT信息化方面,我们可借鉴的东西确实不多,所以我们都是买成品软件,之后大量地进行改动。
永洪的很好的一点是可以支持定制开发,节省了我们IT人员的很多成本。
我们几乎所有的业务系统都是经过自己开发的,数据都是业务部门定义,之前的产品事业部需要分类的东西也是他们自己定义的,业务人员要从什么角度来分析数据,我们就在业务系统里面把数据体现成什么样子。
假如我们想做更精细的数据分析,有时候希望供应商能够给我们一个思路,让我们少走一些弯路。
但有一句话叫真正的成功从来不是直线的,有些弯路就得绕,绕过去才能获得成功。 2.建立数仓 建立数仓的目的在于,我们的6大业务系统比较分离,我们要做业务归集,更多的数据是直接要进行统计的,而不是说真的分散地拿原数据,我们在数仓更多的是整理、整合、统计。 做到成品表里面存的数据行数真的很少,才能让成品报表或者看板能达到秒开,不管未来的网速有多快,数据量大了运算就要时间,数据只展现两行,网速慢也能做到秒开。 这个是我们用永洪的产品做的成品表,左边是筛选条件,我们可以反复使用筛选看到我们想要数据。
接下来我们产品事业部的同事,尤其是需要看报表的同事都是什么样的工作状态呢? 都是右手鼠标,左手茶,不用加班也能按时完成工作。 未来我希望永洪的产品能够越来越智能化,用语音就可以做分析。我有这个想法也是巧合。
有一个成语叫身残志坚,我们之前有一位同事,他是有一条腿残疾,右手也不太好用,他非常不方便,一直需要一位助理,他做事的效率基本取决于招的助理的能力。所以巧合在于,我特别希望通过语音分析,他只要说话就可以做特别牛的事情。 我的分享就到这里,谢谢大家。
(注:本文根据 博洛尼 数据工程师 周方 于7月14日在2018永洪大数据技术峰会演讲整理)
|