步入大数据时代,各行各业对数据的重视程度与日俱增。随之而来的是对数据整合、挖掘、分析、可视化需求的日益迫切,数据可视化呈现出越来越旺盛的生命力。如今在一些行业,数据可视化已经成为日常办公、应急处理、指挥调度、战略决策必不可少的一部分。
面对这股热潮,很多企业纷纷推出了大屏数据可视化系统或平台方案。由于各自理解不同,推出的系统或方案也是不尽相同。有的认为只要大屏幕能够接收显示各种数据就是可视化了;有的则表示,软件才是数据可视化的核心。
这些看法对不对呢?对,但又不全面。数据可视化,指在是借助于图形化手段展示大数据分析结果,使数据清晰有效地表达,使人们快速高效的理解并使用,它集成了数据采集、统计、分析、呈现等多环节。不同行业的数据可视化可能有不同的呈现形式,但最终的目的都是挖掘出数据深层次的含义
如何定义大数据可视化
事实上,上面的解释还是有些过于笼统,而且针对性不强。对于企业来说,大屏原来的重点在于显示,主要关注画面的清晰度、对比度、一致性、显示和接入信号的多样性等。接入数据可视化后,不仅要有显示能力,至少还要具有把过去用语言、用数据、用想象力表达的内容,通过图形、图表等形式显示出来,这样才能称之为可视化。数据可视化系统并不是为了展示用户的已知的数据之间的规律,而是为了帮助用户通过认知数据,有新的发现,发现这些数据所反映的实质。
数据可视化技术第一代应该是报表软件,通过报表系统能够把复杂的数据整理成规则的表格,并配以漂亮的图形,比如柱图、饼图、折线图等。
第二代当属BI(Business Intelligence)了,BI比起简单的报表又迈进了一大步,它已经不单单是一个工具软件,而是一套完整的解决方案,可以将企业中现有的数据进行有效的整合,快速准确的提供报表并为决策提出依据,帮助企业做出明智的业务经营决策。
进入大数据时代,数据可视化这个说法慢慢的流行起来,究其原因,一个是大数据的展示比起以前的数据展示有不同的地方,最大的难点就是面对如此巨大的数据,如何比较好的展示给用户。另一个是随着近几年技术的发展,可以通过更多的形式,例如三维模型、动画、视频、动态交互式页面、手机APP等将数据以展示、推送、提醒、互动等模式提供给用户,其复杂度上升了一个数量级。渐渐地,数据可视化就成为一个专门的领域,成为了大数据时代的一个研究分支,无数优秀的工程师和设计者为这个领域做出了贡献。
一个真正的大数据可视化系统,需要具备以下条件:
管数据
从数据采集、清理、整合方面,能提供完整的系统工具平台。支持多种类型的数据接入、灵活设置数据清洗规则、采用合理的数据管理模型整合数据,帮助企业很好的管理数据。
看数据
提供可视化的数据展示设计工具,能够实现各类业务指标的规格定义,支持各种可视化展示组件,可以快速实现基础数据、业务指标、可视化展示的设计应用,能够直观地看懂理解业务数据。
用数据
这是数据可视化平台的核心。数据可视化不能只是简单的图形化,更重要的是能够发现业务潜在的风险、价值。能够支持业务规则、算法模型的嵌入应用,对数据进行挖掘分析,再通过可视化手段展示分析结果,真正能用数据驱动业务。
业务服务
数据可视化平台是为客户的生产业务提供服务的,所以平台需要能够实现业务的监控、预警、分析、处置的能力。
技术服务
平台是要具备灵活的编辑、设计能力,从数据管理、指标定义、可视化展示能够通过可视化的实施工具灵活自定义,用户就可以根据自己的需求设置数据可视化的分析展示。
平台支持
数据可视化平台要能够支持Windows, Android, ios系统,满足拼接屏、液晶屏、PC、移动端的灵活应用。
由此可见,在数据可视化系统中,数据的挖掘、分析及呈现,是数据可视化环节中的关键,同时也是区别一个系统是否是真正的数据可视化系统的判断标准。如何提升底层算法进而将用户行业海量数据真正用好,为用户提供更好的管理、调度和决策支持是大数据可视化系统成功的关键。
相对而言,大数据可视化在纯技术的问题反而不是问题的关键,比如三维建模技术、图表自动生成技术、数据检索技术等。可视化更多的是对用户和业务的理解,以及在这个基础上对数据的深刻认识。这就落实到大数据可视化方案如何与应用场景结合,行业不同、场景不同,可视化方案也有自己的特点。具体到工业大数据领域,其可视化又有自己独特的特点,呈现出与互联网大数据可视化不同的难点和方向,工业大数据可视化有以下几个特点:
数据量呈现海量趋势,且更新频率极高
由于工业大数据主要来源于传感器的数据采集,因此其数据量相比传统互联网大数据只多不少,而且,它的更新频率极高,传感器按照恒定的频率快速更新。在这种情况下,如何保证监控页面的数据实时更新,还能够让监控人员看数据的变化,就是需要研究的问题。当某个数据每秒更新10次,那么,屏幕上的数字直接变化就是无意义的,因为监控人员根本就一个数字都看不到。如何兼顾数字的更新频率与视觉效果,就成为可视化的第一个难题。大量的监控点,无法进行有效地显示一台普通的设备,可能就有上百个传感器,再加上相关的视频、环境、人员等监测,可能会有几百个监测数据是这个设备需要的,那么,这么多的数据如何在有限的屏幕上进行排列,如何取舍,成为可视化的第二个难题。整体与局部如何有效地结合一个企业会有许多下属的分子公司,下属企业又会有车间、工作面等工作场景,每个工作场景又会有许多设备。这样层层嵌套的可视化局面如何比较好的结合,在保障使用人员看到整体的时候,还能够同时关注到局部的数据变化,是可视化的第三个难题。
局部与细节如何兼顾
在一个局部的数据展示中,我们还希望看到数据的细节,包括相关的数据、历史的数据、异常的数据、数据的趋势、数据的预测等,能否把握好局部与细节的展示关系,是可视化的第四个难题。
如何实现工业数据的有效检索和有效推送
也就是常说的“数据找人”,在互联网企业,利用大数据分析用户的使用习惯和兴趣爱好,寻找其感兴趣的话题进行推送已经是常见做法了,但在工业大数据领域,如何实现?一个报警信息,推送给谁?当前还是靠提前设好的规则,未来能否实现智能化以及怎么实现?
这是可视化的五个难题。
虽然数据可视化在企业中热度不小,我们也看到了在很多行业的头部企业,数据可视化已经取得了出色的应用,发挥出巨大的价值。当然,在很多企业那里,还只是停留在简单的人工统计数据、绘制表格阶段。有些企业把数据可视化简单的理解成为大屏展示,与数据分析距离很远,数据可视化只是口号而已,并没有将数据驱动决策的真正价值发挥出来。
事实上,商业智能(BI)和分析的应用有着很高的投资回报率,这也许是它正在从寻求问题的IT驱动工具演变为业务线必需品的原因。
IDC数字化转型研究副总裁Serge Findling预计,BI/分析工具将实现稳健增长,收入将从2018年的239亿美元增长到2019年的263亿美元,或同比增长10%。
的确,Gartner在2018年初表示,数据分析越来越成为大多数行业、业务和IT领域的关键要素。最重要的是,数据分析是成功的数字业务的关键。
分析的力量正在改变组织和行业。一些主观的决策越来越受数据驱动影响,比如员工招聘或品牌塑造。而客观的决策,正在使用比以前更复杂的数据和更复杂的分析,像物流计划或客户风险分析。
企业数字化转型,从数据分析开始。
*注:本文转载自《CIO发展中心》,文章有编辑。
他们都在用Yonghong服务
人人都是数据分析师专区