工业大数据的特征
工业大数据的特征
(2018年11月9日)
编者的话:对于工业大数据特征的认识,人们也是逐步加深的。我网站就这个问题已经刊出了几个不同时期、不同朋友的小文了,大家可以细细观察,每一次都有一些新的词语和表述出现。请大家给予关注。
一、定义:工业大数据即工业数据的总和,分成三类,即企业信息化数据、工业物联网数据,以及外部跨界数据。
二、空间分布:不仅存在于企业内部,还存在于产业链和跨产业链的经营主体中,如SCM、CRM。
三、产生主体:人和机器。人产生的数据如:设计数据、业务数据、产品数据。机器数据有生产设备(生产调度、质量控制与绩效数据)和工业产品(智能服务)。
从数据流动的视角来看,数字化解决了“有数据”的问题,网络化解决了“能流动”的问题,智能化要解决数据“自动流动”的问题,即能够把正确的数据在正确的时间以正确的方式传递给正确的人和机器,能够把海量的工业数据转化为信息,信息转化为知识,知识转化为科学决策,以应对和解决制造过程的复杂性和不确定性等问题。
四、本质特征:
(一)具有复杂动态系统特性。确定性是工业系统本身有效运行的基础。应对不确定性的前提是感知信息、消除不确定性。
(二)4V特征:大规模(Volumn)、速度快(Velocity)、类型杂(Variety)、低质量(Veracity)
1.所谓“大规模”,就是指数据规模大,而且面临着大规模增长。
2.所谓“速度快”,不仅是采集速度快,而且要求处理速度快。
3.所谓“类型杂”,就是复杂性,主要是指各种类型的碎片化、多维度工程数据,包括设计制造阶段的概念设计、详细设计、制造工艺、包装运输等各类业务数据,以及服务保障阶段的运行状态、维修计划、服务评价等类型数据。
4.所谓“低质量”,就是真实性(Veracity),相对于分析结果的高可靠性要求,工业大数据的真实性和质量比较低。
(三)工业大数据新特征归纳为多模态、强关联、高通量等。
1.“多模态”:工业大数据是工业系统在赛博空间的映像,必须反映工业系统的系统化特征,必须要反映工业系统的各方面要素。数据记录必须追求完整。
2.“强关联”:工业数据之间的关联并不是数据字段的关联,其本质是物理对象之间和过程的语义关联。1)产品部件之间的关联。2)生产过程的数据关联。3)产品生命周期不同环节的数据之间的关联。4)不同学科不同专业的数据关联。
3.“高通量”:嵌入了传感器的智能互联产品已成为工业互联网时代的重要标志。物联网数据已成为工业大数据的主体。
(四)应用特征归纳为跨尺度、协同性、多因素、因果性、强机理等几个方面。
1.“跨尺度”、“协同性”主要体现在大数据支撑工业企业的在线业务活动、推进业务智能化的过程中。
2.“跨尺度”:工业4.0 强调的横向、纵向、端到端集成,就是把不同空间、时间尺度的信息集成到一起。为此,需要综合利用云计算、物联网、边缘计算等技术。
3.“协同性”:工业系统强调系统的动态协同,工业大数据就要支持这个业务需求。我们进行信息集成的目的,是促成信息和数据的自动流动,加强信息感知能力、减少了决策者所面临的不确定性,进而提升决策的科学性。
4.“多因素”是工业对象的特性(复杂的动态系统)所决定的。
5.“因果性”源于工业系统对确定性的高度追求。为了把数据分析结果用于指导和优化工业过程,其本身就要高度的可靠性。
6.“强机理”是获得高可靠分析结果的保证。分析结果的可靠性体现在因果和可重复性,需要排除来自各方面的干扰。在数据维度较高的前提下,人们往往没有足够的数据用于甄别现象的真假。这时,领域中的机理知识实质上就起到了数据降维的作用,分析的结果必须能够被领域的机理所解释。
(摘编自 微信公众号 网络大数据 )