王建民:工业大数据技术综述(3)
王建民:工业大数据技术综述(三)
(2018年11月26日)
3、工业大数据的特征
工业大数据作为对工业相关要素的数字化描述和在赛博空间的映像,首先符合大数据的4V特征[4],即大规模(volume)、速度快(velocity)、类型杂(variety)、低质量(veracity)。相对于其他类型大数据,工业大数据还具有反映工业逻辑的多模态、强关联、高通量等新特征。
多模态是指工业大数据必须反映工业系统的系统化特征及其各方面要素,包括工业领域中“光、机、电、液、气”等多学科、多专业信息化软件产生的不同种类的非结构化数据。比如三维产品模型文件不仅包含几何造型信息,还包含尺寸、工差、定位、物性等其他信息;同时,飞机、风机、机车等复杂产品的数据又涉及机械、电磁、流体、声学、热学等多学科、多专业。
强关联反映的是工业的系统性及其复杂动态关系,不是数据字段的关联,本质是指物理对象之间和过程的语义关联。包括产品部件之间的关联关系,生产过程的数据关联,产品生命周期设计、制造、服务等不同环节数据之间的关联以及在产品生命周期的统一阶段涉及的不同学科不同专业的数据关联。
高通量即工业传感器要求瞬时写入超大规模数据。嵌入了传感器的智能互联产品已成为工业互联网时代的重要标志,用机器产生的数据代替人产生的数据,实现实时的感知。从工业大数据的组成体量上来看,物联网数据已成为工业大数据的主体。以风机装备为例,根据IEC61400-25标准,持续运转风机的故障状态,其数据采样频率为50 Hz,单台风机每秒产生225 KB传感器数据,按2万台风机计算,如果全量采集,则写入速率为4.5 GB/s。总体而言,机器设备产生的时序数据的特点包括海量的设备与测点、数据采集频度高(产生速度快)、数据总吞吐量大、7×24 h持续不断,呈现出“高通量”的特征。
4、工业大数据与企业信息化
企业信息化数据是工业领域传统数据资产,也是工业大数据的第一个来源。在传统制造业企业信息化系统中,广义产品生命周期管理(product lifecycle management, PLM)系统主要支持产品开发,企业资源计划(enterprise resource planning, ERP)系统负责“人财物、产供销”,供应链管理(supply chain management, SCM)系统协调供应链,客户关系管理(customer relationship management, CRM)系统服务于企业客户和用户,制造企业生产过程执行系统(manufacturing execution system, MES)负责制造执行,维护、维修和运营(maintenance, repair and operations, MRO)系统支持售后服务等。这些企业信息化系统积累的产品研发数据、生产制造数据、物流供应数据以及客户服务数据多以结构化数据的形态存储在企业数据库系统中,计算机辅助设计(computer aided design, CAD)、仿真等研发软件产生的非结构化工程数据则通过文件方式管理。
在企业信息化领域,信息系统是数据和流程的综合体,二者联系紧密。图5是波音公司20多年前“以数据为中心”的信息化架构。20世纪90年代,随着空中客车公司的崛起,波音公司危机四伏,订单下降,美誉度也随之下降。危难之际,波音公司当时新上任的董事长武达德特别注重波音公司信息系统建设,成功解决了“信息孤岛”问题,极大地改善了波音公司业绩。具体方法就是以数据为中心,把产品数据、工艺数据、项目数据等有机融合在一起,构成逻辑上的单一产品数据源,然后在数据集上重构业务流程。从客服到客户,提供端到端的服务模式,让业务流程围着数据转。由此可见,流程是产生数据的来源,也是消费数据的归宿,数据是支持流程无缝、高效运行的原材料,二者不可分离。
图5 波音公司“以过程为中心”与“以数据为中心”信息化对比分析
(未完待续)
王建民(1968?),男,博士,教授、博士生导师、清华大学信息科学技术学院(一级院系)副院长,清华大学软件学院院长,数据科学研究院副院长、管理委员会副主任,大数据系统软件国家工程实验室执行主任,工业大数据系统与应用北京市重点实验室主任。主要研究方向为大数据系统软件、工业大数据、产品全生命周期管理、业务过程管理等。
(摘编自 公共微信号 BDR 大数据期刊)