论坛与新闻

MRO科研团队成果展示(3)

清华大学软件学院MRO科研团队成果展示(三)

工业状态监测数据画像技术研究

(2016年7月22日)

随着传感器和通信技术的不断发展,状态监测技术被越来越多地应用于工业领域,随之而产生了大量的状态监测数据。对工业状态监测数据的分析可以帮助企业改进产品的设计、尽早发现设备的异常以及找出设备故障的原因等等。然而,工业状态监测数据通常具有数据量大、数据维度高、数据类型复杂和数据质量差等特点,这给数据分析带来了巨大的不便。为了使分析人员能够对工业状态监测数据有清晰的认识,从而准确地定位分析目标并采取恰当的分析方法,亟需研究能够全面透彻地描述工业状态监测数据的特征与方法。

针对以上的问题,本文完成的主要工作如下:

一、提出了从概况特征、质量特征和复杂特征三个方面来对工业状态监测数据画像:目前并没有专门针对工业状态监测数据画像的研究,本文在已有的数据画像相关研究基础之上,结合工业状态监测数据与传统关系数据的不同,针对当前工业状态监测数据分析所面临的问题,把工业状态监测数据的画像分为了概况特征画像、质量特征画像和复杂特征画像三个部分。

二、儿提出了工业状态监测数据画像的七个概况特征,并给出了形式化描述:本文在传统数据画像的基础之上,分析工业状态监测数据的特点,根据工业状态监测数据分析的需求,提出了维度、时间跨度、数据点数、取值范围、数值分布、回传周期和工作单元七个概况特征,形式化的描述清楚地展示了如何对一个工业状态监测数据集进行概况特征画像。

三、提出了工业状态监测数据画像的四个质量特征,并给出了形式化描述:本文首先分析了影响工业状态监测数据质量的三个主要原因,然后根据这些原因造成的数据质量问题,并基于数据质量管理的完整性、准确性和一致性要求,提出了数据的缺失率、准确率、时标对齐率和数值一致率四个质量特征,形式化的描述清楚地展示了如何对一个工业状态监测数据集进行质量特征画像。

四、提出了工业状态监测数据画像的四个复杂特征,并给出了形式化描述:针对数据分析中常用的基础分析工作,为避免简单分析工作的重复,同时为分析人员提供思路,提出了工业状态监测数据画像的四个复杂特征,即单调性、相关性、波动性和聚类特征。

五、 设计了工业状态监测数据画像框架:结合本文对工业状态监测数据画像的理论研究,提出了框架的八个整体设计目标,并划分为了三个业务需求,最后设计了六个实现模块共同组成了整个框架。该框架允许用户进行定制扩展,具有一定的通用性。

六、实现了一个工业状态监测数据画像工具:基于工业状态监测数据画像框架的设计,本文实现了一个工业状态监测数据画像工具,该工具使用NoSQL数据库Cassandra存储原始状态监测数据和工作单元数据,用关系型数据库MySQL存储画像特征数据,以国内某工程机械设备厂商的状态监测数据集为例,介绍了工具的使用及画像结果,并以具体应用案例说明了工具在工业状态监测数据分析中的作用。

本文整体技术路线

(本文摘编自同题目硕士生毕业论文 / 作者 梁佳宾 / 导师 张力教授 / 编辑 严进军)