论坛与新闻

MRO科研团队成果展示3

MRO科研团队研究成果展示(三)

基于特征模式的状态监测时间序列检索方法研究

(2015年8月3日)

为实现产品全生命周期的信息化管理,状态监测技术得到了越来越广泛的应用,状态监测“大数据”深入人心。本项目提出的“基于特征模式的状态监测时间序列检索方法”,旨在从海量历史状态监测数据中快速查找出与目标时间序列相似的结果,为分析人员研究设备工作状态、分析重大品质问题等工作提供数据基础,进而在设计、生产、运营和维护过程中帮助改进产品质量和制造工艺,具有较强的实用性。本项目完成的主要工作如下:

(1) 提出了状态监测时间序列特征向量提取的模型:该模型包括数据筛选、数据切片、数据清洗、数据对齐和特征提取五个步骤,即先选定业务相关的时间序列范围,然后通过时间切片将每个时间序列切分成多个可以代表设备工作状态的子序列,再根据需要去除掉过短和过长的序列,并将每个序列对齐成时间间隔相等的标准序列,最后再利用小波变换的方式提取出序列的形状特征信息。该模型充分结合了领域知识即数据挖掘中预处理的概念,具有较好的实用性。

(2) 提出了状态监测时间序列特征模式发现的模型:该模型以特征向量提取模型输出的特征向量集合为输入,先根据特征向量的维度进行特征分桶步骤,确保每个特征向量桶中的数据等维度,且数据量满足聚类算法的要求,然后分别对各特征向量桶聚类,不断尝试不同的聚类结果,选择衡量指标(轮廓系数)趋于稳定的结果,并将各类中心作为发现的特征模式,代表一组时间序列的数据变化趋势。

(3) 提出了状态监测时间序列检索的模型:该模型以特征模式发现模型输出的特征模式集合为出发点,将状态监测时间序列原始数据进行符号化,然后结合互联网搜索引擎中倒排文档的思想,建立以特征向量桶为一级索引项、以特征模式序列为二级索引项、以属于特征模式的子序列及它们的相似度构成倒排列表的模式索引库,并对用户输入的查询序列进行检索,给出按照相似程度排序的查询结果。

(4) 进行了基于特征模式的时间序列检索实验:实验使用三一集团生产、销售、运营的混凝土泵车状态监测数据,并选择其中“液压油温度”这一监测类型进行实验。实验按照特征向量提取、特征模式发现、时间序列检索的顺序依次执行,并通过数字和图表展示了各个步骤的处理结果。最后,进行了几组真实序列的查询,将结果以曲线图的方式直观地展示出来,验证了本方法的可行性。

(5) 实现了基于特征模式的时间序列检索工具:在本文提出的时间序列检索方法的基础上,给出了检索系统的架构设计及部署情况,该系统使用基于Cassandra的非结构化数据库来组织数据处理的中间结构、使用文件系统存储索引信息,并结合基于Hadoop的分布式计算处理框架来支撑数据处理的运行时引擎,最后为上层用户提供时间序列检索、索引任务定制和数据分布预览的功能。最后,展示了工具各个功能的界面图,进一步验证了本文提出的方法的适用性。

(本文摘编自同题目硕士生毕业论文 / 作者 许鹏 / 导师 张力教授 / 编辑 严进军 )