论坛与新闻
论坛与新闻

工业大数据:工业价值转型新视角(3)

工业大数据:工业价值转型新视角(三)
(2017年9月19日)

工业大数据的3B与3C
  什么是工业大数据?
一提到大数据,人们首先会想到在互联网和商业等环境中,利用大量的行为数据来分析用户行为和预测市场趋势等应用。但是对工业大数据的定义和应用却很难直观地理解和想象。现在对大数据最为流行的定义来自于维克托•迈尔-舍恩伯格和肯尼斯•克耶编写的《大数据时代》中提出的4V特性,即Volume(数据量大)、Velocity(流动速度快)、Veracity(准确性难把握)、和Variety(来源多样性)。这个定义是针对互联网和社会环境中的大数据,从数据工程的技术挑战方面所提出的。而工业大数据的挑战和目的则要通过“3B”和“3C”来理解:
工业大数据应用的“3B”挑战:
- Bad Quality: 在工业大数据中,数据质量问题一直是许多企业所面临的挑战。这主要受制于工业环境中数据获取手段的限制,包括传感器、数采硬件模块、通信协议、和组态软件等多个技术限制。对数据质量的管理技术是一个企业必须要下的硬功夫。
- Broken: 工业对于数据的要求并不仅在于量的大小,更在于数据的全面性。在利用数据建模的手段解决某一个问题时,需要获取与被分析对象相关的全面参数,而一些关键参数的缺失会使分析过程碎片化。举例而言,当分析航空发动机性能时需要温度、空气密度、进出口压力、功率等多个参数,而当其中任意一个参数缺失时都无法建立完整的性能评估和预测模型。因此对于企业来说,在进行数据收集前要对分析的对象和目的有清楚的规划,这样才能够确保所获取数据的全面性,以免斥巨资积累了大量数据后发现并不能解决所关心的问题。
- Background (Below the Surface): 除了对数据所反映出来的表面统计特征进行分析以外,还应该关注数据中所隐藏的背景相关性。对这些隐藏在表面以下的相关性进行分析和挖掘时,需要一些具有参考性的数据进行对照,也就是数据科学中所称的“贴标签”过程。这一类数据包括工况设定、维护记录、任务信息等,虽然数据的量不大,但在数据分析中却起到至关重要的作用。

(未完待续)


(摘编自:控制工程网)