论坛与新闻
论坛与新闻

释放工业大数据价值(4)

释放工业大数据价值(四)

(2016年9月1日)

PPT12

工业大数据从哪里来?来源于产品生命周期的各个环节,包括市场、设计、制造、服务、再利用各个环节,每个环节都会有大数据。“全”生命周期汇合起来的数据更大。当然,企业外、产业链外的“跨界”数据也是工业大数据“不可忽视”的重要来源。

PPT13

要利用好机器大数据,需要突破几类核心技术

首先是数据怎么管理的问题。海量的机器型数据如时间序列、时空数据等高速采集完成后,需要把它存下来,这涉及到数据有效打包、压缩、放置的问题。数据存下来是为了被利用,这需要支持快速定位查询到应用需求的数据,而这又是一个如何建立高效的时空数据索引的问题。

PPT14

数据存好管好了,下一个问题就是如何支持各种分析。做过实际分析的人都知道,分析绝不仅仅是开发一堆算法的问题。算法只是一小部分工作,大部分的工作是根据对业务问题的理解选取需要的数据,理解数据的特征,然后根据特征设计一个合适的模型和算法。这中间数据特征的理解对机器大数据来说是很难的。因为机器数据不能为人所直观理解,需要交互特征工程。此外,从模型和算法的层面,机器数据往往是对一个物理世界系统的感知结果,而物理世界有许多机理性的原理存在,比如机械领域涉及力学原理,冶金领域涉及化学原理,因此机器大数据的分析需要有机结合机理模型和数据统计模型。还有一个常常被忽略的问题是数据质量的问题——如何把握数据质量,如何修正数据质量。

PPT15

(原题目:【干货】清华陆薇:释放工业大数据价值)

(待续)

(摘编自 微信公众号:数据派 \ 编辑 严进军)