论坛与新闻
论坛与新闻

朝晖随笔(9) 工业大数据的本质作用是什么?

朝晖随笔(9):工业大数据的本质作用是什么?

(2018年9月25日)

“工业大数据有什么用?”。这是个俗不可耐的问题。但是,尽管我想过很长时间、也读过很多文章,每次谈到这个问题,又总是觉得没想清楚。为什么呢?有一天我突然意识到,是表达问题的“结构”没有梳理出来:很多人的答案仅仅是罗列。你或许可以罗列10条应用,为什么没有11条、12条呢?这10条为什么不能归结到7、8条呢?这些问题说不清楚,就是结构不清楚啊!换句话说,我们需要一个“结构”,来描述大数据的作用。在描述这个结构之前,需要澄清两个问题:

1. 大数据针对数据的一次应用还是二次应用

很多数据产生于业务系统、支撑业务的正常运行。如ERP、MES、PLM等。我们把这些数据称为一次应用。把业务系统中的数据存入数据仓库、大数据平台,进行分析、利用,称为二次应用。大数据前期的案例,主要针对二次应用。现在看来,谈论一次应用的人越来越多。如果包含了一次应用,就把大量的应用纳入了大数据讨论的范畴。数据一次应用的目的很清晰,二次应用则往往是探索性的。

2. 大数据是服务于现有业务的延伸和发展,还是创立新业务

在工业界,应用数字化方法早已不是什么新鲜事了。但是,很多应用受存储、计算、传递能力的限制,只能做些简单的工作。这时,随着业务需求的增长和创新,人们会考虑更大量的存储、更复杂的计算、更大范围的数据共享。如产品开发中的重用和协同。这时,如何提升数据的存储、计算和传递能力是关键要求。另外一种情况则是把大数据做为开展新业务的基础。如向设计和服务转型、开发智能产品等等。

现在来回答:工业大数据到底有什么用处。

为了把问题看清楚,我们先穿越到未来。我们发现:工业大数据是工业相关对象及过程在赛博空间的模型映像和历史痕迹的记录。换句话说,不单单是碎片化的记录和结果。数字化模型便于存储、优化、测试、共享、管理、协同。这样,很多研究和决策工作在赛博空间就做完了;很多工作可以远程控制、甚至自主执行。

要实现自主决策的目标,有两种做法。其中一种做法是:把人的知识变成代码,下载到计算机。大数据的产生,获取知识奠定了很好的基础。可以说:大数据是知识生产的原料。这种思路很好,但是中间有个拦路虎:人的很多知识(包括认知能力)是难以用程序来表达的。比如开车的知识就很难编程程序。这样,机器掌握的知识就是有限的,大量工作无法被机器代替。克服这种困难的根本途径,是让机器自动地获得知识:这种做法在过去很难做到,但在大数据的背景下就是可能的了。从某种意义上说,大数据的本质作用就是提升了机器学习能力,进而让机器掌握的知识更加完整,从而全面推进智能化。

从这种意义上说,大数据的本质作用是促进知识的生产、自动的生产,带动工业走向智能化、高端的智能化。所以,从长远处看,大数据最重要的作用,是带动业务的创新

下面我们再从未来回到当下。

当下数据状况不像理想的时候那么好。积累还不够、数据的质量还不够高、完整程度不够;收集、计算、存储、传递数据的成本还比较高。所以,与未来的目标相比,现在只能做一部分事情。

至于做什么事情合适,主要是看现实的条件和需求:满足哪些需求所获得的回报,大于为之创造或改善条件的付出。所以,推进大数据之前要算一算:合算就做、不合算就不做。当然,算不准也很正常:创新本来就有风险。但是,我们推崇的是那些能够算得比较准的人、而不是差个十万八千里的人——因为算得准的人做事靠谱。所以,从当前来看,大数据主要服务于对当前业务的延伸和发展

人们的另外一部分工作,就是奠定大数据的基础。如果大数据的作用,是通过提升知识生产能力。那么,大数据的基础工作也应该围绕着这个目标展开:如何建立大数据系统,以便于知识的生产。这个时候,数据的收集可能仍然来自一次应用,但却要为二次应用奠定基础。

(原创 郭朝晖)