2015年工业与制造业大数据分论坛集锦(2)
2015年工业与制造业大数据分论坛集锦(二)
(2016年6月16日)
宝钢中央研究院首席研究员郭朝晖:让需求拉动工业大数据
郭朝晖研究员分享的主题是“让需求拉动工业大数据”。他以“只有创造价值工业大数据才有生命力技术才能真正在企业落地”这句名言展开了演讲。但工业大数据以及数据挖掘技术,很少能取得预想中的成功。工业界对可靠性的要求相当之高,技术可靠与否决定其价值高低。数据的约束的常常让分析往往不了了之。郭朝辉谈到对已有样本的判断准确,绝不等于对新样本的判断正确。数据质量严重影响分析结果,当数据本身误差和检测范围处于同一数量级时,就意味着检测不存在价值。所以,他解释到误差最小的可能不是最好的,存在差的外延性。这里他用自己在宝钢建模型抓错误数据的事例加以证明。数据质量,导致分析出来的结果很有可能是错的。
宝钢中央研究院首席研究员 郭朝晖
同时,也存在实际隐性的非随机系统干扰过多、工业系统的普遍复杂性的问题,使得各种经典统计和检验方法失效,从而难以得出正确的结论。工业是一个系统,如果不从整体上、联系上掌握事实,结果往往不可靠。在工业过程分析一定要重因果否则很难达到可靠的要求。
工程师常根据经验和知识,采用前馈、反馈手段;构成复杂的系统。但是仅看相关性还是不够的工业过程分析一定要重因果否则很难达到可靠的要求。
所以,他认为大数据和工业大数据必须区分开来,否则必然产生认识错误。要实现大数据的可靠性,需要将统计和机理相结合。对于大数据而言,场景显得尤为重要,针对个别案例的分析价值更大,GE的设想:很好,但普通企业难复制。大数据是对事物发生痕迹的数字化记录,为人们奠定了“用数据说话的条件”。大数据是业务系统产生数据的二次应用,可用于企业管理水平,用大数据提高管理水平,或许适合很多中国企业。在此他分享了自己经验:不仅要记录数据,还要记录数据产生和收集过程;要用好工业大数据,最好事先想好怎么用,将应用于工作流程结合起来。
演讲结尾,郭朝晖再次重申:用好工业大数据,请先把“大”字忘掉:应首先专心于价值创造的逻辑,未来不缺数据,缺少的是提炼能力!
(原题目:【BDTC2015】工业与制造业大数据分论坛:宝钢、三一重工的实践及智能制造技术进展)
(未完待续)
(摘编自 电脑玩物中文网 \ 编辑 严进军)