中国MRO支撑平台技术社区

工业大数据架构分析（11）

工业大数据架构分析（十一）

（2019年3月17日）

如图4所示，并分述如下。

图4

采集交换层：数据的采集需考虑应业务需求有效且完整的获取各类系统的数据。鉴于采集的数据来源有内部系统、外部系统及非系统化的本地文件等，所以需要各系统之间进行数据交换，分别利用系统接口、网络爬虫转换文件格式储存及电子邮件方式等交换取得各数据。集成处理层：此层级运行包含SMC、DIF及KM。

该层主要考虑为各系统数据的关联整合，因此着重于数据清洗、数据理解及数据的关联，为分析层提供有效的模型处理能力。SMC提供基础的计算和存储资源；DIF主要支撑数据整合、数据处理运算、及信息呈现；KM主要接收各类型文档进行分类储存、解析文本，并利用Elasticsearch(一套支持全文检索的开源项目)建立索引库以及支持全文检索服务。

建模分析层：数据分析层包含三个项目，分别为DSP API、分析工作流、KM API。在分析层构建API主要是为特定业务需求构建分析工作流提供分析模型的支撑。

决策控制层：该层实现用户在单一平台内快速获取数据的需求，并快速开展业务分析。此外，知识库的构建可以满足工程师之间的技术传承及新人训练，帮助工程师自主学习成长，并减少沟通教学时间，可以让工程师的时间得到最有效的利用。

合理设计大数据系统的架构实现使得数据分析的效率大大提升，能够更好地支撑新产品制造NPI环节各种分析需求，使每个步骤都能快速达到客户要求。主要解决的问题可总结为以下几点：

1)时间短，数据整合收集所需时间大幅减少，由以前耗时2~4小时，提升至数分钟以内。

2)数据广，整个NPI周期大约会生产5万个产品，而NPI产线大约150个相关产品测试数据完整收集，涵盖400多个关键物料及平均2000个测试项目，特定工站更高达4万个测试项目，每日原始数据吞吐量可达22万笔。

3)效率快，工程师将原来数据收集的时间专注用来解决问题，并可利用剩余时间进一步分析预见问题。扭转过去80/20的时间分配法则，让工程师只用20%时间收集数据整理数据，而用80%时间专注在问题解决上。

4)传承快，前辈工程师将个人的经验累积于平台上，新人工程师可随时学习到前人的知识。

（未完待续）

（摘编自微信公众号信息通信技术联通智汇）