工业大数据:始于业务,止于业务(1)
工业大数据:始于业务,止于业务(一)
(2016年7月4日)
原文导读:美林公司认为传统的数据仓库理论是建立在结构化业务数据的基础上,是工业大数据的重要组成部分之一。其难点在于从千变万化的业务中找到稳定的数据结构,又能方便的支撑业务数据的统计和分析,下面重点阐述业务数据如何从业务中来又如何到业务中去。
我们将工业大数据分为公共资源数据、工程类数据、管理类数据和物联数据。其中管理类数据一般也称业务数据,即由业务活动产生的记录。传统的数据仓库理论将业务数据的管理理论和应用模式发展到一个很成熟的水平,目前无论制造企业还是IT公司在谈工业大数据时,更多是按照数据仓库理念在进行企业数据的管理和应用。
美林公司认为传统的数据仓库理论是建立在结构化业务数据的基础上,是工业大数据的重要组成部分之一。其难点在于从千变万化的业务中找到稳定的数据结构,又能方便的支撑业务数据的统计和分析,下面重点阐述业务数据如何从业务中来又如何到业务中去。
数据管理的基础理论
数据管理是利用计算机硬件和软件技术对数据进行有效的收集、存储、处理和应用的过程,其核心是数据组织。为了能够对数据进行有效组织,演化出了主题域、主题、子主题等概念,这几个概念是建立起虚拟的数据分类关系,如一颗大树不断的分叉直到挂接到某几个关系相对稳定的数据模型。元数据是数据的数据,用来对数据属性进行定义,比如人的元数据包括姓名、电话、年龄等。数据实体就是数据模型的实体化,比如人的数据实体包括例如:张三、135XXXX5678、30岁等。具体关系如下图所示:
图1
小结一下,业务域、业务主题域、业务子主题域等的划分都是虚拟的,元数据是对业务实体的属性定义(目前我们将编码规则和编码值当成元数据的重要属性进行管理),其目的是为了方便数据实体的查询、检索和维护,都是数据标准的重要组成部分。数据实体对于具体的物理实体,根据应用和管理需要分为主数据、业务数据、主题分析数据。
(原题目:观点:工业大数据:始于业务,止于业务)
(未完待续)
(摘编自:微信公众号 大数据每日精选 美林数据 / 编辑 严进军)