数据仓库 (Data Warehouse)

数据仓库 (Data Warehouse)


发布日期: 1970-01-01 更新日期: 2015-02-03 编辑:giser 浏览次数: 3659

标签:

摘要: 近年来,人们逐渐认识到计算机系统存在两类不同的处理:操作型处理和分析型处理。 操作型处理也叫事务型处理,是指对数据库联机进行的日常操作,通常是对一个或一组记录的查询和修改,主要为企业特定应用服务,对此人们关心的是响应时间、数据的安全性和完整性。 分析型处理是用...

近年来,人们逐渐认识到计算机系统存在两类不同的处理:操作型处理和分析型处理。

操作型处理也叫事务型处理,是指对数据库联机进行的日常操作,通常是对一个或一组记录的查询和修改,主要为企业特定应用服务,对此人们关心的是响应时间、数据的安全性和完整性。

分析型处理是用于管理人员的决策分析,例如决策支持系统、专家系统和多维分析等,经常要访问大量的历史数据。

两者的巨大差别使得操作型处理和分析型处理的分离成为必然,于是数据库由操作型环境发展成为操作型环境和分析型环境的新体系化环境。在此新体系环境中数据仓库处于核心地位,它是建立决策支持系统的基础。 数据仓库是指面向主题的、集成的、稳定的、随着时间变化的数据集合,用以支持管理决策。

这一定义指出了数据仓库的目标是为了制定管理的决策提供支持信息。正象企业为了发展要进行业务重组一样,为了支持管理决策需要也要按决策业务科目的要求重组在线事务处理(OLTP)系统中的数据,并要按不同决策,分析内容分别组织使之方便使用。也就是说,数据仓库是一种把收集的数据转变成有意义的信息技术。

数据可以来源于许多不同的数据源,包括不同的数据库系统,甚至来源于不同的操作系统。 在把数据装载到数据结构重组后的数据仓库之前,先要进行数据集成处理。这一处理包括几个必不可少的操作步骤,以做到使数据完整、统一,这就确保了在使用数据仓库时其中的数据是有质量保证的。简而言之,集成就是保证数据准确、到位、没有超出应有的数值范围、没有重复等。

数据仓库中的数据不像在线事务处理系统中的数据那样频繁的修改,所以它是比较稳定的(极少或根本不修改)。在一次数据分析的执行过程中使用的数据不得变更,才能保证两次在使用同一组信息进行分析时不会得出不同的答案。数据仓库一般是按周、月或隔月从在线事务处理系统周期性地更新数据。

关注公众号
获取免费资源

随机推荐


Copyright © Since 2014. 开源地理空间基金会中文分会 吉ICP备05002032号

Powered by TorCMS

OSGeo 中国中心 邮件列表

问题讨论 : 要订阅或者退订列表,请点击 订阅

发言 : 请写信给: osgeo-china@lists.osgeo.org