数据仓库(三)

目录

《Building the Data Warehouse》第三章 设计

建造的两个主要方面——与操作型系统接口的设计和数据仓库本身的设计。但“设计”本身不是精确地描述,启发式的设计流程一般为,首先,载入一部分数据,供DSS分析员使用和查看。然后,根据最终用户的反馈,在数据仓库中修改、增添一些数据。

操作型数据——开始

建造数据仓库仅仅是数据的抽取过程错误——原因:操作型环境中的数据是非集成的。如下图

困难

集成

  • 从操作型环境中适当地提取数据编码过程——不同的数据类型,字段值必须正确地译码并采用合适的值重新写入记录仪;统一度量
  • 字段转换,建立不同源字段到数据仓库字段的映射

性能

存取现存系统数据的效率

对全部文件数据进行扫描造成很大的浪费。

从操作型—->数据仓库的三种装载工作

装载档案数据

难度不大,操作频率低

装载在操作型系统中目前已有的数据

难度不大,只需要装载一次

装载数据库更新

最为困难。将自数据库上次刷新以来在操作型环境中不断发生的变化 (更新)从操作型环境中装载到数据仓库中。

数据仓库体系结构设计者的主要问题——扫描已有的文件,捕捉变化并对之进行处理

时基变化

本文标题:数据仓库(三)

文章作者:松子

发布时间:2019年04月11日 - 09:04

最后更新:2022年03月26日 - 02:03

博文链接:https://songzi.info/post/fea0489f/

许可协议: 署名-非商业性使用-禁止演绎 4.0 国际 转载请保留原文链接及作者。

0%