目录
《Building the Data Warehouse》第三章 设计
建造的两个主要方面——与操作型系统接口的设计和数据仓库本身的设计。但“设计”本身不是精确地描述,启发式的设计流程一般为,首先,载入一部分数据,供DSS分析员使用和查看。然后,根据最终用户的反馈,在数据仓库中修改、增添一些数据。
操作型数据——开始
建造数据仓库仅仅是数据的抽取过程错误——原因:操作型环境中的数据是非集成的。如下图
困难
集成
- 从操作型环境中适当地提取数据的编码过程——不同的数据类型,字段值必须正确地译码并采用合适的值重新写入记录仪;统一度量
- 字段转换,建立不同源字段到数据仓库字段的映射
性能
存取现存系统数据的效率
对全部文件数据进行扫描造成很大的浪费。
从操作型—->数据仓库的三种装载工作
装载档案数据
难度不大,操作频率低
装载在操作型系统中目前已有的数据
难度不大,只需要装载一次
装载数据库更新
最为困难。将自数据库上次刷新以来在操作型环境中不断发生的变化 (更新)从操作型环境中装载到数据仓库中。
数据仓库体系结构设计者的主要问题——扫描已有的文件,捕捉变化并对之进行处理