数据仓库不应让传统关系数据库来实现,因为关系数据库最少也要求满足第1范式,而数据仓库里的关 系表可以不满足第1范式。面向分析的存储系统
数据仓库特点:
1.、面向主题(Subject Oriented)
1> 面向主题特性是数据仓库和操作型数据库的根本区别
操作型数据库是为了支撑各种业务而建立,而分析型数据库则是为了对从各种繁杂业务中抽象出来的分析主题(如用户、成本、商品等)进行分析而建立
2> 面向主题跟面向应用相对应
面向应用是指实现某种功能,数据集合也是其单一功能的数据集。
面向主题是指为了实现某个主题而产生的一个或多个的面向应用的数据集合的整合
例如:支付是一个面向应用的主体,而交易是一个面向主题的主体。因为交易是从下单,到支付等的一系列的过程的串联,支付只是其中的一环
2、集成性(Integrated)
集成性是指数据仓库会将不同源数据库中的数据汇总到一起,把不同类型的数据源的数据进行整合,
按照统一的形式进行集成。比如性别在一个数据源用男/女 另一个用1/2,那么在数据仓库中我们需要对其进行统一
集成主要有两种形式:
1.数据的集成
多条信息中的零散信息集成起来
2.编码的集成
在车险部门顾客的性别是用(m、f)表示的,而人寿部门应用系统中是用(男女)表示的,比如还有用(xy)表示。当进入数据仓库前要进行统一的编码
3、历史性或反映历史变化或时变的(Time Variant) –variant含义:adj 不同的
较之操作型数据库,数据仓库的时间跨度通常比较长。前者通常保存几个月,后者可能几年甚至几十年
时变性是指数据仓库包含来自其时间范围不同时间段的数据快照。有了这些数据快照以后,用户便可将其汇总,生成各历史阶段的数据分析报告
数据仓库可以存储历史信息,根据这些历史信息进行数据的分析来反映历史的变化
4、相对稳定的(Non-Volatile)
数据一般有一定的生命周期,历史的数据一般不会再改变
数据仓库数据的操作一般是加载和查询、分析,一般不进行任何修改操作,当超过一定期限之后才会被删除