目录
上一篇:数据仓库4.2_数据治理_数据质量管理https://blog.csdn.net/weixin_43875878/article/details/120842030
0 参考列表
数据仓库全流程https://blog.csdn.net/huang66666666/article/details/102556874 本文仅供自己学习,如有侵权请联系我删除.
1 元数据分类
元数据管理贯穿于整个系统的建设过程中,元数据是描述数据的数据.元数据不但是独立存放,而且对用户是透明的,标准元数据之间可以互相转换
①技术元数据:表怎么创建的,字段类型、外部表还是内部表、分区表;
②业务元数据:表与表之间的转换依赖关系,业务规则;
③管理元数据:表有哪些人管理维护;谁拥有该表的权限.
2 具体的元数据
(1) 在数据开发阶段
源数据的描述定义:类型、位置、结构.
数据转换规则:编码规则、行业标准.
目标数据仓库的模型描述:星型/雪花模型定义,维/事实结构定义.
源数据到目标数据仓库的映射关系:函数/表达式定义.
代码:生成转换程序、自动加载程序等.
(2) 在数据管理阶段
汇总数据的描述:汇总/聚合层次、物化视图结构定义.
历史数据存储规则:位置、存储粒度.
多维数据结构描述:立方体定义、维结构、度量值、钻取层次定义等.
(3) 在数据展现阶段
报表的描述:报表结构的定义.
统计函数的描述:各类统计分析函数的定义.
结果输出的描述:图、表输出的定义.