元数据技术规范书 元数据是描述数据仓库内数据的结构和建立方法的数据 [@more@]元数据技术规范书 元数据是描述数据仓库内数据的结构和建立方法的数据,可将其按用途的不同分为两类:技术元数据(Technical Metadata)和业务元数据(Business Metadata)。元数据管理涉及到数据仓库构造、运行、维护的整个生命周期,是数据仓库构建过程中十分重要的一环。 1. 元数据管理目标 通过了解不同系统所用数据的相关性,帮助集成这些系统 通过提供影响分析和标准化数据,支持快速修改并建立系统 利用对象概念和集中访问实现数据重复使用 帮助实施数据仓库 支持软件开发小组 2. 元数据管理要求 元数据应以数据库存储,方便数据库管理,便于维护、扩展。元数据库使用业界标准的DBMS,为数据库提供先进的工具和实用程序,提供强大的报表工具,同时使系统的可维护性、可访问性大大加强。 完全可扩展的元数据模型,满足新需求 添加或修改实体类型 添加或修改实体类型的连接 为实体或关系添加用户视图 添加、删除、修改关系或实体的属性 修改属性类型的允许值表 添加、定制命令宏 添加或修改用户出口 2 开放式架构:支持元数据联盟MDC(Meta Data Coalition)的开放信息模型OIM(Open Information Model)和OMG组织的公共仓库模型CWM(Common Warehouse Model)标准 2 支持通过扩展标记语言XML数据流等通用格式进行数据交换,使多种厂商的产品能够共享 2 支持嵌入式或全局定义元数据,文档类型数据(DTD),外部表文件。 2 支持第三方元数据管理工具 2 2 支持应用编程接口(API)接入,允许用户创建定制的应用和程序,满足他们特殊要求。将元数据与通过(API)操作的工具分开也是一种灵活的特性,工具可以通过API接口操作原数据,从而实现透明地访问数据,如果数据结构有所变化,工具并不需要修改,这样能够在企业的开放应用中提高效率和灵活性。 2 提供中央源数据控制点 中央元数据控制点,元数据库为整个企业的信息资产提供了记录。它能够保存数据的位置,生成和维护数据的主体,数据驱动的应用处理,与其它数据的关系,及数据的转换。不仅如此,元数据的中央控制点还能确保信息的一致性和准确性。 n 运行时管理 n 数据质量监控 2 提供影响分析机制 影响分析机制无需迫使用户查阅大量无用的信息,就能真正回答分析阶段的问题。不仅如此,高级影响分析功能还能更好地为系统的维护进行时间预测。它们还能减少因不完善的错误分析引起的重做工作。 2 提供版本修订能力 版本控制功能包括: n 测试和生产过程中(生命周期阶段)过程中的版本控制 n 独立版本控制 n 按部门进行版本控制 2提供强大的查询和报表功能 元数据库应当为企业用户提供强大的查询和报表生成途径。提供统计函数: 相关性、方差、最小二乘、线性回归, Rollup, Cube, Ranking。 2 提供强大的统计分析能力 n 提供统计函数: 相关性、方差、最小二乘、线性回归, Rollup, Cube, Ranking n 提供数据库一级多维分析能力 n 提供数据内置应用数据挖掘能力,支持神经网络群集,演示图群集,神经网络,线性回归,逻辑回归与多项式回归,决策树等算法 2数据仓库支持 元数据库能够提供对构筑数据仓库至关重要的运作数据位置和属性的信息。它就象是仓库数据的向导,负责保存定义移植环境所需的信息、从源点到目标的映射,转换要求,业务规则和建库的选择标准等。 3.元数据管理软件技术要求 2 可视化集成部署环境 2 可视化影响性分析 2 向导式变更管理 2 可视化数据部署情况实时监控 2 可视化数据对象编辑和设计 2 可视化整体元数据仓库展现 |
|