首页 >产品中心>通用产品

MSP元数据仓储平台

系统简介

元数据仓储提供各种资源元数据的采集 、存储 、组织和发布  ,是实现机构内部资源整合与组织 、知识发现与利用的基础服务平台。它的主要业务功能是根据各资源元数据规范构建元数据模板  ,利用元数据采集适配器从各类数据源中抽取元数据信息  ,实现元数据的采集 、存储 、检索和发布。MSP内置了基于DC元数据规范的标准元数据库和众多常见资源类型的元数据模板  ,支持基于模板的资源元数据库扩展与自定义。

元数据仓储包括元数据采集 、元数据存储 、元数据库管理和元数据发布四个主要部分。建成一个良好的元数据仓储  ,是信息服务的基础  ,只有拥有规范的和高质量的元数据  ,才有可能建成灵活实用的资源服务体系。

功能特点

1 、基于DC元数据规范的标准元数据库

2 、灵活自定义和可扩展的元数据模板

3 、多种元数据采集适配器  ,实现对非结构化文档 、数据库 、电子资源和互联网等常用资源来源的元数据采集

4 、安全可靠的数据存储  ,支持海量数据的分布存储

5 、数据采集 、数据存储与数据发布的异步机制  ,有效提升系统性能

6 、资源元数据的本地化存储  ,实现用户对元数据的自由组织和延伸利用

7 、提供数据接口和API  ,具有较好的应用集成性

主要功能

元数据模板定制

在采集元数据前  ,需要根据各类资源的元数据模板建立元数据模板  ,设定相应的元数据字段名称及数据类型。这项工作是通过数据网关来实现的。

元数据获取要严格遵守设定的《元数据规范》。元数据仓储的表结构及字段名称应进行规范设计  ,以便于使多种不同的源数据库在数据同步时尽可能做到字段统一管理。

元数据采集

针对不同的数据源  ,元数据仓储提供了相应的数据网关和采集适配器来实现对元数据的采集和处理。

采集适配器包括:

Z39.50协议适配器

OAI-PMH接口适配器

常用关系型数据库适配器

FTP适配器

文件目录适配器

表单定制与录入适配器

网络信息爬虫适配器

可根据数据源提供的接口定制适配器

元数据库存储

元数据库可能会需要采集并存储大量各类业务系统资源 、电子资源与外部网络资源的元数据信息。因此  ,从数据存取效率和存储安全性考虑  ,建议元数据仓储采取架构在多个物理服务器之上的分布式进行服务  ,支持数据分布存储以及负载均衡两种基本分布方式  ,并支持两种方式的组合运用。

实现海量数据的无限扩展。

实现高并发用户的高性能访问。

实现高可靠性的检索服务(无单点故障)。

实现本地管理(Manage Locally)和联邦检索(Federated Search)。

元数据库管理

构建元数据库仓储一样要有很好的维护性。元数据仓储管理重点在于其中的数据  ,所以当数据有了新的变化  ,增加或减少  ,元数据仓储管理端都应该能够方便的进行处理。

当自建原数据库内数据发生变化时  ,元数据库需要随之变化。

当增加新的自建数据库时  ,元数据库需要增加同步的数据库量。

数据库增加新内容或者增加新的数据库  ,但是由于网络环境不能实现同步  ,通过表单提交的元数据信息。

元数据发布

元数据发布主要通过三种方式:一是检索  ,二是分类导航  ,三是关联。

元数据仓储支持所有元数据项内容的全文索引。通过全文检索功能  ,实现对不同元数据项的信息检索和组合检索。支持多维度分类查看元数据仓储中不同元数据库中的相关资源。通过不同字段间的关联分析  ,实现不同元数据记录之间的关联延伸。

元数据发布支持灵活定义元数据发布模版。在不同的模板中可以配制允许检索和发布的元数据字段。系统预置规定的元数据发布模版。通过管理模块  ,可配置元数据更新策略 、元数据检索策略 、元数据发布策略 、元数据模板管理等等。

元数据接口与互操作

元数据仓储系统提供标准API  ,支持应用集成和二次开发  ,充分体现系统的开放性和标准性  ,实现了系统与数据的可扩展性和可复用性。

适用单位

适用于机构内部的各类异构信息资源的整合与组织  ,以及对信息管理与信息服务  ,知识管理与知识服务的应用需求。

分享到: