首頁 >產品中心>通用產品

MSP元數據倉儲平台

係統簡介

元數據倉儲提供各種資源元數據的采集、存儲、組織和發布,是實現機構內部資源整合與組織、知識發現與利用的基礎服務平台。它的主要業務功能是根據各資源元數據規範構建元數據模板,利用元數據采集適配器從各類數據源中抽取元數據信息,實現元數據的采集、存儲、檢索和發布。MSP內置了基於DC元數據規範的標準元數據庫和眾多常見資源類型的元數據模板,支持基於模板的資源元數據庫擴展與自定義。

元數據倉儲包括元數據采集、元數據存儲、元數據庫管理和元數據發布四個主要部分。建成一個良好的元數據倉儲,是信息服務的基礎,隻有擁有規範的和高質量的元數據,才有可能建成靈活實用的資源服務體係。

功能特點

1、基於DC元數據規範的標準元數據庫

2、靈活自定義和可擴展的元數據模板

3、多種元數據采集適配器,實現對非結構化文檔、數據庫、電子資源和互聯網等常用資源來源的元數據采集

4、安全可靠的數據存儲,支持海量數據的分布存儲

5、數據采集、數據存儲與數據發布的異步機製,有效提升係統性能

6、資源元數據的本地化存儲,實現用戶對元數據的自由組織和延伸利用

7、提供數據接口和API,具有較好的應用集成性

主要功能

元數據模板定製

在采集元數據前,需要根據各類資源的元數據模板建立元數據模板,設定相應的元數據字段名稱及數據類型。這項工作是通過數據網關來實現的。

元數據獲取要嚴格遵守設定的《元數據規範》。元數據倉儲的表結構及字段名稱應進行規範設計,以便於使多種不同的源數據庫在數據同步時盡可能做到字段統一管理。

元數據采集

針對不同的數據源,元數據倉儲提供了相應的數據網關和采集適配器來實現對元數據的采集和處理。

采集適配器包括:

Z39.50協議適配器

OAI-PMH接口適配器

常用關係型數據庫適配器

FTP適配器

文件目錄適配器

表單定製與錄入適配器

網絡信息爬蟲適配器

可根據數據源提供的接口定製適配器

元數據庫存儲

元數據庫可能會需要采集並存儲大量各類業務係統資源、電子資源與外部網絡資源的元數據信息。因此,從數據存取效率和存儲安全性考慮,建議元數據倉儲采取架構在多個物理服務器之上的分布式進行服務,支持數據分布存儲以及負載均衡兩種基本分布方式,並支持兩種方式的組合運用。

實現海量數據的無限擴展。

實現高並發用戶的高性能訪問。

實現高可靠性的檢索服務(無單點故障)。

實現本地管理(Manage Locally)和聯邦檢索(Federated Search)。

元數據庫管理

構建元數據庫倉儲一樣要有很好的維護性。元數據倉儲管理重點在於其中的數據,所以當數據有了新的變化,增加或減少,元數據倉儲管理端都應該能夠方便的進行處理。

當自建原數據庫內數據發生變化時,元數據庫需要隨之變化。

當增加新的自建數據庫時,元數據庫需要增加同步的數據庫量。

數據庫增加新內容或者增加新的數據庫,但是由於網絡環境不能實現同步,通過表單提交的元數據信息。

元數據發布

元數據發布主要通過三種方式:一是檢索,二是分類導航,三是關聯。

元數據倉儲支持所有元數據項內容的全文索引。通過全文檢索功能,實現對不同元數據項的信息檢索和組合檢索。支持多維度分類查看元數據倉儲中不同元數據庫中的相關資源。通過不同字段間的關聯分析,實現不同元數據記錄之間的關聯延伸。

元數據發布支持靈活定義元數據發布模版。在不同的模板中可以配製允許檢索和發布的元數據字段。係統預置規定的元數據發布模版。通過管理模塊,可配置元數據更新策略、元數據檢索策略、元數據發布策略、元數據模板管理等等。

元數據接口與互操作

元數據倉儲係統提供標準API,支持應用集成和二次開發,充分體現係統的開放性和標準性,實現了係統與數據的可擴展性和可複用性。

適用單位

適用於機構內部的各類異構信息資源的整合與組織,以及對信息管理與信息服務,知識管理與知識服務的應用需求。

分享到: