还剩9页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
元数据管理方案相同名称的元数据标准•元数据标准维护元数据管理方案元数据抽取
1.1为了简化元数据生成工作,系统提供自动生成元数据的功能,即元数据抽取经过元数据自动抽取,用户能够方便、快捷地获得大量的元数据信息抽取的对象
1.
1.1元数据抽取主要针正确对象有以下几种已有目录已建业务应用系统中现有的目录资源数据库各种数据库资源,包括关系型数据库、XML数据库等格式化电子文件电子文件,例如Word、PDF、XLS等文件元数据抽取的流程
1.
1.2元数据抽取的流程有4个主要步骤,分别为数据源信息获取解决要从哪个数据源获得元数据的问题内容/结构分析解决要从数据源中获得哪些元数据的问题元数据提取解决如何从数据源中获取元数据的问题存储入库解决元数据存储的问题电子文档的元数据抽取
1.
1.3对于电子文档,首先各部门的文档格式不尽相同,另外它们的安全级别也各不相同,同时由于信息化建设水平的不一致,有的部门文档分散在各处,有的部门文档是集中存放的,甚至已经建立了完善的电子系统进行管理针对以上状况,对于电子文档的元数据抽取需要进行以下的抽取流程•整理归档对于分散在各处的电子文档(纸质文档需要先进行电子化处理),必须由专人进行统一整理,根据公开共享的前提进行集中,这种集中能够是物理上集中的,也能够是逻辑上集中的但要满足以下原则,第一根据安全级别,便于外界访问;第二便于文档的增量发布;第三便于采集工具的自动化采集编目各部门只有在文档完全整理归档的情况下,进行自动化采集才是切实可行的在整理归档的时候,各部门根据各自情况进行归档,没有必要千篇一律,也没有必要制定繁琐和呆板的规则,只要能够满足以上的原则即可•根据安全级别,建立相应的访问机制由于受到安全级别的限制,因此对于需要共享的数据要进行安全方面的限制,限制的手段能够有用户名/密码、数字证书、物理隔断等等,根据实际情况建立安全访问机制,做到重要信息不泄露,不丢失编目处理现阶段,主流格式的电子文档,主要包含word、excelppt、pdf等对主流格式的电子文档,要提供自动采集工具进行编目处理采集的范围主要是文档的标题和内容,对于其它的元数据内容,要提供手工配置的方式进行辅助另外,在工具的采集效率上,要提高增量文档发布后的采集效率对于格式特殊、内容有加密算法的文档,是很难经过抓取工具进行采集的,这些文档主要经过手工编目的方式来处理对于存在管理库的文档,就需要对数据库来进行编目采集,详见数据库元数据抽取部分•保存元数据采集后的数据要放到数据库或者保存到硬盘上,另外要根据目录体系标准,把数据分解为元数据,然后进行存储数据库元数据抽取
1.
1.4数据中心需要抽取的数据库类型主要为Sql server,首先利用ETL工具从源数据库中将所需数据抽取至中心数据库基础业务库中,在利用元数据著录工具对抽取出来的数据进行元数据著录元数据著录
1.2根据《元数据标准》定义的元数据项,提供著录界面,针对每一个著录项的特点,提供文本框、列表框、复选框等录入形式元数据内容录入元数据内容录入用于元数据内容的录入处理,根据元数据库对各类信息元数据的定义,帮助和引导录入人员建立符合要求的信息资源元数据元数据内容录入动态地完成编辑元数据所需的处理,包括元素内容编辑组件动态生成、元素关系自动关联和元素值域检查等其中编辑组件动态生成功能根据元数据标准定义的元素数据类型和取值方式动态地确定界面编辑组件的形式,使界面极具友好性;元素关系自动关联保证了元素之间的约束关系能够被编辑器自动的处理,减少了由于编辑人员对标准的理解错误而产生元数据结构错误的可能;元素值域检查可对用户输入的数据的有效性进行判断,以确保元数据信息内容的正确性•标准逻辑分析元数据采集系统对描述元素的处理不依赖于特定的元数据标准,也就是说采集系统对元数据标准逻辑的分析和处理是独立于标准本身的采集系统的标准逻辑分析功能经过元数据标准的XML描述获得元素之间的制约关系、值域等处理逻辑因此编辑器能够很好的适应标准的不断更新和升级•元数据完整性检查为保证元数据的完整性,编辑器提供了元数据完整性检查功能利用该功能,编辑器能够在输出文档之前对各个描述元素的组织关系、元素内容的完整性加以检查,发现编辑过程中可能遗留的问题,并提示用户加以修正经过完整性检查的元数据将严格复合相应元数据内容标准所做的规定•联机帮助处理用于完成系统联机帮助的查询、显示操作元数据审核
1.3元数据审核主要用于元数据报送到数据中心接收数据库但还没正式发布到发布数据库的元数据元数据有效性审核分为自动审核与手动审核两个部分,数据在接受报送系统报送数据时会启动自动审核系统对数据进行初步的有效性审核,主要以过滤数据结构性错误为主,例如缺少字段、类型错误、编码缺失或不可识别字符编码等如果自动检查发现错误,会将错误数据放入问题数据栏,以便数据管理员进行人工审核,如果人工审核认为数据没有问题,可强制确认有效,系统会自动提交勘误报告给系统管员,作为自动审核功能改进的依据,如果数据管理员也认为数据有误,能够将元数据退回给报送系统,由报送系统转交给报送部门从新报送手工审核设计包括确认无误、退回重报、打印错误清单、直接更新元数据内容、打印元数据内容等功能,为了安全起见,更新元数据功能会记录详细的操作审计日志元数据发布如果接受数据库中的元数据已经经过审核(手动或
1.4自动),元数据将自动进入待发布流程,能够从元数据管理平台的待发布数据栏中看到所有等待发布的数据,数据管理能够在此页面中看到所有等待发布的数据,并作最后确认,系统在等到发布确认消息后会成批的将所有报送上来的原数据从接受数据库中转移到发布数据库中,完成正式的发布过程,同时发送消息给报送单位,提示发布成功元数据发布审核设计包括确认发布、确认无效、打印发布清单、直接更新元数据内容、打印元数据内容等功能,为了安全起见,更新元数据功能会记录详细的操作审计日志元数据入库
1.5当元数据著录完成并经过语法检查后,可经过目录服务上传到元数据库中•元数据检查元数据检查是指检查员对操作员生成的元数据进行合法性检查主要检查信息资源元数据的内容、格式符合标准规范的要求,信息资源元数据内容必须符合《元数据规范》的要求形式化审核工作由工作系统自动完成其它非形式化的审核工作,例如资源分类是否准确、主题词提取是否准确等等,需要由检查员完成未经过审核要求的政务信息资源元数据需要操作员重新修订后提父•元数据入库元数据经过检查后上传到元数据库中存储元数据维护
1.6元数据维护主要用于维护、查看已发布的元数据,由于元数据发布需要经过严格的审核流程,一旦审核经过,原则上元数据的更改需要重新走元数据申报流程,包括已发布元数据的实效申请和新元数据的添加申请,而不允许对已发布的元数据进行直接修改但为了应急,特设立了此功能,但此功能只能开放给核心管理用户使用,为了安全起见,元数据维护功能的所有操作都记录到操作审计日之中去普通管理员只有查看、检索元数据的权限而管理员除了具有查看、检索元数据权限外,能够使用新增目录的功能,将元数据字典中定义的目录结构添加到现有的目录中去,而且能够修改、更新、删除元数据元数据维护设计包括根据元数据字典创立目录、打印现有目录结构、根据目录发现、查找元数据、查看元数据内容等功能,核心管理层还能够查询、修改、删除、移动已经发布的元数据内容元数据查法
1.
6.1系统提供基于元数据项的查询功能,用户在输入需要查询的信息后,系统自动搜索数据集的元数据信息,返回相关的查询结果元数据浏览
1.
6.2在数据集查询界面,系统以列表的形式展现重点元数据信息内容,若用户需要查看元数据详细信息,能够点击查看元数据属性按钮,浏览详细的元数据信息注图中数据为示例数据,仅为更好的提供具体展现设计使用,不代表现实情况元数据更新
1.
6.3元数据更新采用两种模式,一种是基于单个数据集的元数据信息修改模式用户能够点击修改按钮对该数据集的元数据信息进行修改,修改完成后提交审核另一种模式是元数据库批量更新元数据删除
1.
6.4系统提供元数据删除的功能没有经过审核的元数据信息能够由创立者或管理员完成,对于已发布的元数据须由管理员进行删除元数据配置管理
1.7系统提供元数据类别标准的管理和配置功能•元数据属性维护原数据属性包括字符型、数字型、日期型、大字段型、Bool型等多种类型点击保存按钮能够保存该元数据标准,保存时判断是否存在。