开放关联数据的音乐资源整合研究
目录
摘要 1
关键词 1
Abstract 1
Key words 1
引言 2
一、文献综述 2
(一)研究背景 2
(二)基本概念 2
1.关联数据 2
2.RDF 3
(三)国外研究现状 3
(四)国内研究现状 4
二、语义模型构建 5
(一)总体架构 5
(二)本体的选择 5
(三)本体构建工具protégé 6
(四)关联描述模型 7
三、整合的关键技术 7
(一)数据整合的定义 7
(二)关键技术实现 8
1.命名空间的构建 8
2.解析三元组 8
3.资源与属性的修改 9
4.数据的合并 9
四、音乐数据的整合实现 10
(一)数据来源 10
(二)整合操作 10
1.修改命名空间 10
2.修改新文件的属性和资源 11
3.使用jena合并 11
(三)结果展示 12
(四)整合结果分析 13
五、结语 14
致谢 14
参考文献: 16
图 1 整体架构图 5
图 2 protégé中类层次关系面板 6
图 3 音乐实体关系模型 7
图 4 待整合的两个RDF模型 7
图 *景先生毕设|www.jxszl.com +Q: ¥351916072$
5 整合后的RDF模型 8
图 6 RDF整合流程图 8
图 7 命名空间的整合 11
图 8 修改属性与资源 11
图 9 jena合并RDF文档 12
图 10 john peel.rdf数据模型 12
图 11 worldcat.rdf数据模型 12
图 12 整合的RDF数据模型 13
表格 1 三元组的对应关系 3
表格 2 实体与属性及RDF映射 6
表格 3 RDF三元组 9
表格 4 问题1 13
表格 5问题2 14
基于开放关联数据的音乐资源整合研究
引言
引言:随着信息技术的高速发展,互联网中产生的信息数据迅速增长,招致现有的搜寻技术无法满足检索需要,信息查询的查准率与查全率已达到一定的瓶颈。语义网的基本思想是对互联网上任何资源,关联数据运用能够描述语义的RDF,对资源进行结构化的描绘,使得计算机可以理解互联网上的信息。RDF是W3C组织在2004年2月10日发布的一个推荐规范,用于以多种元数据标准为标准来描述网络资源,生成人机可读的文件,以供资源的利用、传播与共享。随着关联数据使用的普及,关联数据的共享与完善面临巨大挑战[1]。
一、文献综述
(一)研究背景
关联数据是国际互联网协会(W3C)推荐使用的一种用于关联各类信息资源和数据并公布到网络中的准则,目的是运用语义网技术来完成Web智能化,用协议来规范发布和连接各种网络数据与资源。关联数据的兴起主要是为了在万维网的基础上,建立一个人机可读的、可供人们针对特定资源进行描述的、能够充分灵活的涵盖语义信息的、具有结构化的、可传播共享的信息资源网络,从而使人们方便、快捷、高效的传播使用这些散落在信息网络却彼此关联的信息。
随着现代信息技术蓬勃生长的趋势发展,关联数据技术是信息技术发展的关键。面对现代信息的语义混杂,结构各异,语序无章,数据信息杂乱冗余,难以加工利用。关联数据技术帮助信息的规范化,提取最主要的信息,提供简洁的易操作的界面给用户,给这些信息赋予额外的价值。
随着关联数据领域的发展和技术的成熟,以及由于网络资源迅速增长造成一系列的信息问题而促使人们提高对语义网发展重要性认识,越来越多的拥有庞大数据资源的组织机构开始直接使用关联数据技术发布他们的数据并提供对外访问接口。到2011年8月,有38.57%的数据集是由数据搜集处理方直接转化为关联数据发布的,其中比较知名的有BBC Music,政府机构为公众提供经济和教育数据等,另外61.43%由相关关联数据机构发布,例如World Factbook,WordNet等。因此在关联数据迅速不断生成的阶段,关联数据的有效存储问题亟待解决。
(二)基本概念
1.关联数据
关联数据是国际互联网协会(W3C)推荐使用的一种用于关联各类信息资源和数据并公布到网络中的准则,目的是运用语义网技术来完成Web智能化,用协议来规范发布和连接各种网络数据与资源。它运用资源描述框架(RDF)作为数据的模型,运用统一的资源标识符(URI)作为数据的标识,通过HTTP协议调整规范要共享的数据,继而实现信息资源在网络上的发布[2]。
TimBernersLee针对关联数据提出了四个准则[3],最大程度上涵盖了上述关联数据的各项特征:
①使用URI来标识事物;
②使用HTTPURI作为网络标识,以便人们的访问;
原文链接:http://www.jxszl.com/jsj/xxaq/56595.html