时间:2018年04月03日 分类:科学技术论文 次数:
在当前对本体语义关系挖掘映射系统中运用了许多种方法,这对于权值的选取要高很多,如果选取不当,就不能很好的收获到语义信息,因而得出的结果也会差很多。下面文章就主要针对语义挖掘映射策略及权值展开分析,设计相应的本体映射原型系统,这样就可以实现本体映射语义关系挖掘功能,并且获得正确的结果,将得到的实验结果与先进的映射系统的结果进行比较,测试系统性能,验证本系统的有效性。
关键词:语义关系,本体映射,挖掘映射系统
1系统目标与模块设计
本文设计的系统称之为“S-Mapping”语义挖掘映射子系统,通过本系统要实现高效率的候选映射集检索,优化的候选映射集。本系统由以下几个模块组成。
(1)用户操作模块。
提供一种UI操作界面,可供用户进行界面操作,可以很方便的输入所需要进行验证的映射本体,并能对最终结果进行输出显示。
(2)本体解析模块。
该模块能对本体的各种特征进行提取解析,针对检验本体映射所需要的各种特征值进行预处理,对不同格式的本体做标准化操作,为本体相似度运算以及映射对的最终确定做好初期准备。
(3)本体语义间关系挖掘模块。
该模块是对标准化本体主要用于进行挖掘候选语义关系,通过语义的初步挖掘,缩小需要比对的样本范围,减轻下一步的运算复杂度,并提高最终映射结果的精准性。
(4)映射结果输出模块。
采用优化的自适应映射算法,将得出的结果进行界面可视化输出,为后续的查询和检索等提供参考服务。
(5)映射结果评价模块。
为了检验映射系统的性能,需要对映射结果进行评价,能自动输出评估的结果,根据这个评价结果,便于对系统进行改进。
2系统实现
本系统选用Java作为编开发平台,Java的与平台无关性,便于系统的移植。系统还用了UML、Jena、Alignment等开发工具。系统采用了一种全新的本体相关度候选映射集检索方法,提出了改进了的映射关系挖掘算法,尤其采用权值策略的自适应计算,削弱排除干扰信息,突出价值较高的一个语义信息。
为了克服传统映射系统采用方法存在的缺点,本文结合本体的标题名称和自身结构等信息为参考要素,确定映射关系候选集合,从而准确而且全面的找出不同的本体中的语义概念本文认为,当两映射关系对的结构关系具有全相关性时,则可在映射关系候选集合中直接添加目标概念,这样与该概念相近的周围概念也将产生更大的加入映射候选集之中;当两映射关系对完全无不相关性时,则可以直接丢弃该概念;除此之外,需要注意的是,目标概念是必须遵循名称相似度和相关性衡量指标来加入映射关系候选集合的。
鉴于此,本文的核心思想是:对源本体和目标本体的概念进一系列预处理操作,如首字母缩写处理、分词操作、缩略语查找、排除同名异义以及词干的抽取等,对于源本体中的任一概念X,经过相似性比较操作,在目标本体中找出与源本体名称最相似的概念Y,然后以Y概念为锚点得到的初始候选概念映射集,然后再进行扩展,最终得到所需要的候选映射关系的集合。
本系统的关键程序代码如下:
publicStructrueMatcher(OntClasscls1,OntClasscls2,ExtendedVectorstructureMatchingResult(){
srccls=csl1;
tarcls=cls2;
this.structureMatchingResult=structureMatchingResult;
}
publicbooleanhasSameSuperClass(){
booleanflag=false;
OntClass[]spc1=superClassSet(srccls);
OntClass[]spc2=superClassSet(tarcls);
Outer;
for(inti=0;i<3;i++)
for(intj=0;j<3;j++)
if(spc1[i]!=null&&spc2[j]!=null){
MactchingUnitmu=newMatchingUnit(spc1[i].toString(),spc2[j].toString(),true);
if(structureMatchingResult.contains(mu))
flag=true;
breakOuter;
}
}
}
returnflag;
3系统性能评估实验
本系统的实验以OAEI提供的标准测试数据集进行实验[4],与2007年参加OM国际本体映射测试比赛的系统[5]在查全和查准方面进行比较。
从实验结果表1分析可以看出,本系统进行语义搜索耗费的时间要优于传统方法,系统性能较传统方法有了一定的提升。系统参数均衡,在有些地方仍有提升的空间,如:选映射集数目稍低,某些本体信息的处理结果还不够理想等。
4结语
本文针对语义挖掘的映射多策略及权值计算进行研究,设计一个本体映射原型系统,优化改进了本体映射策略,虽然部分处理的结果还不够理想,还有提升的空间,但这对于今后开展的本体重用和集成等相关研究提供了基础,同时也为不同本体概念间的查询提供了技术支持。
参考文献
[1]王家琴,李仁发,李仲生,等.一种基于本体的概念语义相似度方法的研究[J].计算机工程,2007,11(33):201-203.
[2]张芷维.基于语义的本体映射策略以其结合方式[D].中南大学,2008.
[3]唐杰,梁邦勇,李涓子,等.语义Web中的本体自动映射.计算机学报,2006,11(29):1956-1976.
[4]JayantMadhavanAlonY.Halevy.Composingmappingsamongdatasources[J].VLDB2003:Proceedingsof29thInternationalConferenceonVeryLargeDataBases,LosAltos,USA,2003:572-583.
[5]潘有能,刘朝霞.本体映射技术在关联数据中的应用研究[J].情报科学,2015,33(1):54-56,62.
推荐阅读:计算机技术在日常生活中的应用及发展
计算机作为一项重要的伟大发明,如今已经广泛应用到了各行各业,当然也在潜移默化的影响着人们的生活,对于社会的发展进步也有一定的积极作用。目前计算机也已经成为了我们日常生活中重要的一部分,为用户也提供了相应的便利,下面文章就针对计算机应用现状和未来发展趋势做详细探讨。