论文浅尝 | PairRE: 通过成对的关系向量实现知识图谱嵌入

dbbcf8b91e0105774856cae3c9e2bd2b.png

笔记整理:黎洲波,浙江大学硕士,研究方向为自然语言处理、知识图谱。

研究背景

知识图谱因其在问答、语义解析和命名实体消歧等任务取得了良好的效果而受到广泛关注,而大部分知识图谱都存在不全和缺失实体链接的问题,所以需要进行链接预测(Link Prediction)和知识图谱补全(Knowledge Graph Completion)。知识图谱嵌入(Knowledge Graph Embedding)方法被提出来解决该问题。知识图谱嵌入是将知识图谱中所有的实体和关系嵌入到低维空间的方法,从基于距离的方法TransE到目前的效果最好的RotatE,在知识图谱补全任务上效果持续提升。

在知识图谱嵌入中,有两个主要问题受到广泛关注:

1.如何解决1对N,N对1和N对N的复杂关系表示问题。比如1对N的关系:基于距离的方法中,三元组(StevenSpielberg, DirectorOf, ?)的补全要求在经过关系变换DirectorOf后,Jaws和JurassicPark等实体能够距离StevenSpielberg更接近,但是使所有这类实体具有不同的表示是很困难的。2.如何通过已有的三元组学习和推断关系模式。关系模式例如对称(Symmetry)关系IsSimilarT,非对称(Antisymmetry)关系FatherOf,逆向(Inverse)关系PeopleBornHere和PlaceOfBirth以及组合(Composition)关系mother’s father is grandpa等等。

研究动机

之前的TransH、TransD和TransR等方法致力于解决复杂关系表示问题,却只能编码对称/非对称关系,最新的RotatE在编码对称/非对称关系,逆向关系和组合关系上取得了优异的效果,但是复杂关系的预测依然具有挑战性。由此,论文提出了一种新的知识图谱嵌入方法PairRE,它能够同时编码复杂的关系和多种关系模式。

研究方法

模型中使用的两个用于关系表示的向量将头尾实体分别投影到欧式空间,再最小化投影向量的距离。其形式化描述如下:

6fc5268fcfce8cd70222668dd4b9b934.png

PairRE和前面提到的几种方法的比较如下,可以看出相比于RotatE,论文提出的PairRE方法在复杂关系表示上表现更优,同时在关系模式的编码上能够编码子(Sub)关系。

4f909b5b1110261d7d9422f1caf8c261.png

直观来说,PairRE中所有的实体表示都在一个超球上。

baacf4393141bd67e16da74c27042df5.png

相比于其他方法,PairRE允许一个实体在不同的关系中有分布式表示,并且成对的关系向量能够对损失函数中的边际进行自适应调整,从而缓解复杂关系的表示问题。例如在1对N的关系补全(h, r, ?)中,由正确的尾实体集合S = {t_1,t_2,…,t_N},论文基于固定边际参数γ的设计了t_i的取值范围:

6cf429c75de2bd0ca18d6fd6c18250f5.png

在TransE和RotatE中也有类似的固定边际参数来控制复杂关系表示,当|S|足够大时,PairRE能够通过减小|r^T|来拟合t_i,而前两种方法效果不佳。

对于各种关系模式,证明PairRE编码的形式化描述如下:

190790afb8d2b9184a3db3a54d5ed148.png

对称/非对称关系模式

4886a3f2400bd0cf8a29c6fa753d2af3.png

逆向关系模式

7b5fd22e62ebc189c96f3e693637b975.png

组合关系模式

对于子关系编码,PairRE满足了以下条件:

fd8d638529714be87eeaae9992a46f2c.png

91c74a5e553d2bec1bb7d3adfdbef07a.png

子关系模式

PairRE的模型优化中使用了自对抗(Self-adversarial)的负采样损失函数:

3aa53f600afb4bd1fb005dee8d7934aa.png

其中,γ是固定边界参数,σ是sigmoid函数,(h_i^',r,t_i^')是第i个负样本,补充定义如下

97627f12a8d17ba14a3ac4d885d7b54e.png

实验验证

实验中用于做链接预测任务的数据集信息如下图

4f265441c98e8b0fb30a5c236283e7b2.png

PairRE和其他方法的结果比较如下

79c114503e887b3e0f92d1da48c8ba79.png

上图是本文的主实验结果,可以看到Pair相比于RotatE在各个设定下都取得了更好的效果,如果嵌入向量的维度能够升高到500,效果可能会进一步提升。

20aeb6dec44de09adc9216931c2f455f.png

文中提到,由于PairRE和RotatE共享超参数和实现方法,所以客观来说与RotatE比较更公平。

论文还针对子关系模式做了补充实验,将PairRE同ComplEx-NNE-AER和SimplE^+进行对比,这两种方法通过设计子关系规则进行语义匹配。论文同时借鉴了ComplEx-NNE-AER中的规则,对本来的损失函数进行改变如下:

3f65c9b43ef0a60dc0375316d7c6c619.png

对数据集Sports添加以下规则并获得结果

1a61b7f00ff6cedbca2f372655fa9721.png

6ef6d1c3adf15860f5dafc34862ebfcf.png

将子关系模式中的两个关系看作同等之后,在数据集DB100k上获得的结果如下

3752b04e9306524a6c574d65db0cdec5.png

模型分析

fab9e0343d59e24939bc24eb1c04a802.png

对于复杂关系的表示问题,论文对关系的种类进行分别实验,结果表明PairE在N对1和N对N的关系表示在数据集FB15k和ogbl-wikikg2上表现明显超过了其他模型,但是在1对1和1对N的关系表示上结果不佳。论文为了证明成对的关系向量有优越性,单独将成对关系向量机制加在RotatE上,在ogbl-wikikg2数据集上取得了良好的效果。

ee76334670139523bdafa3506cb69d8c.png

对于关系模式问题,论文在嵌入向量维度为500下取DB100k中的对称关系r_1:spouse和非对称关系r_2:tv_station/owner,对称关系编码满足r^(H^2 )=r^(T^2 ),编码效果如下:

aab60f703eb15d8a2e4ead43d3c37c74.png

验证逆向关系r_2和r_3: tv_station_owner/tv_stations,编码满足r_3^H∘r_2^H=r_3^T∘r_2^T,编码效果如下:

f8941545f1a4244f9e428f4129fe4d82.png

验证组合关系r_4: /location/administrative_division/capital/location/administrative_division_capital_relationship/capital,r_5: /location/hud_county_place/place和r_6: base/areas/schema/administrative_area/capital.,编码满足r_4^H∘r_5^H∘r_6^T-r_4^H∘r_5^T∘r_6^H,效果如下:

240c24fcf91cc007199cb490cb65e3f7.png

总结

论文提出的PairRE方法用成对的向量表示每个关系,使损失函数中的余量能够自适应调整,以适应不同的复杂关系,在复杂度略有增加的情况下有效地解决了知识图谱嵌入中的问题。除了对称/不对称、逆向和组合关系之外,PairRE还可以通过对关系表示的简单约束编码子关系。在大规模数据集ogbl-wikikg2上,PairRE取得了最优效果。


OpenKG

OpenKG(中文开放知识图谱)旨在推动以中文为核心的知识图谱数据的开放、互联及众包,并促进知识图谱算法、工具及平台的开源开放。

7811c0e2c3b6563cc175339684f164ad.png

点击阅读原文,进入 OpenKG 网站。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://xiahunao.cn/news/1380997.html

如若内容造成侵权/违法违规/事实不符,请联系瞎胡闹网进行投诉反馈,一经查实,立即删除!

相关文章

致敬乔布斯的经典,锤子坚果Pro成2017年最受欢迎手机看罗永浩怎么说

锤子坚果Pro发布已经近2个月,但热度依旧不减。在刚刚过去的京东618活动中,坚果Pro在1500到2000元档位产品中一举斩获单品销量冠军。坚果Pro凭借出色的销售战绩坐实2017手机圈“黑马”之名,而其销量节节攀升,这其中必有一番原因。日…

坚果Pro 2安抚了不少人锤粉, 但用户更期待锤子T3

今年秋季,锤子科技创始人罗永浩于2017年11月7日在成都发布坚果系列2代手机坚果Pro 2,指纹和logo的融合增强了手机的一体型。软件上的再度优化,帮助盲人更注重人文关怀,再从罗永浩自带“流量”,坚果Pro2自然而然受到大家…

pro坚果android耗流量,深度使用坚果Pro3一个月,憋了一肚子话,不吐不快​

原标题:深度使用坚果Pro3一个月,憋了一肚子话,不吐不快​ 罗永浩创办的锤子手机曾经在国内手机市场,也是一枚耀眼的新兴,罗永浩对于手机工业设计的高标准严要求让锤子手机成为了国内少有的在设计上能和苹果三星比肩的手…

厉害了!原来这些文艺明星都喜欢锤子坚果Pro

最近在手机圈出现了一匹黑马,那就是锤子坚果Pro。在京东618期间取得了十分骄人的战果,荣获6月1日至18日1500-1999元价位档单品销量第一,成为该价格区间最受欢迎的手机,同时在2017年4月1日后首发的新品销量排名中位列第三&#xff…

锤子t1android驱动,锤子T1痛失安卓5.1!都是因为这?

现如今很多高端手机都开始升级安卓6.0了,但是情怀锤子却突然给了老用户一“锤子”,宣布第一代T1将不会升级到安卓5.1,因为“优化效果不明显”。 这顿时引发了一片争议。有的T1用户表示了理解,称手机够用就好,不在乎系统…

内蒙古大学计算机考研资料汇总

内蒙古大学研招网 内蒙古大学计算机学院 内蒙古大学计算机学院成立于1997年,其前身是1978年设置的计算机专业和1988年成立的计算机科学系。内蒙古大学软件学院成立于2005年,与计算机学院为一个实体,两个牌子。目前学院由计算机科学系、…

如何获取bainu文档并用斡仑office进行编码转换-永中office蒙文版

声明: 1.bainu软件是由内蒙古卓嘎信息技术有限公司研发的。 2.斡仑office是由内蒙古斡仑科技有限公司与永中软件股份有限公司联合开发的蒙汉多文种跨平台办公套装。 第一,首先我们打开bainu软件,如图: 第二,下列图中…

为什么 Mixin 被认为是有害的

为什么 Mixin 被认为是有害的 Mixin 是在 Vue 2 中引入的,作为组件之间共享代码的解决方案,这种方式成为许多代码库不可或缺的一部分。然而,随着时间的推移,它们的使用开始出现问题。尽管 mixins 最初很有吸引力,但现…

【从零开始学习JAVA | 第四十五篇】反射

目录 前言: ​反射: 使用反射的步骤: 1.获取阶段: 2.使用阶段: 反射的应用场景: 使用反射的优缺点: 总结: 前言: Java中的反射是一项强大而灵活的功能&#xff0…

1688采源宝的商家靠谱吗 怎么入驻成为阿里采源宝商家

说到采源宝,我想很多微商都是不陌生的,采源宝的主要作用就是方便微商查看并转发供应商所发布的商品,并在有客户下单时,还可以轻松向供货商去下单。但也有很多朋友对采源宝的商家靠谱吗这个问题存在很大疑惑,下面我们就…

开发nft数字藏品平台合法合规吗?

开发nft数字产品平台合法合规吗?这是很多人都在问的问题,那么今天就来给大家说说。 开发nft数字产品平台可以肯定的是合法合规。 其实很多人对国内国外的玩法不太了解,有很多人对数字产品法律和政策不太清楚。首先,我们要了解国内…

最近发现一款拍卖转拍,玩家互动挑选自己想要的拍品,转拍获利,还可以提货的源码,一款购物和赚钱的不二选择

拍卖转拍,玩家互动挑选自己想要的拍品,转拍获利,还可以提货,一款购物和赚钱的不二选择操作步骤打开拍卖首页 根据时间点击进入指定的场次选作品, 等待到时间准备抢拍, 抢完之后可以查看卖家的收款码, 确认打款之后可以上传支付截图 然后可以等待卖家确认收货, …

1688按图搜索商品(拍立淘)获取数据的教程

onebound.1688.item_search_img 获取key和secret API文档说明 完整返回数据 "items": { "real_total_results": 80, "error": "", "item": [ { "title"…

基于java SSM框架的竞拍系统拍卖网设计

今天给大家介绍一个竞拍网的设计与实现。 本项目主要实现的功能是为广大的消费者群体与商家之间提供网络交易的平台,实现该平台的创建需要实现一系列的功能。 商品信息发布的功能,商家发布自己产品的相关信息;注册登录功能,游客通…

Java基于ssm开发的古董竞标拍卖系统也可以改成拍卖品网站

简介 古董展品拍卖网站 用户可以注册成为买家也可以申请开店成为卖家,发布古董展品,设置拍卖起止时间进行展品的拍卖。如果早于拍卖开始时间或者晚于拍卖结束时间,则不可以竞拍。多人竞拍,买家可以根据最高价设置谁中标&#xff…

星球日报|Conflux支持 阿里上线国内最大数字藏品交易撮合平台

转载自Odaily星球日报 近日,阿里拍卖在淘宝 APP 首屏重要入口位置上线了一大批第三方公链以及平台支持的数字藏品店铺,以供用户进行拍卖交易。除由公链 Conflux 支持的数字藏品外,阿里拍卖同时存在由国产联盟链“知信链”和“新版链”技术支持…

带有反爬虫机制下进行爬取数据方案,这里以阿里拍卖为例

介绍 最近接到一个2万多的小项目,需求是这样的。需要将一个大型网站上的数据爬下来保存到本地。具体项目不方便透漏,这里的演示就以阿里拍卖网站为例。 反爬虫机制有那些? 解决反爬虫之前,我们首先得了解反爬虫机制。 ip限制反爬虫:免登录反爬虫一般用访问ip来判断你是…

SSM框架在线拍卖系统项目

文章目录 前言一、项目设计具体任务和要求二、数据库设计三、页面效果及功能展示1. 拍卖系统登录页面2.拍卖系统注册页面3.拍卖系统登录后主页面4.拍卖系统游客浏览拍卖商品页面5.拍卖系统用户添加拍卖商品页面6.拍卖系统用户查看个人上传商品页面7.拍卖系统用户删除个人商品页…

类似京东淘宝寄售转拍系统源码-拍卖系统源码-竞拍系统网站源码

古玩文物字画寄售转拍系统源码-拍卖系统源码-竞拍系统网站源码(经检查代码不加密,可二进行二开),拍卖转拍,玩家互动挑选自己想要的拍品,转拍获利,还可以提货,一款购物和赚钱的不二选择操作步骤打开拍卖首页 根据时间点击进入指定的场次选作品&#xff0…

基于 CentOS 7 构建 LVS-DR 群集 配置nginx负载均衡

环境配置: RHCE客户机192.168.100.146node1lvs192.168.100.145node2RS192.168.100.147node3RS192.168.100.148 配置ipvsadm httpd: [rootnode1 ~]# yum install ipvsadm.x86_64 [rootnode2 ~]# yum install http -y [rootnode2 ~]# systemctl …