网易首页 > 网易号 > 正文 申请入驻

第四范式NeurIPS 2020:知识图谱嵌入的自动化

0
分享至

  机器之心发布

  机器之心编辑部

人工智能顶级会议 NeurIPS 2020 将于 12 月 6 日 - 12 日线上举行。机器之心联合多位研究者举办了线上分享活动,前不久,来自第四范式的资深研究员姚权铭博士和大家分享了其参与并被 NeurIPS 2020 接收的论文《Interstellar: Searching Recurrent Architecture for Knowledge Graph Embedding》。

  这项研究受神经架构搜索(NAS)的启发,提出将 Interstellar 作为一种处理关系路径中信息的循环架构。此外,该研究中的新型混合搜索算法突破了 stand-alone 和 one-shot 搜索方法的局限,并且有希望应用于其他具有复杂搜索空间的领域。

  视频链接:https://v.qq.com/x/page/n3207ugke4j.html?start=6

  知识图谱嵌入(Knowledge Graph Embedding)目前在学习知识图谱(KG)中的知识表达上具有很强的能力。在以往的研究中,很多工作主要针对单个三元组(triplet)建模,然而对 KG 而言,三元组间的长链依赖信息在一些任务上也很重要。

  在第四范式、香港科技大学这篇被 NeurIPS 2020 会议接收的论文中,研究者基于由三元组组成的关系路径(relational path)提出 Interstellar 模型,通过搜索一种递归神经网络,来处理关系路径中的短链、长链信息。

  论文链接:https://arxiv.org/pdf/1911.07132.pdf

  代码链接:https://github.com/AutoML-4Paradigm/Interstellar

  首先,该研究通过一组模拟实验分析了用单一模型对不同任务中关系路径建模的难度,并由此提出通过搜索的方式对不同任务针对性地建模。为了提高搜索效率,该研究提出了一种混合搜索算法(hybrid-search algorithm),在链接预测(link prediction)和结点匹配(entity alignment)任务上,能高效地搜索到具有更好效果的模型。

  背景介绍

  知识图谱嵌入(KG Embedding)旨在把图谱中的结点(entities)和关系(relations)映射到一个低维空间,同时保留图中的重要性质。在目前学术领域,一些工作基于单个三元组(s,r,o)建模,如 TransE、RESCAL、DistMult、RotatE、ConvE、SimplE 等,它们在链接预测任务(即给定头结点 s 和关系 r ,预测尾结点 o )上表现良好,而在结点匹配任务(即给定两个 KG,预测哪些结点有相同含义)上性能一般。另一类基于关系路径的工作,如 IPTransE、Chains、RSN 等则在结点匹配任务上表现更好。

  研究人员观察到,关系路径包含多种重要信息,如单个三元组的短链信息、多个关系的复合、多个三元组之间的长链信息等等。基于此,该研究提出 Interstellar 模型,通过搜索的方式来根据不同任务,有针对性地对关系路径进行建模。

  动机

  为了验证不同模型对不同任务的拟合能力不同,研究人员设计了一组模拟实验。Countries 数据集有 S1-S3 三个不同任务,预测难度逐一增大,需要模拟的预测路径逐渐变长。为此研究者基于先验知识(prior knowledge)设计了 4 类模式 P1-P4,分别用于建模单个三元组、连续的两个三元组、多重关系的复合,以及全递归连接。直观上看,P4 的建模能力更强,但在有限的样本上,样本复杂度同样重要,选择更能拟合数据规律的模型能够获得更好的效果。

  如下表所示,在 S1 这个简单任务上,基于单个或两个三元组的模型 P1 和 P2 表现更好,在 S2 上 P1-P3 均优于 P4,而在 S3 上,递归模型 P4 由于能模拟更长路径而胜出。由此我们可以得出,关系路径上的建模应该是模型相关的,如果我们能够通过搜索的方式把专家的先验知识融入到建模能力中,那么针对不同任务,模型就可以自动地找到更优解。

  问题定义与搜索空间

  首先,研究者将 Interstellar 定义为一个递归式地处理关系路径的模型,在每一个递归步中,模型关注到一个三元组,信息在三元组之内、之间以不同方式穿梭。与传统 RNN 不同,这里的每一步有两个输入,同时由于需要考虑知识图谱相关的领域知识,单纯地使用 RNN 对其建模是不合适的。为了利用好知识图谱领域的先验知识,同时使模型可以适用于不同任务,受神经网络搜索技术(Neural Architecture Search)的启发,该研究把建模问题定义为搜索问题,来自适应地对不同任务建模。

  通过对知识图谱嵌入领域相关模型的总结,该研究提出上图的搜索空间,利用运算单元 O_s 来处理结点嵌入 s_t ,用 O_r 来处理关系嵌入 r_t ,用 O_v 来输出向量 v_t 从而预测下一个结点 s_t+1 。具体而言,该研究在 macro-level 搜索不同单元间的连接方式(connections)和复合方式(combinators),在 micro-level 搜索激活函数(activation)与权重矩阵(weight matrix)。

  搜索算法

  该研究的目标是更快地在搜索空间中找到能在验证集上达到更好性能的模型,这可以通过 bi-level 优化方式来定义。为了求解这个优化问题,学术界目前有两类方法。一类是 stand-alone 算法,对每个模型单独训练参数 F 至收敛,这样可以得到准确的性能评估 Μ ,但训练代价较高;另一类是 one-shot 算法,建立一个包含所有网络的超网络(supernet),不同模型在超网络中采样,同时可以参数共享,这样的评估方式更高效,但不总能保证可靠性。研究人员观察到在 Interstellar 的建模上,one-shot 方式并不可靠。

  为了解决这些问题,该研究提出 Hybrid 搜索算法,在 macro-level 采用 stand-alone 方式,给定 α_2 ,从 Α_1 中采样不同的 α_1 ,训练模型参数至收敛,拿到对 α_1 的可靠评估;在 micro-level 采用 one-shot 方式,给定 α_1 ,从 Α_2 中采样不同的 α_2 ,同时让不同 α_2 对应的模型在超网络中共享参数,加速训练评估的过程。二者结合,既保证了搜索准确性,又保证了搜索效率。

  实验结果

  在搜索效果上,该方法在结点匹配和链接预测任务中,都能针对不同数据任务搜索到更好的模型,这得益于 Interstellar 上合理的搜索空间和高效的搜索算法。

  在搜索效率上,Hybrid 算法能够比随机搜索(Random)、强化学习(Reinforce)、贝叶斯优化(Bayes)算法更快地得到更好的模型,同时下图中的两条虚线(表示单独的 one-shot 算法)表明其在这个问题上性能并不好。在搜索时间上,Hybrid 算法和调参(如 learning rate、batch size 等参数)时间是相当的,说明这个搜索方法代价并不高。在新的问题中,先搜索模型再进行调参是一个不错的选择。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
一场冲突看清京沪两队差距,川队进场没人敢拉,刘鹏喝令全员坐下

一场冲突看清京沪两队差距,川队进场没人敢拉,刘鹏喝令全员坐下

刺头体育
2024-04-19 23:41:57
最沉默的李想,最便宜的理想

最沉默的李想,最便宜的理想

观察者网
2024-04-19 11:58:06
38岁保罗作出决定,勇士6换1交易库里曝光,雷霆或再组三巨头?

38岁保罗作出决定,勇士6换1交易库里曝光,雷霆或再组三巨头?

天气如你
2024-04-20 00:32:05
巨大争议!李梦承认了?穿超短裙露出数字3333,球迷:难以理解

巨大争议!李梦承认了?穿超短裙露出数字3333,球迷:难以理解

何老师呀
2023-07-21 15:10:56
当百姓成为唯一的唐僧肉时,后果可想而知,现金流对普通人最重要

当百姓成为唯一的唐僧肉时,后果可想而知,现金流对普通人最重要

风生水起逐浪高
2024-04-18 16:01:32
快言快语!记者VS重庆燃气董事长:都是先义正辞严,最后痛哭流涕

快言快语!记者VS重庆燃气董事长:都是先义正辞严,最后痛哭流涕

大风文字
2024-04-18 18:00:35
庐山会议,第一个诬陷彭德怀的人,后来差点取代周总理,他是谁?

庐山会议,第一个诬陷彭德怀的人,后来差点取代周总理,他是谁?

北筏话史
2024-04-01 11:22:49
近日辽宁一位老板娘开玩笑:你看这孩子好像我家外孙女

近日辽宁一位老板娘开玩笑:你看这孩子好像我家外孙女

白浅娱乐聊
2024-04-19 17:50:28
舒服了!婆婆大夸儿子有本事,彩礼没出女方倒贴,女方直接脱婚纱

舒服了!婆婆大夸儿子有本事,彩礼没出女方倒贴,女方直接脱婚纱

看晓天下事
2024-04-17 19:11:56
天啊!这出国咋把人变成这样?这还是当年在央视春晚演唱《请到天

天啊!这出国咋把人变成这样?这还是当年在央视春晚演唱《请到天

娱乐圈酸柠檬
2024-04-19 12:19:48
赶在美国务卿访华前夕,先对华挥起关税大棒?

赶在美国务卿访华前夕,先对华挥起关税大棒?

直新闻
2024-04-18 22:59:48
iOS 微信发布 8.0.49 正式版,加入多个新功能

iOS 微信发布 8.0.49 正式版,加入多个新功能

简科技
2024-04-19 15:38:53
5部电影5次冠军!被遗忘的传奇,他比周星驰更配得上喜剧之王

5部电影5次冠军!被遗忘的传奇,他比周星驰更配得上喜剧之王

毒舌电影
2024-04-19 22:00:03
回顾女婿性侵岳母,岳母不反抗反而全力配合,被捕后辩称:在治病

回顾女婿性侵岳母,岳母不反抗反而全力配合,被捕后辩称:在治病

百事所谈汇
2024-04-08 18:12:46
特朗普改口了,俄罗斯心凉半截!

特朗普改口了,俄罗斯心凉半截!

刀刀说事
2024-04-19 08:28:28
“牛仔裤”下面,一定不要搭运动鞋,瞧上海女生,这样穿是有多美

“牛仔裤”下面,一定不要搭运动鞋,瞧上海女生,这样穿是有多美

时尚穿搭生活馆
2024-04-15 14:08:50
安徽省委书记冒雨暗访石门湖,现场督促检查生态恢复情况

安徽省委书记冒雨暗访石门湖,现场督促检查生态恢复情况

澎湃新闻
2024-04-18 17:08:26
臭名昭著的日本731部队:强迫女子与动物交配,长达一个小时

臭名昭著的日本731部队:强迫女子与动物交配,长达一个小时

温读
2023-09-05 13:28:51
俄罗斯外长宣称与乌克兰总统泽连斯基的谈判毫无意义

俄罗斯外长宣称与乌克兰总统泽连斯基的谈判毫无意义

特特农村生活
2024-04-19 21:21:16
2024金球奖概率:贝林厄姆力压姆巴佩居首 梅西暂居第五

2024金球奖概率:贝林厄姆力压姆巴佩居首 梅西暂居第五

直播吧
2024-04-20 02:49:04
2024-04-20 03:36:49
机器之心Pro
机器之心Pro
专业的人工智能媒体
8909文章数 141890关注度
往期回顾 全部

科技要闻

最沉默的李想,最便宜的理想

头条要闻

媒体:以色列对伊朗的反报复刀刀见血 要真的打痛伊朗

头条要闻

媒体:以色列对伊朗的反报复刀刀见血 要真的打痛伊朗

体育要闻

米切尔这次对线不会输了吧

娱乐要闻

北影节开幕之夜,内娱女星千娇百媚

财经要闻

新华资管香港的秘密:猛投地产或致巨亏

汽车要闻

风神L7预售 东风汽车北京车展阵容公布

态度原创

本地
数码
游戏
家居
公开课

本地新闻

春色满城关不住|千阳春日限定美景上线了!

数码要闻

5599元 华硕破晓Pro14笔记本开售:Ultra 5 125H+2.5K屏

诸葛亮北伐路上的头号克星郭淮,王者之心里换成姜维能不能拿下?

家居要闻

光影浮动 色块碰撞与线条起伏的情感呼应

公开课

睡前进食会让你发胖吗?

无障碍浏览 进入关怀版