网易首页 > 网易号 > 正文 申请入驻

Nature通讯:基于先验知识的网络推断

0
分享至

  

  导语

  关联网络(correlation network)常常被用于提取生物组学中的相互作用,但其连边 选择通常基于统计显著性,可能无法有效捕捉到生物学机制。

  近日Nature communications上刊载了德国慕尼黑亥姆霍兹中心多位学者的论文“一种利用先验知识选择关系网络截断的策略”。文章指出,先验知识可以有效地辅助关联网络重构。甚至当先验知识粗糙、有缺失、有错误时,该方法仍然有效。

  

论文题目: A strategy to incorporate prior knowledge into correlation network cutoff selection 论文地址: https://www.nature.com/articles/s41467-020-18675-3

  

  在网络推断 (network inference) 风潮下,利用大数据重构生物网络,已经成为生命科学领域的研究热点。例如从生物组学大数据中提取出生物分子之间的相互作用,进而预测未知的生物反应机制。

  1.传统方法与先验知识辅助方法

  典型的网络推断工作流程,首先是根据预处理的数据,估计变量之间的关系,形成相关矩阵。然后根据假设检验来判断哪些相关关系是显著的。最后把显著的相关关系构建成网络 (network representation) ,其中节点是数据集中的变量,连边代表相关关系。

  

  图1:网络推断工作流

  传统方法需要利用假设检验来确定哪些相关系数在统计上是显著的,该检验会产生与每个相关系数相关的p值,并与给定的显著性水平阈值进行对比。只有当相关系数统计显著时,才认为其对应连边存在。

  这样的网络推断过程虽然简单,却有明显缺陷,以至于降低网络推断的鲁棒性和可重复性。首先,样本量的增大,会明显影响统计结果,例如样本量越大则网络越稠密。其次,不同的检验方法有不同的基本假设,可能会得到完全不同的网络。这些网络尽管在统计学上没问题,却未必能有效表示潜在的生物机制

  

  图2:基于先验知识的网络推断工作流

  为了更好地判断相关系数的显著条件,即产生连边的阈值,从而提升网络推断质量,研究者引入了先验知识。

  研究者首先利用先验知识,将已知的一定存在关联的节点进行连接,构建了参考网络(reference network)。然后,在对比不同阈值下的 (推断的) 网络与利用先验知识构建的辅助 (参考) 网络之间的重叠程度后,选择重叠度最好的情况作为网络推断结果。

  重叠度由真阳性 (同时出现在关联网络与参考网络) 、假阳性 (只在关联网络有) 、真阴性、假阴性按 Fisher 精确检验方法计算。

  从关联网络中,搜索出与参考网络重叠程度最大的网络,并截取该网络,即为最优网络(optimal network)

  

  图3:两种重构方法工作流与效果对比

  2.在具体网络中验证

  为了验证这一方法的可靠性,研究者在多种生物数据集上进行了实验。由于IgG糖组学已经被很好地描述,便于检验,所以研究者首先用它来测试网络推断方法的有效性。

  

  图4:免疫球蛋白G(IgG)聚糖结构的合成路径

  以往研究已经较为清楚IgG糖基化的路径,如图4所示,节点代表聚糖结构,有向连边代表合成过程中的单个酶促反应。

  

  图5:IgG重构网络与参考网络重叠度的Fisher检验

  利用该网络作为先验知识对具体网络进行重构,结果如图5。纵轴表示不同阈值下的Fisher检验的p值,该指标反映了被重构网络与参考网络的重叠程度。关联网络与生物学参考网络产生最大重叠时,称为最优截断 (optimal cutoff) 。

  实线的颜色代表了不同的相关系数确定方法。本文使用了三种相关性分析的方法,Pearson相关性 (粉色) ,精确的部分相关性 (partial correlation,称为parcor,紫色) 和基于GeneNet算法的部分相关性。

  图中的虚线则代表在原始数据矩阵上,利用GeneNet算法,以不同显著性衡量标准给出的截断 (cutoff) ,即阈值。

  显然,Pearson与parcor方法的效果并不好,而使用参考网络最优截断得到的最优的GeneNet网络非常接近GeneNet网络最优的统计截断点 (虚线FDR=0.05) 。

  

  图6:不同大小的样本下的最优截断

  为了评估先验知识方法获得的最优网络,是否取决于样本大小,研究者对部分样本的网络进行优化。结果如图所示,即使样本量不足200,仍然可以获得跟大样本 (669个) 相同的最优网络。

  这意味着,无论样本数据集是大还是小,基于先验知识来得到的相关性的最优截断,都可以推断出相同的最优网络。该方法受样本量规模的影响远远小于传统统计方法。

  3.先验知识质量不同,

  网络推断结果依旧

  现实生活中很难获得准确且完备的先验知识——因为很难彻底了解许多生物调控系统的分子网络,所以仍要用有限的先验知识去解决问题。研究者假设,只要已知足够多正确的生物学知识,即使这些知识粗糙、不完整,或者有部分错误,该方法也能适用。

  研究者进一步分析了在不同程度的连边缺失、连边出错以及信息模糊情况下的该方法的重构效果。

  

  图7 先验知识质量不佳时的重构结果

  研究者从IgG糖基化途径中,选择一定比例 (从10%到90%不等) 的边,随机构建网络;还虚构了不同数量的错误连边,构建网络。但如图7a、7b所示,尽管先验知识不足,或有部分错误,但最优截断点却几乎不受影响。

  研究者还将参考网络进行不同程度的粗粒化,如图7c所示,发现最优截断点仍然很接近,截断的网络是相似的。

  可以发现,在先验知识质量较低时,该方法依然可以给出较为准确的截断。

  之后,研究者还进一步证明了该方法推广到代谢组学和转录组学数据中,均有较好的结果。

  4.前景

  以往的网络推断方法都需要定义一个关键参数阈值p,由它决定哪些分子间相互作用应该包含在网络中,哪些应该舍弃。关联网络的推断常常依赖于p的取值。

  这项研究则提出了一种利用先验知识辅助确定关联网络阈值的截断或取值的网络推断/网络重构方法,并且证明其在生物领域具有广泛的适用性。

  

  图8:先验知识质量不佳,仍可以推断出最优网络

  该方法在先验知识不完整、错误或仅提供较模糊的节点分类的情况下都可以较好地推测最优网络结构,未来可能成为一个有价值的工具,在难以实验证实的情况下推断潜在的生物相互作用。

  

作者:刘培源、陈昊 审校:王力飞 编辑:邓一雪

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐

上午10点!足协做出争议决定:国足恐将迎来大地震,恒大国安遭重创

我爱国足
2020-11-26 23:12:07

竟用涨停设套,天地板惨案又来了!3个步骤远离庄股

财联社
2020-11-27 13:26:28

普拉蒂尼:迭戈改变了我的人生,他是我们那一代人的回忆

虎扑足球
2020-11-27 01:21:01

特斯拉SemiTruck满载40吨开启路测!1000公里续航让戴姆勒卡车负责人直呼:违背物理定律

新智元
2020-11-27 08:48:25

方媛输得彻底?郭富城资产由女助理打理,终于信了Amy姐的话

炒菜炒出花
2020-11-26 11:35:36

成熟妹子的独特魅力!清凉的运动围胸,搭配运动紧身短裤

浅若时尚穿搭秀
2020-11-26 18:28:42

拜登刚刚获胜,立马对中国撂下一番话!美媒发现不对劲

原子之城V
2020-11-26 10:07:37

女性洗澡时也会站着排尿?除了爽,还有2点原因,别不好意思

39健康网
2020-11-23 19:38:11

西南边境又出大事,一架枭龙突然摔成碎片,莫迪第一枪终于打响

小震娱乐站
2020-11-27 10:54:47

伊朗最高领袖,必须满足三个条件,缺一不可,现在只有一个人满足

奔跑的历史哥
2020-11-26 07:10:05

上海丨情侣俩财大气粗!一口气付了77万房租!3天后房东哭了…

上海圈
2020-11-27 10:54:39

女子竟趁着丈夫在家叫来情夫,一夜之后,夫妻被判刑

太原V视界
2020-11-26 15:04:15

女人老牛吃嫩草是什么感觉?这个女人说出了自己的内心话

柒芸儿
2020-11-25 21:40:02

小伙花40万元买辆“事故车”,12缸的宾利欧陆,从新疆拖回广州

郭晓杰爱生活
2020-11-27 09:41:41

国防部发“迎头痛击”警告,我陆战队悄然集结,美台同时后缩

火星方阵
2020-11-27 12:21:08

鲍威尔终于放出大招:提起了双重诉讼指控拜登存在大规模舞弊行为

和讯网
2020-11-27 08:32:51

特朗普败选只因一个女人?若不是她搅局大选,拜登或许赢不了

思远军事
2020-11-26 13:01:21

最后的疯狂,蔡英文受邀“访美”?

每天知守观
2020-11-26 16:09:30

尴尬!贝弗利炮轰哈雷尔加盟湖人不忠诚 自己却成快船清理对象

冷眼观赛
2020-11-27 09:20:02

非洲大国下达“最后通牒”!72小时内开战,中国表现亮了...

环球新军事
2020-11-26 17:21:45
2020-11-27 17:24:59
http://dingyue.ws.126.net/EDFDNtkW5zgKBSDnkh4V=pJiQXYqDT08CfXg9pva2ULm01484902304780.png
集智俱乐部
科普人工智能相关知识技能
1702文章数 2126粉丝数
往期回顾 全部

科技要闻

百度收购YY的交易走向存多种可能

头条要闻

苏贞昌提被大陆列为头号战犯:不忧不惧 大家同舟一命

头条要闻

苏贞昌提被大陆列为头号战犯:不忧不惧 大家同舟一命

体育要闻

太过分!葬礼工作人员合影马拉多纳遗体 立刻遭解雇

娱乐要闻

何猷君舍得?奚梦瑶穿真空裙秀上围

财经要闻

汽车要闻

电动SUV新旗舰 试红旗E-HS9体验VIP待遇

态度原创

游戏
教育
本地
健康
旅游

奇幻动作游戏《Gods Will Fall》预告片公布

教育要闻

清华副教授刘瑜:我女儿正在势不可挡地成为一个普通人

本地新闻

很爱你 却更想逃离你

打玻尿酸变“僵尸脸”咋回事?

旅游要闻

日本惊现9足章鱼 可能与再生能力有关