网易首页 > 网易号 > 正文 申请入驻

像人类一样理解并预测物理世界有多难?

0
分享至

(《麻省理工科技评论》中英文版APP现已上线,年度订阅用户每周直播科技英语讲堂,还有科技英语学习社区哦~)

特别感谢 MIT 博士生吴佳俊对本文的贡献

麻省理工学院(MIT)脑和认知科学系教授约书亚·特南鲍姆 (Josh Tenenbaum) 是学校脑、思维、机器研究中心 (Center for Brains, Minds, and Machines) 智能发展研究方向的主任。这一跨学院、交叉学科的科研平台致力于探索、解释和复制人类的智能。

在今年的神经信息处理系统大会 (NIPS) 上,特南鲍姆与他的博士生吴佳俊发表了四篇论文,探讨了智能体需要哪些基本认知能力才能够探索世界,其中就包括辨别不同的物体,并且推断该物体将会对施加于其的物理量做出怎样的反应。

研究人员相信,通过一步步构建拥有上述能力的计算机系统,他们最终能够帮助搞清楚关于人类在智力发展各个阶段是如何使用哪些信息来处理问题的。在这个过程中,研究人员甚至可能得到一些用于研究机器人视觉系统的新思路。

所有这些研究项目的共同主题,是让计算机真正地试着感知物理”,特南鲍姆认为,“要做到这一点,计算机首先要恢复物体的完整三维形状,并且分析这些物体身处的场景以及它们的关系,还有其物理特性比如质量和摩擦力,之后才能推断这些物体将如何随时间推移而变化。佳俊的四篇论文讨论了整个问题。其中,三篇论文讨论了如何能从视觉和听觉数据中推断出物体的物理结构,另一篇则讨论了如何在上述数据的基础上预测物体的表现。结合在一起,我们可以开始构建一些计算模型来更好地描述人类对于物理世界的认知。

双向而行

把所有四篇论文联系在一起的另一个因素是,他们运用了与众不同的机器学习方法。机器学习是一种通过让计算机分析大量训练数据来让执行计算任务的技术。在一个传统的机器学习系统中,用于训练的数据被事先标记好,系统会尝试学习分析这些数据的特征与哪些标签相关联。而评价机器学习的一个标准是,计算机正确标记出了多少事先未被标记的数据

在他们的论文中,系统被训练用于推断世界的物理模型——例如推断某个大部分都隐藏在视野之外的物体的三维形状。之后模型被反向运用,使用系统输出的模型再合成输入数据,并且通过重建的数据与原始数据相匹配的程度来评价系统的推断水平。

比如说,构建的三维模型需要分析并剥离出所有挡住对象的遮蔽物,还要滤除掉该对象的视觉纹理,反射和阴影,并且要能够推断出视野之外的对象形状。当吴佳俊和特南鲍姆的系统建立模型后,系统还需要把三维模型在空间中旋转到图片上的位置,并给模型添加上视觉纹理,直到最终可以近似输入图像数据。

事实上,研究人员的四篇论文中有两篇论述了从图像数据推断三维模型的复杂性。共同参与撰写这些论文的还有另外四位麻省理工学院的研究人员,包括电气工程与计算机科学教授威廉·弗里曼 (William Freeman),以及来自 DeepMind、上海科技大学和上海交通大学的研究人员。

分而治之

此次建立起来的系统基于麻省理工学院神经科学家大卫·马尔 (David Marr) 一项非常有影响力的理论。马尔在 1980 年英年早逝,年仅 35 岁。根据马尔的假设,人脑在解释一个视觉场景时,会首先创建一个 2.5 维“草图”用于表示可见物体的表面。然后,在这个 2.5 维“草图”的基础上 (而非这个场景的原始视觉信息的基础上),大脑继续推断出所看到物体的完整三维形状。

这两个问题都很难,但是至少我们有一个很好的方法来分解它们”,吴佳俊说,“这样你可以一次处理一个问题,而不是同时解决它们,那样难度会更大。”

图丨吴佳俊 ,2010 年毕业于华东师范大学第二附属中学,获全国青少年信息学奥林匹克竞赛一等奖保送至清华大学,就读于交叉信息院计算机科学实验班 ( 著名的姚期智班 )。他现为麻省理工学院四年级博士生,已在 CVPR,NIPS,ECCV,PAMI 等会议和期刊上发表 20 余篇论文,曾荣获清华大学特等奖学金、百度奖学金、Facebook 奖学金等

吴佳俊和他的合作者使用包括视觉图像与图像上物体的三维模型数据对系统进行训练。构建真实照片中物体的精确三维模型将耗时过长,因此在最初阶段,研究人员使用生成的数据来训练这个系统。其中,图像数据从三维模型渲染而成。整个创建数据的过程大概和创建电脑动画电影一样。

当训练系统学习合成的数据之后,就可以把精度调得更高然后使用实际数据对系统进行训练学习。评价系统学习效果的最终指标是系统再生成的重建模型与输入数据对比的准确度。

在评估系统时,研究人员使用了一种常用的名为交并比的评估方法。在这一度量下,他们的系统胜过了上一代。另一方面,由于交并比不能很好的刻画模型的局部细节,吴佳俊和他的同事们也运用众包方法,让用户评价模型对源图像中物体重建的精确度。74% 的参与者认为新系统的重建结果优于前一代。

时间永是流驶

在吴佳俊和特南鲍姆、弗里曼的另一篇论文中,他们训练了一个系统来分析物体落下的声音,以推断物体的形状,材质以及它落下的高度。参与这项研究的还有麻省理工学院,剑桥大学和上海科技大学的研究人员。同样的,系统被训练去生成某一物体的抽象模型,然后再反过来,利用这个模型来模拟它从特定高度落下时将会产生的声音。根据合成声音和源声音之间的相似性,最终可以判断这个系统的性能。

最后,在他们的第四篇论文中,吴佳俊、特南鲍姆、弗里曼、DeepMind 和牛津大学的合作者构建了一个系统,这个系统开始模拟人类直觉如何理解作用于物体的物理量。这篇论文的假设起点是之前的三篇论文所描述的最终结果:即假设系统已经成功推导出物体的三维形状。

论文中使用了简单形状的物体进行研究:球和立方体。研究人员训练他们的系统执行两项任务,首先是让系统估测在台球桌上行进的台球的速度,并据此预测台球在碰撞之后的表现。另外一项任务则是分析堆叠的立方体的静态图像,并预测这些立方体会不会掉落,如果会掉落的话,立方体将落在哪里。

吴佳俊提出了一种被他称之为场景 XML 的表征语言,可以定量描述视觉场景中的物体的相对位置。在研究中,系统首先要学习用这种语言来描述所输入的数据,然后系统将描述出的结果提供给一个“物理引擎”,这个物理引擎可以对作用于所研究物体上的物理力进行建模。物理引擎既是计算机动画也是科学计算中的重要组成部分,在计算机动画中物理引擎被用来生成衣服的移动,物体的落下等,在科学计算中,物理引擎则被用于大规模的物理模拟。

当物理引擎完成球和立方体运动预测的之后,这些信息会被送到给图像渲染引擎中。渲染引擎生成的输出会再次与源图像进行比较。与在视觉重建研究中使用的方法一样,研究人员先用合成数据训练系统,然后再细化精度,使用真实数据训练他们的系统。

在测试中,新的系统同样比现有的系统有更好的表现。在预测台球运动的实验中,新系统时常比人类表现得更好。

“这些工作中的最关键的洞察力在于利用物理工具——渲染器,模拟引擎,训练好的模型——来训练生成模型”,南加州大学计算机科学助理教授约瑟夫·林 (Joseph Lim) 评论,“当把这个简单而优雅的想法与最新最先进的深度学习技术相结合时,我们看到了机器在多项解释物理世界的任务中取得的巨大成果。”

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
2026全美中锋第4!中国男篮17岁长臂2米30天才上榜,未来进NBA?

2026全美中锋第4!中国男篮17岁长臂2米30天才上榜,未来进NBA?

李喜林篮球绝杀
2024-04-25 11:24:08
这一细节首次披露!二十大后首个落马的正部级,有新消息

这一细节首次披露!二十大后首个落马的正部级,有新消息

政知新媒体
2024-04-24 15:02:49
新华社快讯:俄罗斯副外长里亚布科夫表示,如果俄方资产被“实质性没收”,俄方将考虑降低与美国的外交关系。

新华社快讯:俄罗斯副外长里亚布科夫表示,如果俄方资产被“实质性没收”,俄方将考虑降低与美国的外交关系。

新华社
2024-04-25 20:24:50
“太可怕了!”苹果手机被指搜“发现石油”会触发定位,客服:任何操作都可能…

“太可怕了!”苹果手机被指搜“发现石油”会触发定位,客服:任何操作都可能…

北京商报
2024-04-25 08:07:08
比投资篮球成功!乔丹谈车队胜利:我太兴奋了,感觉像季后赛

比投资篮球成功!乔丹谈车队胜利:我太兴奋了,感觉像季后赛

懂球帝
2024-04-25 15:02:45
爱情公寓秦羽墨扮演者新开美甲店被吐槽技术不好,店员回应

爱情公寓秦羽墨扮演者新开美甲店被吐槽技术不好,店员回应

金羊网
2024-04-25 15:23:17
杨幂这脸看上去没有60也得有50了吧

杨幂这脸看上去没有60也得有50了吧

室内设计师阿喇
2024-04-25 20:51:47
实话实说!2002年世界杯,米卢最对不起的应该是以下3名球员

实话实说!2002年世界杯,米卢最对不起的应该是以下3名球员

百里无心
2024-04-25 07:15:22
庚欣:布林肯此次访华,可用4句话概括

庚欣:布林肯此次访华,可用4句话概括

直新闻
2024-04-24 19:17:33
还能夺冠吗?克洛普:需要阿森纳和曼城表现糟糕 为今天表现道歉

还能夺冠吗?克洛普:需要阿森纳和曼城表现糟糕 为今天表现道歉

直播吧
2024-04-25 05:36:15
国务院报告:适时合理调整国有金融资本在银行、保险、证券等行业的比重

国务院报告:适时合理调整国有金融资本在银行、保险、证券等行业的比重

北京商报
2024-04-25 20:05:19
20时,35岁张琳芃摊牌,官宣决定,国足批准,武磊遗憾

20时,35岁张琳芃摊牌,官宣决定,国足批准,武磊遗憾

东球弟
2024-04-25 15:58:12
6000万,耻辱性报价!西媒:曼联盯上25岁国米铁卫,皇马举棋不定

6000万,耻辱性报价!西媒:曼联盯上25岁国米铁卫,皇马举棋不定

叁炮体育
2024-04-25 14:29:17
妹妹被局长开除后摆地摊,五年后,哥哥调来担任市委书记

妹妹被局长开除后摆地摊,五年后,哥哥调来担任市委书记

乔生桂
2024-04-20 19:44:55
农夫山泉纯净水新品“小绿瓶”已在线下铺货,零售2元/瓶

农夫山泉纯净水新品“小绿瓶”已在线下铺货,零售2元/瓶

红星新闻
2024-04-25 14:39:17
过分了!都加入北约了还想让中国追加650亿美元的支援,咋想的?

过分了!都加入北约了还想让中国追加650亿美元的支援,咋想的?

云姐闲聊
2024-04-25 07:53:26
这谁顶得住嘛!迪恩这身材,这才是尤物啊!

这谁顶得住嘛!迪恩这身材,这才是尤物啊!

冷却爱情
2024-04-25 15:17:13
越闹越大!重庆燃气还未解决,重庆水费又出现问题,评论区笑死了

越闹越大!重庆燃气还未解决,重庆水费又出现问题,评论区笑死了

平祥生活日志
2024-04-25 12:55:56
基努·里维斯:帅到令人发指,59岁才结婚,新娘比他小5岁满头白发

基努·里维斯:帅到令人发指,59岁才结婚,新娘比他小5岁满头白发

毒舌小红帽
2024-04-23 19:12:55
绝地反击!TikTok总裁周受资:我们不会去任何地方

绝地反击!TikTok总裁周受资:我们不会去任何地方

直新闻
2024-04-25 11:26:37
2024-04-26 01:28:50
DeepTech深科技
DeepTech深科技
麻省理工科技评论独家合作
13763文章数 511322关注度
往期回顾 全部

科技要闻

北京车展,被穿红衣服的他们占领

头条要闻

河北一高校学生就读4年无学籍 省教育厅回应

头条要闻

河北一高校学生就读4年无学籍 省教育厅回应

体育要闻

当胜利变成意外,就不要再提未来……

娱乐要闻

心疼!伊能静曝儿子曾被狗仔追到洗手间

财经要闻

24年后再产纯净水 农夫山泉为何要打自己脸

汽车要闻

全新哈弗H9亮相 大号方盒子硬派SUV入列

态度原创

亲子
游戏
家居
手机
公开课

亲子要闻

女孩发布了自己日常锻炼的视频,各种花式俯卧撑都轻松拿捏,小朋友你伤到大朋友们的自尊心了。

《剑星》偷跑结局已泄露:多结局设定 角色命运不同

家居要闻

光影之间 空间暖意打造生活律动

手机要闻

华为鸿蒙OS 4.2正式版来袭:22款设备步入新纪元,升级预告也来了

公开课

睡前进食会让你发胖吗?

无障碍浏览 进入关怀版