网易首页 > 网易号 > 正文 申请入驻

OpenAI:社会科学是人工智能安全性的必经之路

0
分享至

全文共2463字,预计学习时长7分钟

图源:tech4law

在人工智能应用方面,确保公平性和安全性是目前所面临的的最大难题,尤其是在AI系统已经在许多方面与人类智力相媲美甚至超越人类的当下,我们必须想办法让这种新的智能形式与人类价值观保持一致。

但难点在于,人类对自身的价值观在大脑中的呈现形式了解甚少,也无法制定对于特定的价值观的描述方式。虽然人工智能只存在于数据中,但价值观是人类进化出社会关系的产物。我们不用神经科学的术语来描述诸如公平或正义的人类价值观,而是用心理学、伦理学或社会学等社会科学的论据来描述。

去年,OpenAI的研究人员发表了一篇论文,介绍了社会科学在人类干预的条件下提高人工智能算法的安全性和公平性的重要性。

我们经常听到这样的说法——需要通过使用公正平衡的训练数据集来避免人工智能算法中的偏差。虽然大多数情况下都是这样,但很多时候公平性无法使用简单的数据规则来描述。

“你更喜欢A还是B”这样的简单问题,在不同语境以及人类理性或情感的影响下,会有不同的答案。假如要在给定数据集中推理出“幸福”,“责任”或“忠诚”这样的思想,我们能简单地用数据来描述那些价值观吗?

人工智能系统也同理。为了与人类价值观保持一致,需要一些学科的支持来更好地理解人类行为。

人工智能价值一致论:通过提出正确的问题来学习

OpenAI团队在其研究论文中引入了人工智能价值一致论的概念,其为“保证人工智能系统完全按照人类的思维行事”,人工智能价值一致论需要在给定上下文中对人类价值观有一定的理解。

图源:forbes


然而,很多时候不能简单地用数据规则解释判定一种价值观。此时OpenAI团队相信理解人类价值观的最好方法就是提出一些简单的问题。

假如要训练一个机器学习分类器,判定给定事件的结果是“更好”还是“更坏”。比如“增税是好是坏?”,也许对政府的社会项目更好,但对个人的经济计划更坏;再比如“今天下雨是好是坏?”,也许对农民更好,而对计划骑自行车旅行的人更坏。

关于人类价值观的问题可以根据特定的上下文有不同的主观答案。从这个角度来看,如果能让人工智能系统提出特定的问题,也许就能学会在特定场景下模仿人类的判断。

提出正确的问题是实现人工智能价值一致论的有效方法,但这种学习方法容易受到人类价值观判断的三个常见的限制:

· 反思平衡:很多时候,对于价值观判断的问题,人类无法得出正确的答案。认知或伦理偏见、缺乏相关知识或对“正确性”的模糊定义都可能造成答案不明,但如果排除大量上下文限制,一个人可能会得出“正确答案”。这在哲学上叫做“反思平衡”,是所有试图学习人类价值观的人工智能算法都应该努力模仿的机制之一。

· 不确定性:即使能够在一个特定问题上达到反思平衡,但是在很多情况下,不确定性或不一致性会阻碍人类得出正确的答案。任何与未来规划有关的活动往往都具有不确定性。

· 欺骗:人类有一种独特的能力,能为一个问题提供看似合理的答案,但其实暗地里提供了错误答案。不论有意或无意,欺骗性或误导性的行为往往造成给定事件的结果与涉事者的价值观相悖。识别欺骗性行为是实现人工智能价值一致论需要解决的一个小难题。

通过辩论学习人类价值观

到目前为止,人工智能价值一致论这一论题主要有两个论点:

· 人工智能系统可以通过提问来学习人类价值观。

· 问题往往容易受到不确定性、欺骗或缺乏反思平衡等的影响。

两相结合,OpenAI团队决定通过依据最纯粹的问答互动形式之一——辩论来引导人工智能体学习人类价值观。

从概念上讲,辩论是一种讨论形式,它将一个复杂的论点分解成重复的一组组更简单的问题,来形成一套通向特定答案的推理方法。OpenAI团队作出如下假设:“在辩论比赛中,最佳的玩法(对人来说最有说服力的论点)会生成对问题真实有效的回答。”

在这个假设的基础上,OpenAI创建了一个比赛,让两个人工智能体展开辩论,试图说服一个人类法官。辩手只为赢得比赛而训练,不受与人类判断分离的真理的驱使。对人来说,目标是了解人是否有足够的能力作为辩论法官来使这一方案生效;如果方案无效,如何修改辩论来修复它。

在辩论中使用人工智能辩手是一个理想设定,但技术还没到位。大多数真实的辩论都使用复杂的自然语言模式,这些模式超出了当今人工智能系统的能力。当然,像IBM Project Debater这样的发明正在迅速缩小这一差距。

为了避免人工智能辩手的局限性,OpenAI的方案中有两个人类辩手和一个人类裁判。这个辩论比赛的结果用来训练人工智能-人工智能-人类设置。

图源: OpenAI

为了测试用辩论模型训练人工智能系统的可行性,OpenAI团队创建了一个原型网站,两名辩手在网站上就一幅图像的内容进行辩论。

比赛中有一张猫或狗的图片,将该图片展示给两名辩手,但不展示给评委。一个辩手诚实地为图片的真实内容进行辩论;另一个辩手撒谎。辩手可以与裁判交谈,并通过在图片上画矩形来佐证,但裁判只看到矩形范围内的图片。

在辩论结束时,每位辩手可以向评委透露一个像素,这是辩论中唯一不能说谎的部分。辩论的输出用于训练复杂的图像分类器。

图源:OpenAI

辩论能够帮助我们理解人类和人工智能体之间关系的重要问题。

将社会科学应用于人工智能并不是一个新的想法,但OpenAI的努力是在这一领域迈出的务实的第一步。当社会科学专注于理解现实中的人类行为时,人工智能等则以人类行为的最佳版本作为出发点。可以说,社会科学与人工智能相结合可以使得机器更公平、更安全。

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
257台光刻机,7500亿元!荷兰突然宣布,外媒:恐有“灭顶之灾”

257台光刻机,7500亿元!荷兰突然宣布,外媒:恐有“灭顶之灾”

元芳
2024-05-21 07:49:09
泼天的富贵轮到哈工大!普京上任首访选择哈工大,原因不言而喻

泼天的富贵轮到哈工大!普京上任首访选择哈工大,原因不言而喻

阿蒙聊教育
2024-05-17 22:20:43
自作自受!美对华加征新关税后, 蝴蝶效应来得如此之快?

自作自受!美对华加征新关税后, 蝴蝶效应来得如此之快?

开心体育站
2024-05-20 20:28:51
2024年养老金调整方案即将公布,事退人员涨幅会低于3%吗?看看

2024年养老金调整方案即将公布,事退人员涨幅会低于3%吗?看看

社保小达人
2024-05-21 12:56:41
“监狱海王”王东有多牛?坐牢交往7个女人,连狱警妻子都不放过

“监狱海王”王东有多牛?坐牢交往7个女人,连狱警妻子都不放过

平安是福呀
2024-05-08 22:16:53
博主声称小米派人堵家门口,不删微博就折腾他父母

博主声称小米派人堵家门口,不删微博就折腾他父母

映射生活的身影
2024-05-21 13:18:19
不少上海人收到短信,警方紧急提醒:不要点击!

不少上海人收到短信,警方紧急提醒:不要点击!

上观新闻
2024-05-21 10:23:03
家有三个儿子是什么体验?网友:婚姻嘎嘎稳定,评论区太欢乐了

家有三个儿子是什么体验?网友:婚姻嘎嘎稳定,评论区太欢乐了

户外阿崭
2024-05-14 06:55:27
赖清德上台,岛内发最新民调,赵少康说了实话,王毅发出统一强音

赖清德上台,岛内发最新民调,赵少康说了实话,王毅发出统一强音

靓仔情感
2024-05-21 00:34:54
央视直播海港VS蓉城!武磊PK韦世豪 穆斯卡特领教乱七八糟的战术

央视直播海港VS蓉城!武磊PK韦世豪 穆斯卡特领教乱七八糟的战术

刀锋体育
2024-05-21 13:17:49
大瓜!黄圣依直播意外走光!隐私一览无遗,网友:为流量脸都不要

大瓜!黄圣依直播意外走光!隐私一览无遗,网友:为流量脸都不要

圈里的甜橙子
2024-05-21 13:17:17
李佳琦谈今年618很难反被网友怼是因为你自己不够努力吗

李佳琦谈今年618很难反被网友怼是因为你自己不够努力吗

毒舌说历史1
2024-05-20 19:57:42
蒙牛创始人牛根生:淡出蒙牛后,在加拿大“再创业”仍是风生水起

蒙牛创始人牛根生:淡出蒙牛后,在加拿大“再创业”仍是风生水起

李哥三观很正
2024-05-20 14:53:23
网红煎饼店:香港开分店遭抵制,港人最担忧的还是内地食品安全

网红煎饼店:香港开分店遭抵制,港人最担忧的还是内地食品安全

大风文字
2024-05-21 06:37:20
一家三口长期吃"自制馄饨",全都确诊胰腺癌,妻子痛哭:是我错了

一家三口长期吃"自制馄饨",全都确诊胰腺癌,妻子痛哭:是我错了

105度的世界
2024-05-21 08:38:36
北京楼市迎来十年不遇买入时机,城区房产依然是最佳投资渠道

北京楼市迎来十年不遇买入时机,城区房产依然是最佳投资渠道

胡说房市
2024-05-20 22:17:43
林志颖周慧敏时隔三十年再见面,两人容貌不老,56岁周慧敏超年轻

林志颖周慧敏时隔三十年再见面,两人容貌不老,56岁周慧敏超年轻

娱圈小愚
2024-05-20 15:53:36
国家正式批复!河南再添一座“重磅”水库!

国家正式批复!河南再添一座“重磅”水库!

科学发掘
2024-05-21 09:34:33
喜剧一哥身体不行了

喜剧一哥身体不行了

毒舌扒姨太
2024-05-19 22:11:58
12GB+512GB+2TB扩展,顶配版仅售1799元,打破手机储存纪录

12GB+512GB+2TB扩展,顶配版仅售1799元,打破手机储存纪录

科技阿维
2024-05-20 11:50:32
2024-05-21 14:04:49
读芯术
读芯术
专注年轻人的AI学习平台
2097文章数 5641关注度
往期回顾 全部

科技要闻

理想业绩下滑:纯电车跳票 好日子告一段落

头条要闻

小米车主花近30万提车不到1个月 汽车2次智驾失灵

头条要闻

小米车主花近30万提车不到1个月 汽车2次智驾失灵

体育要闻

兄弟们,为了我,拿下冠军吧!

娱乐要闻

杨洋乔欣聊天记录曝光!还牵扯张天爱

财经要闻

重营销轻研发 “扫地茅”股价已跌去78%

汽车要闻

四排八座纯电MPV/续航超过800km 翼真L380开启预订

态度原创

亲子
家居
房产
健康
公开课

亲子要闻

11个月的宝宝学说话对着爸爸喊“儿子”18斤的体重17斤的反骨

家居要闻

生活蜕变 简约理念雕刻理想居所

房产要闻

突然爆发!大量重磅宅地挂出,海南土地市场开始狂飙!

在中国,到底哪些人在吃“伟哥”?

公开课

近视只是视力差?小心并发症

无障碍浏览 进入关怀版