经过一个寒假返回学校,你可能才会忘了前一学期学到的内容。而如果你像人工智能系统那样学习,实际上你会在学习新知识的同时,大脑便逐渐遗忘之前的内容,其原因就在于人工智能遭遇了“灾难性遗忘”。
近日,来自谷歌大脑的最新研究发现,在街机学习环境的由多个子任务组成的单任务场景中也存在着“灾难性遗忘”。特别像在蒙特祖玛的复仇这种探索型游戏里,场景变化较大,也会出现学习完当前游戏场景后,忘记上一个游戏场景知识的情况。
人工智能为什么会产生“灾难性遗忘”?目前,解决灾难性遗忘的方案有哪些?难点在哪?就此,科技日报记者采访了有关专家。
学一个忘一个,深度学习效率低下
自从阿尔法狗相继战胜多名围棋冠军后,深度强化学习成为人工智能领域最耀眼的“明星”,也是各大研发机构角逐的主战场。而谷歌大脑团队这次面临的“灾难性遗忘”,正是人工智能深度学习中一个普遍且严重的问题。
“‘灾难性遗忘’指的是人工智能系统,如深度学习模型,在学习新任务或适应新环境时,忘记或丧失了以前习得的一些能力。”腾讯人工智能实验室副主任俞栋博士在接受科技日报记者采访时说,“灾难性遗忘”会造成人工智能系统在原有任务或环境性能大幅下降。
美亚柏科信息中心总经理魏朝东说,在深度神经网络学习不同任务的时候,相关权重的快速变化会损害先前任务的表现,通俗来说,就是在学习中像猴子搬苞谷,捡一个丢一个,记住了新知识,也有可能会忘掉了老知识。
正源于此,“灾难性遗忘”的存在,一定程度上限制了人工智能在一些场景中的应用。
福州大学数学与计算机科学学院、福建省新媒体行业技术开发基地副主任柯逍博士举例说,如一个AI图像识别系统,当需要添加一个新的类别的物体时,就不得不把原先的所有物体都再学习一次;或在文物鉴定系统中,当有一天发现原始数据中有一个文物朝代错了,同样没办法单独对这一个错误的文物进行修改学习;再如,让AI系统学习英语之后,再让它学习德语,它可能会把原来学习的英语语法全部忘光。
而在谷歌大脑的最新研究的游戏场景中,“灾难性遗忘”又造成了哪些影响?有何新颖的发现?
“除了传统新知识学习会覆盖旧知识之外,谷歌大脑还发现,在如超级玛丽等探索型游戏里,‘灾难性遗忘’会阻碍模型对新知识的学习。”厦门大学人工智能系、科技处副处长纪荣嵘教授说。
纪荣嵘进一步解释说,面向街机游戏学习的强化学习方法都会采用“经验回放”的训练方式,就是将模型在游戏探索时候的片段进行保存,然后给模型进行“回放”训练。而像蒙特祖玛复仇这种游戏,游戏场景变化比较大,模型需要不间断探索游戏场景,因此,在训练时候就必须不断回放早期场景的游戏经验,不然会因为“灾难性遗忘”而忘记了早期的游戏知识。
“这也导致了,新的游戏经验虽然能够被采样到“经验回放”库里,但因为学习方式的设定,导致学习效率低,同时由于不同阶段的学习会互相干扰,使得AI无法一次通过该游戏的全部关卡。”纪荣嵘说。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.