专访杨强:阿尔法狗已经是上帝?它还有致命弱点

本期对话嘉宾为第四范式联合创始人、首席科学家杨强,他为何潜心研究迁移学习?又对人工智能行业有着怎样的看法?让我们听听他怎么说。

x
用微信扫描二维码
分享至好友和朋友圈

  

  本文系网易智能工作室(公众号smartman163)出品,此篇为《AI英雄》人物专访第22期。

  文 | 广胜

  人在学会自行车之后,再学摩托车就非常容易了。

  我们能将过去的经验带到不同的场景,这样就有了适应新环境的能力,目前,我们试图让机器也拥有这样的能力。

  在一个模型训练任务中,针对某种类型数据获得的关系,也可以轻松应用于同一领域的不同问题,这种技术就叫做迁移学习(Transfer Learning)。

  迁移学习被称为继监督学习之后的下一个机器学习商业成功的驱动力,它的影响力与日俱增,可以运用在图像增强、风格转移、对象检测、疾病检测、翻译、情绪分类等方面,理论上,任何领域之间都可以做迁移学习。

  第四范式联合创始人兼首席科学家、香港科大教授杨强是该领域的代表人物——迁移学习领域论文引用数位列世界第一。此外,作为华人界首个国际人工智能协会AAAI Fellow、至今为止唯一的AAAI华人执委,以及拥有IEEE Fellow、AAAS Fellow、IAPR Fellow等多项头衔,杨强教授在人工智能学术界的影响力可见一斑。

  那么,他为什么如此看重迁移学习?杨强教授认为,生活上我们遇到更多的是小数据,而在小数据上学习的模型才是真正的智能。

  此外,我们希望系统是可靠的,其可以举一反三和融会贯通,这也是我们赋予智慧的一种定义;同时更重要的是如何能够把一个通用的系统加上个人的小数据,而迁移到个人的场景当中去,因此我们可以向个性化方向发展,迁移学习是必不可少的工具。

  与此同时,迁移学习还可以让AI研究摆脱对大数据的依赖。

  杨强教授曾指出,迁移学习技术的目标是让计算机把大数据领域习得的知识和方法,迁移到数据不那么多的领域,这样可以得到效率的提高。

  “在汽车分期营销方面,我们知道汽车每一笔的成交额都是非常大的,那么这种订单的个数是非常少的,所以都是小数据,不过,我们同时还有几千万数据量级的小额交易分期数据,第四范式利用迁移学习建立的模型,能够将一个小数据模型迁移到大笔订单上,最后取得的效果比传统模型要好200%”他举例说到。

  而对于已经尘埃落定的人机大战2.0,杨强教授表达了自己的看法,他坦言,AlphaGo看上去像“神”一样的存在,好像无懈可击,但从机器学习的角度来看,它有致命弱点:AlphaGo没有迁移学习的能力。

  所以,如果改变棋盘大小的话,柯洁还可以继续,而狗就懵了。

  

  以下根据杨强问答实录整理,网易智能(公众号Smartman163)做了不改动原意的删减:

  人类的低质量数据对机器失去了价值

  网易智能:柯洁与阿尔法狗对弈之后,DeepMind宣布了阿尔法狗退役的消息,您觉的阿尔法狗是不是“围棋上帝”?这次人机大战有哪些影响?

  杨强:首先,我们更加意识到了数据的重要性,同时也意识到了数据质量是无止境的,去年人机大战的数据还更多的是人类大师的,但这些数据现在看来对于机器来说是低质量的,而机器通过自我博弈产生的数据才是机器真正需要的高质量数据。

  第二点是计算构架的改进,今年用了TPU,而去年还是GPU、CPU,其实最重要的是找到一种方式让机器可以强化学习,这些是我们学到的东西,但还有一种我们看到大家不太提及,那就是迁移学习。

  

  对于围棋来说,如果改变棋盘的大小柯洁还是可以对弈的,但对于机器来说就不一定的,它需要去学习不同棋盘的数据,人类特别容易适应,这是我们引以为傲的东西,所以说迁移学习是人工智能下一个需要攻破的关口。

  网易智能:您如何看待人工智能技术与行业应用下一步的发展方向?人类未来是否能建立通用人工智能?

  杨强:这当中会伴随着发生几件事情,不仅仅是小数据学习,而且学习的层次要提高。现在的学习还是在大规模的统计模式方面,比方说一个深度学习网络可能有上10亿的参数,每一个参数实际上都是一个小的模式。而我们人在日常生活中也许只用一两个模式,孔夫子说的话其实就是一两个模式来指导我们的行为。人是有这种能力的,因为逻辑有通用性,但如何能够让一个黑箱的深度学习和一个通用型的逻辑互通,这也是一个难题。

  摆脱大数据依赖 迁移学习能干什么?

  网易智能:您常谈到生成式对抗网络模型,您认为这种新的技术未来能够解决怎样的实际问题?

  杨强:可以用生成对抗网络(简称GAN)来很自然地实现迁移学习,主要是在图像、语言、手写等领域。我举一个写字的例子,我们写字的时候,每个人签名都是不同的,我们不会用印刷体来签名,因为我们每个人都有自己的写字的特点。那么,如果用大量的印刷体字作为第一部分的训练样本,来训练一个不错的通用模型,而用某个人手写的斜体字做第二部分的训练样本,就可以利用WGAN把印刷体的模型迁移到个人的签名。也就是说,这样的签名也就更具个性化特点。并且只需要拿很少的斜体字让机器训练即可,并不需要大数据。

  还有在图像方面,我们可以用迁移学习来生成图像,目前很多卡通图像都用到了迁移学习,风格的变化就是一个迁移的例子;然后我认为下一步是口音方面,现在还没有很成熟,但口音的迁移学习同样不需要太多的数据,生成式对抗网络将发挥更大的作用。

  

  网易智能:第四范式一直在努力降低AI技术门槛,之前网易智能采访戴文渊老师他说到:“先知”要做AI领域的Windows,那么技术门槛降低以后,您认为如何丰富应用?

  杨强:平台本身要提供足够多的能力让不同的人在上面搭建应用,其实微软就是这么做的,虽然有通用的应用比如office,但是更多的应用空间还要留给开发者。“先知”作为AI时代的操作系统,有一个开源社区是非常重要的,这件事我们还有很长的路要走,我们会先敢为人先打造一个个例子出来,才能吸引更多的人加入。

  人工智能形态千千万 找对场景是关键

  网易智能:您如何看待亚马逊Echo、Google Home在智能家居上的成功,中国很多企业也在学习同样的模式,但是市场并没有热起来,您觉得问题在哪里?

  杨强:中国可能更多地关注通用型的语音识别,对于家居场景没有特别的关注,这也是因为中外文化的区别,中国人更多的在手机上听,但是外国人喜欢在客厅、厨房里面听,习惯不一样,中国的公司其实已经意识到了场景的重要性,所以现在正在努力,有很多家居音响推出,还有汽车场景里面的应用,我们还需要一点时间。

  

  网易智能:PC承载了传统互联网,手机承载了移动互联网,您认为在人工智能时代,什么是主流的产品形态?

  杨强:人工智能应该是以不同的形式出现,它的形态千千万,没有一个长得像人一样的阿尔法狗,也没有长得像狗一样的阿尔法狗,你根本不知道他长什么样,人工智能更多的是润物细无声。

  比如写作机器人写新闻稿也许就是一个APP,机器人是一个广泛的虚拟概念。

  网易智能:人工智能的应用领域,您现在比较看好哪个方向?自动驾驶会最先爆发吗?

  杨强:自动驾驶在多年以后应该会爆发,这个都是所谓的最终理想,我们还有很多路要走,这个路需要很多垂直落地的场景,所以人工智能不能一步到位,还是需要脚踏实地。

  网易智能:谈谈您在人工智能领域研究的终极目标。

  杨强:目标是想做一个能思考、可以完成很多人类任务的AI,从而把人类解放出来做更多想做的事情,为我们的生活提供便利。(完)

特别声明:本文为网易自媒体平台“网易号”作者上传并发布,仅代表该作者观点。网易仅提供信息发布 平台。

跟贴 跟贴 43 参与 398
© 1997-2017 网易公司版权所有 About NetEase | 公司简介 | 联系方法 | 招聘信息 | 客户服务 | 隐私政策 | 广告服务 | 网站地图 | 意见反馈 | 不良信息举报

AI研究院

聚焦人工智能!

头像

AI研究院

聚焦人工智能!

687

篇文章

20868

人关注

列表加载中...
x

用户登录

网易通行证/邮箱用户可以直接登录:
忘记密码