微软小冰是谁?东莞格子网络来告诉你~
微软小冰是微软(亚洲)互联网工程院基于2014年提出建立的情感计算框架,通过算法、云计算和大数据的综合运用,采用代际升级的方式,逐步形成向EQ方向发展的完整人工智能体系。 微软小冰是微软人工智能三条全球产品线之一。
2014 年,第一代微软小冰发布,最初她以微信公众号的形式存在,可以用不那么生硬的语气回答天气、交通、星座相关问题。在之后的五年里,小冰又出现在 QQ、网易云音乐等App 中,用俏皮话与用户留言互动;最新的消息是,小冰将与小米OV等厂商合作上线“召唤小冰”,还要给阅文集团的IP定制形象。
在诞生之初,小冰以“有情绪”著称。与那些你问它答的语音机器人不同,小冰会生气,会吐槽,还会拒绝你不健康的请求。时任微软全球执行副总裁陆奇曾在复盘小冰时说过:“AI 产品应该在 IQ 之外,引入 EQ 这个新维度。”
如今的微软小冰越来越像个人了
东莞格子网络得知,在8 月中旬微软“小冰七代”的年度发布中,微软团队又演示了小冰新开发的多个场景:
1、 两位微软研究员在开车途中唤醒小冰,当驾驶员在与小冰的聊天中出现“堵车烦躁、开车犯困”之类的表达后,小冰会立刻回应:“我给你讲个笑话吧”、“要不要给你唱首歌”。
微软小冰开车测试中
2、一个日本宅男拿着手机、戴着耳机去逛水族馆,宅男时刻与手机中的小冰进行互动,当小冰通过图像、声音感知到宅男来到“水母”展馆时,她发出了“水母好漂亮啊~”的赞叹,宅男则欣喜地回应:“是啊是啊,很漂亮。”
3、微软还展示了一段小冰与消费者的截图对话。在这十轮对话中,小冰用对话引导用户明确了购物需求,最终成功在第九轮推荐用户下单了照相机。
这三个场景实际上代表了微软小冰进阶的三种技术类型——不用唤醒词即可在车载场景下与小冰发生多轮对话,这叫“全双工语音交互”;结合视觉、对话与小冰边听边说,这是“多模态感官交互”;引导用户明确购买需求,这被称作“主导对话”。
微软“虚拟歌姬”
就在今年五月,微软举办了一场特殊的“演唱会”,听众皆是科技媒体的专业编辑与记者,而演唱者则是微软小冰——一个诞生于2014年的对话式人工智能。东莞格子网络抱着怀疑的态度试听了一下小冰演唱片段,片段分为3种唱腔,一种普通歌声,另一种是难度较高的戏腔,第三种是日语唱腔。
从听感上讲,小冰的声音流畅自然,较为完整地还原了人类在唱歌时的特有的细节与表现,极少有特别明显的“电子音”,尽管未达到绕梁三日的水准,但也称得上是相当出色的拟人表现,普通人很难直接分辨出唱歌的是一位“虚拟歌姬”。
2014年5月29日至今,微软小冰五年迭了七代。如果说如何见证人工智能的进化速度,小冰无疑给当下的人工智能产业提供了一个范本,从纯文本到语音、视频、机器视觉,到全双工、生成模型,到实时视觉、共感模型、发布Dual AI战略……每一代都有一个跨越式的进步。
微软全球执行副总裁,微软人工智能及微软研究事业部负责人沈向洋博士
更令人期待的是,Avatar Framework 不是专属大公司的服务,微软预计在明年春天向个人消费者公布这项服务。这意味着人工智能不再是统一的性格、声音和肢体表达,并且服务于所有人。目前公布的 Avatar Framework 企业版,包含了需要编程的功能,在面向个人消费者,这部分会做一定程度的调整,以方便使用。
拥有“克隆”能力的Avatar Framework,意味着拥有这项技术的人可以创造属于自己的小冰。不管你看得见还是看不见,小冰似乎变得无处不在了。根据微软公布的最新数据,小冰在全球覆盖的用户量有 6.6 亿,第三方设备则有 4.5 亿台。
(图片来源于网络)
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.