从能歌善舞的清纯少女到商业界的成熟形象，微软小冰长大了

分享至

微软小冰是谁？东莞格子网络来告诉你~

微软小冰是微软（亚洲）互联网工程院基于2014年提出建立的情感计算框架，通过算法、云计算和大数据的综合运用，采用代际升级的方式，逐步形成向EQ方向发展的完整人工智能体系。微软小冰是微软人工智能三条全球产品线之一。

2014 年，第一代微软小冰发布，最初她以微信公众号的形式存在，可以用不那么生硬的语气回答天气、交通、星座相关问题。在之后的五年里，小冰又出现在 QQ、网易云音乐等App 中，用俏皮话与用户留言互动；最新的消息是，小冰将与小米OV等厂商合作上线“召唤小冰”，还要给阅文集团的IP定制形象。

在诞生之初，小冰以“有情绪”著称。与那些你问它答的语音机器人不同，小冰会生气，会吐槽，还会拒绝你不健康的请求。时任微软全球执行副总裁陆奇曾在复盘小冰时说过：“AI 产品应该在 IQ 之外，引入 EQ 这个新维度。”

如今的微软小冰越来越像个人了

东莞格子网络得知，在8 月中旬微软“小冰七代”的年度发布中，微软团队又演示了小冰新开发的多个场景：

1、两位微软研究员在开车途中唤醒小冰，当驾驶员在与小冰的聊天中出现“堵车烦躁、开车犯困”之类的表达后，小冰会立刻回应：“我给你讲个笑话吧”、“要不要给你唱首歌”。

微软小冰开车测试中

2、一个日本宅男拿着手机、戴着耳机去逛水族馆，宅男时刻与手机中的小冰进行互动，当小冰通过图像、声音感知到宅男来到“水母”展馆时，她发出了“水母好漂亮啊~”的赞叹，宅男则欣喜地回应：“是啊是啊，很漂亮。”

3、微软还展示了一段小冰与消费者的截图对话。在这十轮对话中，小冰用对话引导用户明确了购物需求，最终成功在第九轮推荐用户下单了照相机。

这三个场景实际上代表了微软小冰进阶的三种技术类型——不用唤醒词即可在车载场景下与小冰发生多轮对话，这叫“全双工语音交互”；结合视觉、对话与小冰边听边说，这是“多模态感官交互”；引导用户明确购买需求，这被称作“主导对话”。

微软“虚拟歌姬”

就在今年五月，微软举办了一场特殊的“演唱会”，听众皆是科技媒体的专业编辑与记者，而演唱者则是微软小冰——一个诞生于2014年的对话式人工智能。东莞格子网络抱着怀疑的态度试听了一下小冰演唱片段，片段分为3种唱腔，一种普通歌声，另一种是难度较高的戏腔，第三种是日语唱腔。

从听感上讲，小冰的声音流畅自然，较为完整地还原了人类在唱歌时的特有的细节与表现，极少有特别明显的“电子音”，尽管未达到绕梁三日的水准，但也称得上是相当出色的拟人表现，普通人很难直接分辨出唱歌的是一位“虚拟歌姬”。

2014年5月29日至今，微软小冰五年迭了七代。如果说如何见证人工智能的进化速度，小冰无疑给当下的人工智能产业提供了一个范本，从纯文本到语音、视频、机器视觉，到全双工、生成模型，到实时视觉、共感模型、发布Dual AI战略……每一代都有一个跨越式的进步。

微软全球执行副总裁，微软人工智能及微软研究事业部负责人沈向洋博士

更令人期待的是，Avatar Framework 不是专属大公司的服务，微软预计在明年春天向个人消费者公布这项服务。这意味着人工智能不再是统一的性格、声音和肢体表达，并且服务于所有人。目前公布的 Avatar Framework 企业版，包含了需要编程的功能，在面向个人消费者，这部分会做一定程度的调整，以方便使用。

拥有“克隆”能力的Avatar Framework，意味着拥有这项技术的人可以创造属于自己的小冰。不管你看得见还是看不见，小冰似乎变得无处不在了。根据微软公布的最新数据，小冰在全球覆盖的用户量有 6.6 亿，第三方设备则有 4.5 亿台。

（图片来源于网络）

特别声明：以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布，本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.