网易首页 > 网易号 > 正文 申请入驻

人像抠图满足不了研究者了,这个研究给动物抠图,毛发根根分明

0
分享至

编辑:魔王

相比于人像抠图,长相各异、浑身毛茸茸的动物似乎难度更大。IEEE 会士 Jizhizi Li、陶大程等人开发了一个专门处理动物抠图的端到端抠图技术 GFM。

在这个图像和视频逐渐成为主流媒介的时代,大家早已对「抠图」习以为常,说不定还看过几部通过「抠图」拍摄的电视剧呢。然而,相比于人像抠图,长相各异、浑身毛茸茸的动物似乎难度更大。

那么,是否有专用于动物的抠图技术呢?IEEE 会士 Jizhizi Li、陶大程等人就开发了一个专门处理动物抠图的端到端抠图技术。

动物的外观和毛皮特征给现有的方法带来了挑战,这些方法通常要求额外的用户输入(如 trimap)。

为了解决这些问题,陶大程等人研究了语义和抠图细节,将任务分解为两个并行的子任务:高级语义分割和低级细节抠图。具体而言,该研究提出了新型方法——Glance and Focus Matting network (GFM),使用共享编码器和两个单独的解码器以协作的方式学习两项子任务,完成端到端动物图像抠图。

研究人员还创建了一个新型动物抠图数据集 AM-2k,它包含 20 个类别的 2000 张高分辨率自然动物图像,并且具备手动标注的前景蒙版。

此外,该研究通过对前景和背景图像之间的不同差异进行综合分析,来研究合成图像和自然图像之间的领域差距(domain gap)问题。研究人员发现,其精心设计的合成流程 RSSN 能够降低差异,带来更好的、泛化能力更强的模型。在 AM-2k 数据集上的实验表明,GFM 超过当前最优方法,并且有效降低了泛化误差。

动物图像抠图方法 GFM

在给动物图像抠图时,人类首先会浏览一下图像,快速识别出大致的前景或背景区域,然后聚焦于过渡区域,将动物细节与背景区分开来。这可以大致形式化为分割阶段和抠图阶段。注意,这两个阶段可能会出现交叉,因为第二阶段的反馈信息可以纠正第一阶段错误的决策。

为了模仿人类经验,使抠图模型具备处理这两个阶段的能力,有必要将其合并进一个模型,并显式地建模二者之间的协作。因此,研究者提出了新型 GFM 网络,进行端到端的自然动物图像抠图,模型架构参见下图:

图 2:GFM 网络架构图示。它包含一个共享编码器和两个单独的解码器,解码器分别负责图像分割和细节抠图。

新型图像合成流程 RSSN

为自然图像标注前景蒙版费时费力且成本高昂,常见的操作是基于一些前景图像和成对前景蒙版生成大规模合成图像。

目前常见的蒙版合成流程是通过蒙版混合(alpha blending)将一个前景粘贴至不同的背景。但由于前景图像和背景图像通常采样自不同的分布,合成图像会出现大量合成伪影,从而导致合成图像和自然图像之间出现较大的领域差距。合成伪影可能会被模型误以为是 cheap feature,从而导致在合成图像上过拟合,在自然图上出现较大的泛化误差。

该研究系统地分析了引起合成伪影的因素:分辨率差异、语义模糊、锐度差异和噪声差异,并提出了解决方案——一套新的合成流程 RSSN 和大规模高分辨率背景数据集 BG-20k

RSSN 的整体流程如下所示:

下图对比了不同合成图像方法,其中 c 和 d 使用的背景图像来自 BG-20k 数据集:

BG-20k 数据集具备以下特征:

动物图像抠图数据集 AM-2K

AM-2k 数据集包含 20 个类别的 2000 张高分辨率自然动物图像,并且具备手动标注的前景蒙版。研究者将该数据集分割为训练集和验证集,并设置了两个评估 track:ORI-Track (Original Images Based Track) 和 COMP-Track (Composite Images Based Track)。

下表展示了 AM-2k 数据集与现有抠图数据集的对比情况:

该数据集中的示例参见下图:

实验

定量和主观评估

下表 2 展示了多种 SOTA 方法在 AM-2k ORI-Track 上的结果:

与 SOTA 方法相比,GFM 在所有评估指标上均超过它们,通过同时分割前景和背景图像以及在过渡区域抠图,取得了最优性能。

下图 6 展示了不同方法在 AM-2k ORI-Track 上的定性对比结果:

从图中可以看出,SHM、LF 和 SSS 无法分割一些前景部分,因为其分段式结构导致模型无法显式地分辨前景 / 背景和过渡区域。语义分割和抠图细节是很难平衡的,分别需要全局语义特征和局部结构特征。HAtt 和 SHMC 无法获得过渡区域的清晰细节,因为全局指引有助于识别语义区域,但对细节抠图的用户就没那么大了。

相比而言,GFM 获得了最优结果,这得益于其统一模型,使用单独的解码器处理前景 / 背景和过渡区域,并以协作的方式进行优化。

模型集成和混合分辨率测试

如下表 3 所示,模型集成的结果优于单个模型:

控制变量研究

控制变量研究结果如下表 4 所示:

模型复杂度分析

如下表 5 所示,使用 DenseNet-121 或 ResNet34 作为主干网络的 GFM 在运行速度上超过 SHM、LF、Hatt 和 SHMC,它们处理一张图像分别只需大约 0.2085s 和 0.1734s。

论文地址:https://arxiv.org/pdf/2010.16188v1.pdf

GitHub 地址:https://github.com/JizhiziLi/animal-matting

特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。

Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.

相关推荐
热点推荐
命好!帕瓦尔连续五个赛季赢得联赛冠军,此前随拜仁德甲四连冠

命好!帕瓦尔连续五个赛季赢得联赛冠军,此前随拜仁德甲四连冠

直播吧
2024-04-23 05:24:18
市民赶海将江豚尸体捡回家 民警已移交至海洋发展局

市民赶海将江豚尸体捡回家 民警已移交至海洋发展局

信网
2024-04-23 10:00:06
湖人败因:浓眉末节1投0分两大新援连场吞蛋 约基奇27+20+10无解

湖人败因:浓眉末节1投0分两大新援连场吞蛋 约基奇27+20+10无解

厝边人侃体育
2024-04-23 12:41:37
问界新M5售价公布:24.98万元起

问界新M5售价公布:24.98万元起

界面新闻
2024-04-23 15:31:59
辛芷蕾,这拉链拉不拉区别不大,区别在你到底想不想拉?

辛芷蕾,这拉链拉不拉区别不大,区别在你到底想不想拉?

娱乐圈酸柠檬
2024-04-23 14:46:30
蔡英文打破常规,抢先宣布重大消息,中美交底,赖清德皮要绷紧了

蔡英文打破常规,抢先宣布重大消息,中美交底,赖清德皮要绷紧了

沈从史
2024-04-22 18:40:03
财务风险预警丨年内股价已跌30%!箭牌家居增收不增利,警惕盈利能力持续恶化

财务风险预警丨年内股价已跌30%!箭牌家居增收不增利,警惕盈利能力持续恶化

时代商学院
2024-04-22 22:38:40
保底两亿欧!国米赚疯了,夺冠后好消息不断,高层布局太成功

保底两亿欧!国米赚疯了,夺冠后好消息不断,高层布局太成功

祥谈体育
2024-04-23 11:27:08
贡品||她叫牛奶,人如其名啊

贡品||她叫牛奶,人如其名啊

懂球娘娘
2024-04-23 12:57:56
家长打学生后续:女孩舅舅发声,整个学校受牵连,果然有问题

家长打学生后续:女孩舅舅发声,整个学校受牵连,果然有问题

追随你的笔触
2024-04-22 16:23:45
央视直播,晚上8点小组第二之争,武磊缺阵,国足赢球等于晋级

央视直播,晚上8点小组第二之争,武磊缺阵,国足赢球等于晋级

尘语者
2024-04-23 16:21:02
惨了!广东又将迎一轮大到暴雨,当地养殖户欲哭无泪

惨了!广东又将迎一轮大到暴雨,当地养殖户欲哭无泪

特特农村生活
2024-04-23 14:59:38
卖车直播无底线!女主播都穿“鲨鱼裤”,评论区全喊“钵钵鸡”!

卖车直播无底线!女主播都穿“鲨鱼裤”,评论区全喊“钵钵鸡”!

卧龙的心术
2024-04-23 11:42:43
闹大了!吴亦凡,突然再一次冲上热搜!

闹大了!吴亦凡,突然再一次冲上热搜!

飞哥AI矩阵
2024-04-22 09:49:19
善恶终有报,“销声匿迹”的宋祖英,已经走上了另一条康庄大道

善恶终有报,“销声匿迹”的宋祖英,已经走上了另一条康庄大道

简读视觉
2024-04-21 13:22:17
你错过了多少异性给你的暗示?

你错过了多少异性给你的暗示?

户外阿崭
2024-04-08 07:35:07
大清死局,无解

大清死局,无解

汉周读书
2024-04-22 13:55:31
闹大了!安徽又曝燃气异常:居民公布视频反映收费异常,网友热议

闹大了!安徽又曝燃气异常:居民公布视频反映收费异常,网友热议

阿莱美食汇
2024-04-23 16:03:51
反转!皇马巨星选择留队,老佛爷再给一年合同,C罗都没这待遇

反转!皇马巨星选择留队,老佛爷再给一年合同,C罗都没这待遇

祥谈体育
2024-04-23 10:35:42
成都银行5000万股“涉刑股权”成功拍出,浙商证券耗资4.24亿元买下3000万股成最大买家

成都银行5000万股“涉刑股权”成功拍出,浙商证券耗资4.24亿元买下3000万股成最大买家

界面新闻
2024-04-23 17:23:19
2024-04-23 18:04:49
机器之心Pro
机器之心Pro
专业的人工智能媒体
8914文章数 141890关注度
往期回顾 全部

科技要闻

参与网暴理想MEGA?小鹏:不信谣、不传谣

头条要闻

护士换针致针头遗留男童体内5年 家长:取出手术风险高

头条要闻

护士换针致针头遗留男童体内5年 家长:取出手术风险高

体育要闻

快船独行侠G1:猛踹瘸子那条好腿

娱乐要闻

赵丽颖晒照似初恋,拍照疑与儿子分享

财经要闻

千元“特供”酒 猫腻有几何

汽车要闻

哪吒首款大五座SUV 哪吒L售价12.99万起

态度原创

家居
房产
本地
时尚
公开课

家居要闻

光影之间 空间暖意打造生活律动

房产要闻

供应量环跌71%!海口这个月又只发了5张证!

本地新闻

我和我的家乡|潍坊人真是什么都敢往天上放啊

建议中年男人:少穿这3种“假时髦、真土气”冲锋衣,油腻显廉价

公开课

睡前进食会让你发胖吗?

无障碍浏览 进入关怀版