今天小编分享的互联网经验:香港科技大学联手微软等机构,公布影像分割模型 Semantic-SAM,欢迎阅读。
品玩 7 月 12 日讯,据 Arxiv 页面显示,来自香港科技大学、微软研究院、IDEA 等多个机构的学者近日联合发布论文,公布了一款影像分割模型 Semantic-SAM。
论文显示,该模型具有两个关键优势:语义感知和粒度丰富性。为了实现语义感知,研究者们整合了三个粒度上的多个数据集,并引入了对象和部分的解耦分类。这使得 Semantic-SAM 能够捕捉丰富的语义信息。对于多粒度能力,研究者在训练过程中提出了一种多选择学习方案,使每次点击可以生成与多个标准掩膜相对应的多个级别的掩膜。
实验结果和可视化展示表明,Semantic-SAM 成功实现了语义感知和粒度丰富性。