国际计算机视觉与模式识别会议(CVPR)是计算机科学领域中的顶级会议之一,也是图像处理、机器学习、人工智能等多个领域的交叉学科会议。
每年的CVPR会议都会有大量的论文投稿和学术交流活动,其中涵盖了包括图像处理、计算机视觉、模式识别、机器学习、深度学习、人工智能等多个研究方向,是该领域最具有影响力和代表性的学术会议之一。
AMiner通过AI技术,对 CVPR2023 收录的会议论文进行了分类整理,今日分享的是自监督主题论文,共29篇,我们在这里展示十篇最受欢迎的论文,欢迎下载收藏!
1.LaserMix for Semi-Supervised LiDAR Semantic Segmentation
作者:Lingdong Kong,Jiawei Ren,Liang Pan,Ziwei Liu
链接:https://www.aminer.cn/pub/62c2a9595aee126c0fcf0a45/
AI综述(大模型驱动):我们研究了LiDAR分割中未知半监督学习的潜力。我们的中心思想是利用线性特征充分利用未标记数据。我们提出了激光混合器,该混合器将来自不同LiDAR扫描的激光波束混合起来。然后鼓励模型在混合过程中做出一致且令人信服的预测。我们的框架具有三个令人兴奋的属性: 1)生动:激光组合对射线表示(例如,视图和矩阵)是安全的,因此我们可以 universal地应用。
2.Augmentation Matters: A Simple-yet-Effective Approach to Semi-supervised Semantic Segmentation
作者:Zhen Zhao,Lihe Yang,Sifan Long,Jimin Pi,Luping Zhou,Jingdong Wang
链接:https://www.aminer.cn/pub/63969ba790e50fcafdcf1c76/
AI综述(大模型驱动):本文提出了AugSeg,一个简单的和干净的半监督语义分组方法,主要关注数据干扰,以提高SSS性能。我们采用一种简化的强度扩展,通过选择任意数量的数据转换,从连续空间中随机注入标记信息,并基于模型对不同未标记样本来的表现进行估计。此外,我们还随机注入标记信息以改进未标记样本,从而在不同分区协议下获得新的先进水平。
3.Conflict-Based Cross-View Consistency for Semi-Supervised Semantic Segmentation
作者:Zicheng Wang,Zhen Zhao,Xiaoxia Xing,Dong Xu,Xiangyu Kong,Luping Zhou
链接:https://www.aminer.cn/pub/640166a590e50fcafd68b4fb/
AI综述(大模型驱动):半监督语义分割近年来受到了越来越大的研究关注。本文提出了一种新的基于冲突的跨视图一致性(CCVC)方法。我们的工作旨在鼓励两个子网从不相关的观察中学习有用的信息特征。特别是,我们首先提出了一种新的跨视图一致性(CVC)策略,该策略鼓励两个子网从相同输入中学习不同的特征,而这些不同特征都预计会生成与输入一致的预测得分。此外,我们还提出了一种基于敌对伪标记(CPL)的方法来保证模型将从冲突性的预测中学习更多的有用信息。我们在广泛使用的基线数据集PASCAL VOC2012和城市景观上评估了我们的新方法。
4.Revisiting Weak-to-Strong Consistency in Semi-Supervised Semantic Segmentation
作者:Lihe Yang,Lei Qi,Litong Feng,Wayne Zhang,Yinghuan Shi
链接:https://www.aminer.cn/pub/6304456b90e50fcafd12fe39/
AI综述(大模型驱动):本文回顾了从半监督分类器中流行的弱到强一致性框架。我们认为,这种简单的管道已经在与最近最先进的工作相比取得了竞争性的结果,当将其转换为分区情景时,它已经实现了与当前最先进的工作相媲美的性能。基于此,我们提出了一个辅助特征干扰流作为补充,以扩展干扰空间。此外,我们还提出了一种双向干扰技术,能够同时引导两种强大视图,从而在Pascal、Cityscapes和COCO基准测试中超过了所有现有方法。这项研究表明,该方法在遥感解释和医学图像分析方面均表现出优异的表现。
5.Consistent-Teacher: Towards Reducing Inconsistent Pseudo-targets in Semi-supervised Object Detection
作者:Xinjiang Wang,Xingyi Yang,Shilong Zhang,Yijiang Li,Litong Feng,Shijie Fang,Chengqi Lyu,Kai Chen,Wayne Zhang
链接:https://www.aminer.cn/pub/63180be590e50fcafded435a/
AI综述(大模型驱动):在本文中,我们深入研究了半监督物探测器中面临的挑战。我们观察到,目前的探测器的一般分配政策对标记噪声很敏感。2)任务不一致,即常规分配政策较敏感,在相同的特征点上进行分类和逆转预测被同时推断。这些问题导致了学习者网络不一致的优化目标,从而恶化了性能,并加快了模型融合。我们提出了一种称为一致的老师系统,该系统在大量Ssod评估中获得了41.0 mAP的性能。
6.MixTeacher: Mining Promising Labels with Mixed Scale Teacher for Semi-Supervised Object Detection
作者:Liang Liu,Boshen Zhang,Jiangning Zhang,Wuhao Zhang,Zhenye Gan,Guanzhong Tian,Wenbing Zhu,Yabiao Wang,Chengjie Wang
链接:https://www.aminer.cn/pub/6413dabe90e50fcafd3cd802/
AI综述(大模型驱动):我们提出了一种新的半监督标记生成框架。该框架通过引入一个混合质量老师来提高基于质量的标记生成和模块化学习。此外,我们提出了使用分布相似性度量在模块级别上推广预测,这优于来自单个质量特征的最佳预测。我们的广泛的实验表明,该方法达到了最先进的性能水平。
7.Semi-Supervised 2D Human Pose Estimation Driven by Position Inconsistency Pseudo Label Correction Module
作者:Linzhi Huang,Yulong Li,Hongbo Tian,Yue Yang,Xiangang Li,Weihong Deng,Jieping Ye
链接:https://www.aminer.cn/pub/64094ee790e50fcafd476dd2/
AI综述(大模型驱动):我们提出了一种半监督的2D人类面部估计框架。以前的方法忽略了两个问题:(一)在进行互动训练时,轻型模型的假标记将被用于指导重型模型。(二)噪声伪标签的使用对培训的影响。此外,人们发现,使用少量辅助教练来调整校准器可以提高准确性。
8.Semi-supervised Parametric Real-world Image Harmonization
作者:Ke Wang,Michaël Gharbi,He Zhang,Zhihao Xia,Eli Shechtman
链接:https://www.aminer.cn/pub/6400163d90e50fcafdd027b4/
AI综述(大模型驱动): 基于图像的统一性训练通常被训练来消除对原始地平面图的合成随机全球转换。这些技术通常是在单个基线真实合成中应用的,但无法很好地建模现实复制中的许多重要局部变化。我们提出了一种新的半监督训练策略,该策略解决了这个问题,并允许我们从未连接的实体复制中学习复杂局部表情衔接。我们的模型完全参数化。它使用蓝色梯度调整全局颜色和声音以及构造地图以建模局部变异。
9.Hierarchical Supervision and Shuffle Data Augmentation for 3D Semi-Supervised Object Detection
作者:Chuandong Liu,Chenqiang Gao,Fangcen Liu,Pengcheng Li,Deyu Meng,Xinbo Gao
链接:https://www.aminer.cn/pub/642ce6fa90e50fcafde75842/
AI综述(大模型驱动):本文提出了一种新的半监督学习方法HSSDA,它是一种简单的但有效的老师学生框架。该方法采用动态双阈值策略生成监督信号,从而提高了学生的网络监控能力。实验结果表明,HSSDA在不同数据集上均表现出优异的性能。
10.Bidirectional Copy-Paste for Semi-Supervised Medical Image Segmentation
作者:Yunhao Bai,Duowen Chen,Qingli Li,Wei Shen,Yan Wang
链接:https://www.aminer.cn/pub/64563874d68f896efacf3e53/
AI综述(大模型驱动):本文提出了一种简单的方法来克服半监督医疗图像分割中标记和非标记数据的误差。该方法鼓励未标记数据从未标记数据中学习全面的共同语义。此外,同步学习过程可以显著减少实验分布边界。通过将双重样本映射到学生网络上,并由种子标记和底层真实信号监控,证明了这种简单的机制是足够好的。实验结果表明,与其他半监督医疗图像分割数据集相比,ACDC 数据集的标记和非标记数据呈现出显著优异的表现。
想查看全部自监督论文,可以点击下方链接:
https://www.aminer.cn/conf/5eba43d8edb6e7d53c0fb8a1/CVPR2023