超越YOLO检测一切！最强开集目标检测模型登场！学会这思路发文效率直接起飞

作者：深度之眼官方账号发布时间：2024-09-23

还记得去年超火的Grounding DINO吗？最近IDEA研究院推出了它的全新升级版——Grounding DINO 1.5。这个升级版有俩版本，Pro版更强，Edge版更快。但无论是哪个版本都刷爆了目标检测SOTA，超越YOLO！

这种文本输入、即时识别的方法其实是开集目标检测的一种，属于更先进的目标检测技术。不同于传统方法，开集目标检测结合了传统的检测算法和深度学习，具有很高的创新性（论文er快码住），在实现高效且准确的检测方面更是没输过。

目前这方向已经有了不少可借鉴的研究，有的还被ECCV等顶会收录，但一些具有挑战性的问题依然没有解决...说明还有idea可挖掘，可见也是个发论文的好方向。我这边为了给大家提供新思路，整理了9篇开集目标检测最新成果来分享，开源代码也有。

扫码添加小享，回复“开集目标检测”

免费获取全部论文+开源代码

Grounding DINO 1.5: Advance the" Edge" of Open-Set Object Detection

方法：本文介绍了由IDEA研究开发的强大实用的开放集合目标检测模型Grounding DINO1.5。该模型包含Pro和Edge两个版本。Pro版提升了模型容量和训练数据集，Edge版针对边缘设备优化了检测速度。实验显示，它们在多个检测基准上达到了新性能记录。

创新点：

Grounding DINO1.5 Pro在特征提取阶段采用了深度早期融合策略，该策略在解码阶段之前结合了语言和图像特征之间的交叉注意力机制。
Grounding DINO1.5 Pro扩展了其处理长标题的能力，允许对视觉内容进行更全面的描述。
Grounding DINO1.5 Pro展示了强大的泛化能力，能够检测出训练数据中未出现的术语，显示出其将文本短语与视觉元素相关联的出色能力。

Open-Set Object Detection By Aligning Known Class Representations

方法：论文提出了一种新的OSOD框架，通过语义聚类和类装饰模块有效地对齐类别表示，准确检测未知对象，并采用熵阈值评估技术和谐平均精度指标来降低未知对象的误分类风险，通过大量实验证明了该方法的显著改进。

创新点：

引入了一个新的语义聚类模块，用于对齐区域建议特征和语义类别嵌入，防止未知类别的错误分类。
引入了一个新的类别去相关模块，通过特征去相关的softmax正交性约束，增加了类别间的聚类距离，改善了未知类别的分离。

扫码添加小享，回复“开集目标检测”

免费获取全部论文+开源代码

Towards Evidential and Class Separable Open Set Object Detection

方法：本文提出了一种用于挑战性开放集目标检测任务的证据目标检测器（EOD）。该方法利用证据深度学习理论来近似分类分布参数的贝叶斯先验，并利用特定任务的定制框架来提高实际性能。

创新点：

提出了一种基于证据的对象检测器方法，利用证据深度学习理论来近似分类分布参数的贝叶斯先验，通过任务特定的自定义框架来提高实际性能。
引入了证据理论和对比学习模块，定义了EOD的损失函数，通过模型的对比学习和证据获取来提高类别分离性能。
设计了混合证据损失函数，通过建模背景不确定性来进一步提高未知对象的发现能力。

OSR-ViT: A Simple and Modular Framework for Open-Set Object Detection and Discovery

方法：论文介绍了一种新的开放集目标检测和发现（OSODD）任务，并提出了一种OSR-ViT框架来解决这个任务。该任务要求模型能够准确检测和标识所有感兴趣的目标，包括已知类别（ID）和未知类别（OOD）的目标。

创新点：

提出了OSODD任务和相应的评估协议，使得不同开放检测子领域的模型可以进行直接比较。
提出了OSR-ViT框架，通过组合建议网络和ViT模型，实现了在OSODD任务上卓越的性能。该框架具有模块化设计和易于优化的特点，能够适应不同的应用场景。

扫码添加小享，回复“开集目标检测”

免费获取全部论文+开源代码

相关资讯

当PLC程序员玩起“头号玩家”，生产效率直接起飞！

在这个人工智能横行、ChatGPT满天飞的时代，似乎连写代码这种高精尖的技能都快要被AI取代了。但是，各位PLC程序员们，别慌！咱们这一行可不是那么容易被取代的。不过，要想在这个风起云涌的时代立于不败之地，光靠手撕代码可不行，咱们得学会借力打力，用上那些模拟和仿真工具，让自己的编程效率飞起来！虚拟现实中的PLC编程还记得《头号玩家》里那个虚拟世界吗？别以为那只是科幻电影，在PLC虚拟编程环境中，我们也有自己的“绿洲”。各种高级模拟软件就是我们的虚拟游乐场，在这里，我们可以尽情地“玩耍”各种工业场景，而不用

人工智能 ChatGPT 编程

联诚科技 2024-07-22

跟着ChatGPT学Matlab，直接起飞！

问了 ChatGPT 10个问题后，我感觉自己的公众号可以停更了...本文是一篇从ChatGPT上套来的matlab使用教程，涵盖新手入门、绘图、求解优化问题和编写GUI等内容。我相信任何新手都可以通过与ChatGPT对话快速掌握matlab的使用方法。我除了测试ChatGPT给出的代码（全部正确）并给出部分图片结果外，没有加工过其它任何文字内容。认真看完，你应该会感到非常兴奋，但同时也会倒吸一口凉气。Q1：matlab基础入门教程MATLAB是一种数学软件，可以进行科学计算、数据分析、图形化展示和程序开

ChatGPT 编程

图通道 2023-02-18

玉米病害检测：基于深度学习的YOLO模型的应用【玉米病害检测实战】

随着人工智能技术的快速发展，其在农业领域的应用也越来越广泛。玉米作为重要的粮食作物之一，在生长过程中容易受到各种病害的侵害，这对玉米产量和质量造成了严重的影响。因此，利用人工智能技术对玉米病害进行快速

深度学习人工智能

柠檬味拥抱 2023-06-12

目标检测研究方向——开放域目标检测

深度人工智能 “深度人工智能”是成都深度智谷科技旗下的人工智能教育机构订阅号，主要分享人工智能的基础知识、技术发展、学习经验等。此外，订阅号还为大家提供了人工智能的培训学习服务和人工智能证书的报考服务，欢迎大家前来咨询，实现自己的AI梦！开放域目标检测的概念开放域目标检测（Open-DomainObjectDetection）是一种计算机视觉中的高级任务，它与传统的封闭域目标检测（Closed-DomainObjectDetection任务相比，在数据集、模型训练以及应用环境上都有所不同。一般来说，

人工智能教育

深度智谷 2024-08-10

用ChatGPT写作业后，我在大学直接起飞

想必大家最近也发现了，当代留学生要抱的大腿，从专业课上带飞的大佬、人好课水的教授、grammarly, QuillBot和Ginger，逐渐变成不是人的模样......没错，说的就是以ChatGPT

ChatGPT

李佳琦 2023-04-04

近期资讯

乖乖Show 22小时前

《键圈韭菜消息整合》9月22号

群号：789362816这个我自己建的群，没事可以进来吹水上新区【PIWIDESIGN】白悟空键帽群号：98740879 首发199https://item.taobao.com/item.htm?ft=t&id=833066327845LEOBOG Hi86铝坨坨机械键盘群号：315885487首发价299！Hi86定档9月25日晚8点！LEOBOG Hi86铝坨坨机械键盘，从7月的展会“初次见面”，再到如今的上市筹备了很久。本次Hi86为了更加满足玩家们的需求，在“手感，声音”上都保持着我们LEO

若曦Arx 21小时前

更换Intel NUC Kit NUC8i7HVK冥王峡谷风扇和散热硅脂（相变片）

NUC 冥王峡谷最近噪音又特别大，感觉风扇再给力点，它就能自己飞走了。确定问题上网查询+自己摸索，很快有了大概方向。首先，肯定有风扇的问题，因为正常它就不该这么大声。毕竟这是台二手货，入手的时候保修虽然还有大半年，但是谁知道里面的零件有没有被动过呢，万一风扇被换成更旧的了呢。其次，风扇转速很高，说明散热是有问题的。距离上次换硅脂其实没有多久，每次扫灰我都会查看硅脂状态。如果不是硅脂质量问题，那么就得考虑散热材料是不是需要更新了。寻找解决方案众所周知，笔记本和迷你准系统的散热方案几乎全部是定制的，连风扇都

gsgundam_sunfish 22小时前

从城市到越野，长安启源E07百变功能引领“一车多用”新潮流

随着汽车市场的日益竞争激烈，消费者对汽车的需求也愈发多元化和个性化。在这样的背景下，长安汽车凭借深厚的技术积累和敏锐的市场洞察，推出了旗下首款“灵魂和躯体”合二为一的智能可变SUV——长安启源E07。这款集超强性能、类人智能与百变功能于一身的全场景智慧SUV，不仅重新定义了家庭出行的可能性，也标志着长安汽车在智能化、电动化领域的又一次重大突破。开启预售，诚意满满9月22日，长安启源E07在重庆生态岛——广阳岛正式开启了全球预售。此次预售，长安汽车以24.99万元起的预售价，搭配六项诚意满满的预售权益，向市

科技娜评 21小时前

超越YOLO检测一切！最强开集目标检测模型登场！学会这思路发文效率直接起飞

Grounding DINO 1.5: Advance the" Edge" of Open-Set Object Detection

Open-Set Object Detection By Aligning Known Class Representations

Towards Evidential and Class Separable Open Set Object Detection

OSR-ViT: A Simple and Modular Framework for Open-Set Object Detection and Discovery

推荐体验

相关资讯

当PLC程序员玩起“头号玩家”，生产效率直接起飞！

跟着ChatGPT学Matlab，直接起飞！

玉米病害检测：基于深度学习的YOLO模型的应用【玉米病害检测实战】

目标检测研究方向——开放域目标检测

用ChatGPT写作业后，我在大学直接起飞

近期资讯

《认真消除社会分配不公现象》（江泽民）（原载中国改革信息库）

《次贷金融危机的历史意义和社会成本：基于日本经验的比较》（伊藤诚）

9.22微星设计师P70台式机3847，光威D5 6000MHz 16GBx2内存条，美的60升热水器585

《访问民主德国见闻—程极明同志的发言》（《江苏社联通讯》，1987）

【历史人物】历史上的帝辛真的像演义中的纣王那样又蠢又坏吗？

godot如何给android来写一个普通应用app【非游戏】（一）？

长安启源E07：打造家庭出行新体验，全景智慧可变SUV

《键圈韭菜消息整合》9月22号

更换Intel NUC Kit NUC8i7HVK冥王峡谷风扇和散热硅脂（相变片）

从城市到越野，长安启源E07百变功能引领“一车多用”新潮流

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响