欢迎访问 生活随笔!

凯发ag旗舰厅登录网址下载

当前位置: 凯发ag旗舰厅登录网址下载 > 人工智能 > 目标检测 >内容正文

目标检测

目标又多又密?多轮迭代的方式进行密集目标检测 -凯发ag旗舰厅登录网址下载

发布时间:2025/1/21 目标检测 34 豆豆
凯发ag旗舰厅登录网址下载 收集整理的这篇文章主要介绍了 目标又多又密?多轮迭代的方式进行密集目标检测 小编觉得挺不错的,现在分享给大家,帮大家做个参考.

点击上方“ai搞事情”关注凯发ag旗舰厅登录网址下载


论文:iterdet: iterative scheme for objectdetection in crowded environments
代码:https://github.com/saic-vul/iterdet

简介

2020年5月莫斯科三星ai研究院提出的文章,针对密集目标进行检测,密集目标检测的难点在于既要检测出不同的目标,又要抑制重复目标框的产生。作者提出了一种「迭代检测」的方案,不论单步检测器还是多步检测器,只需要在训练和推理上做很少的修改,就能简单高效地检测出密集目标。

迭代检测,不用保证每次迭代的召回率,早期,检测部分目标子集,后期将检测的结果和图像再一次输入网络,使检出的目标不再被检测到,迭代检测出复杂的目标子集。

黄色框为二次迭代检测结果

方法

模型结构
如何迭代

,输入图像:,history map 为空,检测器  将输入和映射为一系列边框。

history map 映射方式」:每个像素点的目标个数。 

,输入图像:,history map  由映射而得,检测器将输入和映射为一系列边框;

结束标志:以此类推,直到达到迭代次数或当前迭代未检测到新目标,即时,结束迭代。

那么最后的检测结果就是每次迭代检测出的目标的全集,即:

要想实现上述方案,有两点必须解决:1)如何将一个检测器转换为对历史检测敏感的新检测器;2)如何让新检测器在不同的迭代下检测出不同的目标子集。

训练过程

随机地将标注目标框分为:和两个集合,且,将制作为history map ,使得模型训练来利用已有的目标框信息,预测缺失的目标框集合,同时,通过不同随机划分和,还可以达到了数据增强的效果。

数据集:

adaptis:包含两个子集toy v1和toy v2,用于实力分割任务而生成的数据集,现有标注可以使其用于目标检测,且每张图片平均有30个目标,大部分有重叠情况,绝对是一个密集目标检测的数据集。
「toy v1」:训练集、验证集分别有2000和10000张图像,大小为:96×96。
「toy v2」:训练集、验证集和测试集分别有25000, 1000和1000张,图片大小为128×128。

样例数据

「crowdhuman」:训练集、验证集和测试集分别有15000, 4370和5000张图片,平均每张图的人物数量达到了22.64个,远大于其他主流的人体检测数据集,其中,每个目标有三个标注框:full body, visible body 和 head。凯发ag旗舰厅登录网址下载官网:www.crowdhuman.org

同人体检测数据集的容量、密度和多样性 (为了公平比较,只显示训练子集的统计信息)图片样例

「widerperson」:训练集、验证集和测试集分别有8000,1000和4382张图片,共5个类别:pedestrians, riders, partially visible persons, crowd 和 ignored regions。作者在训练和测试时,将后四类合并为了一类。
凯发ag旗舰厅登录网址下载官网:www.cbsr.ia.ac.cn/users/sfzhang/widerperson

不同场景和密度的样例
实现细节

采用香港中文大学-商汤科技联合实验室开源的基于pytorch实现的深度学习目标检测工具箱mmdetection,仓库地址:
https://github.com/open-mmlab/mmdetection
,预训练模型包含单步检测器的retinanet和两步检测器fasterrcnn,两者的backbone均采用resnet-50的默认训练参数,优化器采用adam,学习率learning rate为0.0001 。

此外,作者修改了两个个地方:1)fpn中每个卷积层之后添加了batch normalization;2)未冻结resnet的第一个block,因为在这个block之前添加了历史映射和可训练的卷积层。

实验指标与结果如下:

adaptis数据集指标crowdhuman数据集指标widerperson数据集指标实验结果

搞事情

今年5月,2020 crowdhuman人体检测大赛启动上线,本届比赛是crowdhuman人体检测赛的第二期,数据集应该就是论文中的crowdhuman数据集。官方基于上述论文方法公布了baseline,具体可见:【ranking第7名,2020 crowdhuman大赛baseline发布】

git地址:https://github.com/thuwyh/baai-2020-crowdhuman-baseline
一些检测结果:


往期推荐

  • deephsv:号称可以商用的计算机笔迹鉴别算法

  • cvpr 2019笔迹识别论文:逆鉴别网络 八路attention

  • polarmask:单阶段实例分割框架,fcos进阶!

  • 真正意义的anchor-free,fcos目标检测算法了解一下

  • 眨眼算什么,让蒙娜丽莎像你一样唠上嗑才算硬核

  • 抖音同款白眼特效,deepwarp让蒙拉丽莎对你眨眨眼

长按二维码关注凯发ag旗舰厅登录网址下载

有趣的灵魂在等你

总结

以上是凯发ag旗舰厅登录网址下载为你收集整理的目标又多又密?多轮迭代的方式进行密集目标检测的全部内容,希望文章能够帮你解决所遇到的问题。

如果觉得凯发ag旗舰厅登录网址下载网站内容还不错,欢迎将凯发ag旗舰厅登录网址下载推荐给好友。

网站地图