# High-resolution networks (HRNets) for object detection
## Introduction
[ALGORITHM]
```latex
@inproceedings{SunXLW19,
title={Deep High-Resolution Representation Learning for Human Pose Estimation},
author={Ke Sun and Bin Xiao and Dong Liu and Jingdong Wang},
booktitle={CVPR},
year={2019}
}
@article{SunZJCXLMWLW19,
title={High-Resolution Representations for Labeling Pixels and Regions},
author={Ke Sun and Yang Zhao and Borui Jiang and Tianheng Cheng and Bin Xiao
and Dong Liu and Yadong Mu and Xinggang Wang and Wenyu Liu and Jingdong Wang},
journal = {CoRR},
volume = {abs/1904.04514},
year={2019}
}
```
## Results and Models
### Faster R-CNN
| Backbone | Style | Lr schd | Mem (GB) | Inf time (fps) | box AP | Config | Download |
| :-------------: | :-----: | :-----: | :------: | :-------------:|:------:| :------:| :--------:|
| HRNetV2p-W18 | pytorch | 1x | 6.6 | 13.4 | 36.9 | [config](https://github.com/open-mmlab/mmdetection/tree/master/configs/hrnet/faster_rcnn_hrnetv2p_w18_1x_coco.py) | [model](http://download.openmmlab.com/mmdetection/v2.0/hrnet/faster_rcnn_hrnetv2p_w18_1x_coco/faster_rcnn_hrnetv2p_w18_1x_coco_20200130-56651a6d.pth) | [log](http://download.openmmlab.com/mmdetection/v2.0/hrnet/faster_rcnn_hrnetv2p_w18_1x_coco/faster_rcnn_hrnetv2p_w18_1x_coco_20200130_211246.log.json) |
| HRNetV2p-W18 | pytorch | 2x | 6.6 | | 38.9 | [config](https://github.com/open-mmlab/mmdetection/tree/master/configs/hrnet/faster_rcnn_hrnetv2p_w18_2x_coco.py) | [model](http://download.openmmlab.com/mmdetection/v2.0/hrnet/faster_rcnn_hrnetv2p_w18_2x_coco/faster_rcnn_hrnetv2p_w18_2x_coco_20200702_085731-a4ec0611.pth) | [log](http://download.openmmlab.com/mmdetection/v2.0/hrnet/faster_rcnn_hrnetv2p_w18_2x_coco/faster_rcnn_hrnetv2p_w18_2x_coco_20200702_085731.log.json) |
| HRNetV2p-W32 | pytorch | 1x | 9.0 | 12.4 | 40.2 | [config](https://github.com/open-mmlab/mmdetection/tree/master/configs/hrnet/faster_rcnn_hrnetv2p_w32_1x_coco.py) | [model](http://download.openmmlab.com/mmdetection/v2.0/hrnet/faster_rcnn_hrnetv2p_w32_1x_coco/faster_rcnn_hrnetv2p_w32_1x_coco_20200130-6e286425.pth) | [log](http://download.openmmlab.com/mmdetection/v2.0/hrnet/faster_rcnn_hrnetv2p_w32_1x_coco/faster_rcnn_hrnetv2p_w32_1x_coco_20200130_204442.log.json) |
| HRNetV2p-W32 | pytorch | 2x | 9.0 | | 41.4 | [config](https://github.com/open-mmlab/mmdetection/tree/master/configs/hrnet/faster_rcnn_hrnetv2p_w32_2x_coco.py) | [model](http://download.openmmlab.com/mmdetection/v2.0/hrnet/faster_rcnn_hrnetv2p_w32_2x_coco/faster_rcnn_hrnetv2p_w32_2x_coco_20200529_015927-976a9c15.pth) | [log](http://download.openmmlab.com/mmdetection/v2.0/hrnet/faster_rcnn_hrnetv2p_w32_2x_coco/faster_rcnn_hrnetv2p_w32_2x_coco_20200529_015927.log.json) |
| HRNetV2p-W40 | pytorch | 1x | 10.4 | 10.5 | 41.2 | [config](https://github.com/open-mmlab/mmdetection/tree/master/configs/hrnet/faster_rcnn_hrnetv2p_w40_1x_coco.py) | [model](http://download.openmmlab.com/mmdetection/v2.0/hrnet/faster_rcnn_hrnetv2p_w40_1x_coco/faster_rcnn_hrnetv2p_w40_1x_coco_20200210-95c1f5ce.pth) | [log](http://download.openmmlab.com/mmdetection/v2.0/hrnet/faster_rcnn_hrnetv2p_w40_1x_coco/faster_rcnn_hrnetv2p_w40_1x_coco_20200210_125315.log.json) |
| HRNetV2p-W40 | pytorch | 2x | 10.4 | | 42.1 | [config](https://github.com/open-mmlab/mmdetection/tree/master/configs/hrnet/faster_rcnn_hrnetv2p_w40_2x_coco.py) | [model](http://download.openmmlab.com/mmdetection/v2.0/hrnet/faster_rcnn_hrnetv2p_w40_2x_coco/faster_rcnn_hrnetv2p_w40_2x_coco_20200512_161033-0f236ef4.pth) | [log](http://download.openmmlab.com/mmdetection/v2.0/hrnet/faster_rcnn_hrnetv2p_w40_2x_coco/faster_rcnn_hrnetv2p_w40_2x_coco_20200512_161033.log.json) |
### Mask R-CNN
| Backbone | Style | Lr schd | Mem (GB) | Inf time (fps) | box AP | mask AP | Config | Download |
| :-------------: | :-----: | :-----: | :------: | :-------------:|:------:| :------:|:------:|:--------:|
| HRNetV2p-W18 | pytorch | 1x | 7.0 | 11.7 | 37.7 | 34.2 | [config](https://github.com/open-mmlab/mmdetection/tree/master/configs/hrnet/mask_rcnn_hrnetv2p_w18_1x_coco.py) | [model](http://download.openmmlab.com/mmdetection/v2.0/hrnet/mask_rcnn_hrnetv2p_w18_1x_coco/mask_rcnn_hrnetv2p_w18_1x_coco_20200205-1c3d78ed.pth) | [log](http://download.openmmlab.com/mmdetection/v2.0/hrnet/mask_rcnn_hrnetv2p_w18_1x_coco/mask_rcnn_hrnetv2p_w18_1x_coco_20200205_232523.log.json) |
| HRNetV2p-W18 | pytorch | 2x | 7.0 | - | 39.8 | 36.0 | [config](https://github.com/open-mmlab/mmdetection/tree/master/configs/hrnet/mask_rcnn_hrnetv2p_w18_2x_coco.py) | [model](http://download.openmmlab.com/mmdetection/v2.0/hrnet/mask_rcnn_hrnetv2p_w18_2x_coco/mask_rcnn_hrnetv2p_w18_2x_coco_20200212-b3c825b1.pth) | [log](http://download.openmmlab.com/mmdetection/v2.0/hrnet/mask_rcnn_hrnetv2p_w18_2x_coco/mask_rcnn_hrnetv2p_w18_2x_coco_20200212_134222.log.json) |
| HRNetV2p-W32 | pytorch | 1x | 9.4 | 11.3 | 41.2 | 37.1 | [config](https://github.com/open-mmlab/mmdetection/tree/master/configs/hrnet/mask_rcnn_hrnetv2p_w32_1x_coco.py) | [model](http://download.openmmlab.com/mmdetection/v2.0/hrnet/mask_rcnn_hrnetv2p_w32_1x_coco/mask_rcnn_hrnetv2p_w32_1x_coco_20200207-b29f616e.pth) | [log](http://download.openmmlab.com/mmdetection/v2.0/hrnet/mask_rcnn_hrnetv2p_w32_1x_coco/mask_rcnn_hrnetv2p_w32_1x_coco_20200207_055017.log.json) |
| HRNetV2p-W32 | pytorch | 2x | 9.4 | - | 42.5 | 37.8 | [config](https://github.com/open-mmlab/mmdetection/tree/master/configs/hrnet/mask_rcnn_hrnetv2p_w32_2x_coco.py) | [model](http://download.openmmlab.com/mmdetection/v2.0/hrnet/mask_rcnn_hrnetv2p_w32_2x_coco/mask_rcnn_hrnetv2p_w32_2x_coco_20200213-45b75b4d.pth) | [log](http://download.openmmlab.com/mmdetection/v2.0/hrnet/mask_rcnn_hrnetv2p_w32_2x_coco/mask_rcnn_hrnetv2p_w32_2x_coco_20200213_150518.log.json) |
| HRNetV2p-W40 | pytorch | 1x | 10.9 | | 42.1 | 37.5 | [config](https://github.com/open-mmlab/mmdetection/tree/master/configs/hrnet/mask_rcnn_hrnetv2p_w40_1x_coco.py) | [model](http://download.openmmlab.com/mmdetection/v2.0/hrnet/mask_rcnn_hrnetv2p_w40_1x_coco/mask_rcnn_hrnetv2p_w40_1x_coco_20200511_015646-66738b35.pth) | [log](http://download.openmmlab.com/mmdetection/v2.0/hrnet/mask_rcnn_hrnetv2p_w40_1x_coco/mask_rcnn_hrnetv2p_w40_1x_coco_20200511_015646.log.json) |
| HRNetV2p-W40 | pytorch | 2x | 10.9 | | 42.8 | 38.2 | [config](https://github.com/open-mmlab/mmdetection/tree/master/configs/hrnet/mask_rcnn_hrnetv2p_w40_2x_coco.py) | [model](http://download.openmmlab.com/mmdetection/v2.0/hrnet/mask_rcnn_hrnetv2p_w40_2x_coco/mask_rcnn_hrnetv2p_w40_2x_coco_20200512_163732-aed5e4ab.pth) | [log](http://download.openmmlab.com/mmdetection/v2.0/hrnet/mask_rcnn_hrnetv2p_w40_2x_coco/mask_rcnn_hrnetv2p_w40_2x_coco_20200512_163732.log.json) |
### Cascade R-CNN
| Backbone | Style | Lr schd | Mem (GB) | Inf time (fps) | box AP | Config | Download |
| :-------------: | :-----: | :-----: | :------: | :-------------:|:------:| :------: | :--------: |
| HRNetV2p-W18 | pytorch | 20e | 7.0 | 11.0 | 41.2 | [config](https://github.com/open-mmlab/mmdetection/tree/master/configs/hrnet/cascade_rcnn_hrnetv2p_w18_20e_coco.py) | [model](http://download.openmmlab.com/mmdetection/v2.0/hrnet/cascade_rcnn_hrnetv2p_w18_20e_coco/cascade_rcnn_hrnetv2p_w18_20e_coco_20200210-434be9d7.pth) | [log](http://download.openmmlab.com/mmdetection/v2.0/hrnet/cascade_rcnn_hrnetv2p_w18_20e_coco/cascade_rcnn_hrnetv2p_w18_20e_coco_20200210_105632.log.json) |
| HRNetV2p-W32 | pytorch | 20e | 9.4 | 11.0 | 43.3 | [config]
mmdetection-2.10.0.zip
需积分: 0 63 浏览量
更新于2023-08-29
收藏 7.01MB ZIP 举报
《mmdetection-2.10.0:深度学习目标检测框架详解》
mmdetection是基于PyTorch的一个开源目标检测库,它为研究人员和开发者提供了丰富的目标检测算法实现,便于快速实验和开发新的检测模型。在mmdetection-2.10.0版本中,我们能看到该框架的持续优化和新功能的加入,使得目标检测的研究和应用更加便捷。
一、mmdetection框架概述
mmdetection是阿里云M6团队维护的项目,它涵盖了多种经典和最新的目标检测算法,如Faster R-CNN、Mask R-CNN、YOLO系列、Deformable DETR等,涵盖了两阶段、单阶段、关键点检测等多种任务。其设计思想是模块化,允许用户灵活组合不同的backbone、neck、head等组件,以实现各种复杂的检测网络结构。
二、核心组件解析
1. **Backbone**:通常选用预训练的卷积神经网络,如ResNet、ResNeXt、DenseNet等,用于提取图像特征。
2. **Neck**:包括FPN(Feature Pyramid Network)和NAS-FPN等,目的是将不同层的特征融合,提升检测性能。
3. **Head**:针对不同检测任务,如分类、定位和分割,有不同的设计,如RPN(Region Proposal Network)用于生成候选框,FCOS、ATSS等用于单阶段检测。
三、训练与评估
mmdetection提供了一套完整的训练和评估流程,支持多GPU并行训练,可以方便地调整学习率策略、数据增强策略等超参数。同时,内置了COCO、LVIS等数据集的加载器,便于对模型进行验证和测试。
四、模型微调与迁移学习
mmdetection支持模型的微调和迁移学习,用户可以利用预训练模型在特定任务上进行再训练,以提高检测效果。此外,框架还提供了模型保存和加载的接口,方便模型的复用和对比实验。
五、新特性与优化
在2.10.0版本中,可能包含以下更新:
- **新算法支持**:可能新增了一些最新的目标检测算法,以保持与研究前沿同步。
- **性能优化**:可能对训练速度、内存占用等方面进行了优化,提升用户体验。
- **API改进**:可能对代码结构和API进行了调整,使代码更易读、易用。
- **文档更新**:可能提供了更详尽的使用指南和教程,帮助用户更好地理解和使用框架。
六、应用场景
mmdetection广泛应用于图像分析、视频理解、自动驾驶等领域,对于开发者和研究人员来说,它是快速验证新想法、比较不同模型性能的理想平台。
总结,mmdetection-2.10.0作为一款强大的目标检测框架,通过其模块化的设计、丰富的模型库和高效的训练机制,为深度学习领域的研究者和实践者提供了强大工具。无论是学术研究还是工业应用,mmdetection都是值得信赖的选择。
Oh_gosh
- 粉丝: 0
- 资源: 1
最新资源
- 西门子PLC源码图纸S7-224XP-226 ARM芯片代码ST芯片源码
- 中国风教学通用PPT模板.pptx
- 中国风教育教学通用PPT.pptx
- 卡通教学通用模板.pptx
- 磨床控制程序磨床控制程序,使用三菱FX系列 PLC和昆仑通态触摸屏,也可以用三菱GT系列触摸屏
- 清新水果教学模板.pptx
- 谨防新型网络犯罪宣传教育.pptx
- 企业安全生产宣传培训教育.pptx
- 上位机+dds函数发生器 可输出正弦波 三角波 阶梯波 高斯 噪声 台阶波 锯齿波幅度 频率 相位可上位机调节 内容包括原理图 fpga代码 上位机关键代码
- 儿童学习方法与能力培养教育宣传.pptx
- 企业管理基础知识培训.pptx
- C# Modbus TCP协议客户端设计工程源码带注释,开源dll文件,支持访问多个服务器,多线程实现
- 原文论文-AU面都动作单元检测-自监督-身份对抗训练
- 台达Plc程序单轴标准点动,回零,相对,绝对定位控制模版,程序结构清晰明了,是学习与初次接触台达编程的好示例
- 微网群 多微网 优化调度matlab 程序采用matlab编写,可以实现三个微网的优化调度策略,采用改进粒子群智能算法,通过小生灵+混沌算法,实现了算法优化前后的对比分析,同时可以分析不同主体(包括
- 客栈(酒店)管理系统(源码+数据库+设计文档) springboot+mybatis+mysql+thymeleaf 包括四大模块:登录管理、住宿管理、房间管理、系统管理 (1)登录管理:用于管理员