CNN用于图像分类、目标检测、语义分割等方向;
RNN用于与时序相关的追踪等方向 。
现代深度学习算法结构(引言)
在现代深度学习算法研究中,通用的骨干网络()+特定任务头(head)成为一种标准的设计模式 。
背景:
详细的与head介绍将在下文各类CNN介绍后展开 。
常用数据集
模型训练依赖于已经打好标签的数据集作为loss计算的依据以及模型验证,目前主流的开放数据集有如下三类 。
与
:是一个超过15 的图像数据集,大约有22,000类 。
:全称 Large-Scale,从2010年开始举办到2017年最后一届,使用数据集的一个子集,总共有1000类;
是图像分类领域最具影响力的竞赛,诞生了绝大多数的图像分类算法 。
算法研究中常用竞赛数据集来训练模型并验证模型效果,竞赛数据集面向图像分类+目标检测,其输入大小为224*224,深度为3 。各年的竞赛所使用的数据集如下:
年份
图像分类数据集
目标检测数据集
2012
not
2013
2012
2014
2012
more than 2013
2015
2012
2014
2016
2012
2014
2017
2012
2014
VOC
文章插图
VOC挑战赛主要面向目标检测与语义分割,比赛于2012年停办,但研究者依然可以使用 VOC数据集训练模型并上传验证结果 。
VOC数据集输入大小为448*448,主要分为 VOC 2007和 ,两者相互独立;
VOC 2007公开了训练集、验证集、测试集;
VOC 2012仅公开了训练集、验证集,需提交到官方服务器来评估测试集结果 。
训练集用作训练模型;验证集用作自我验证模型效果;测试集用作测试模型效果,不公开可以避免参赛者面向结果编程 。
MS COCO
全称为in (MS COCO),面向目标检测、语义分割及其他方向
训练集的不同标注
我们在了解模型时,论文中经常可以看到各种训练集的标注,其含义如下:
其他语义分割数据集
:50个城市的城市场景语义理解数据集
:至少有一个前景物体的一组户外场景
:有400多类的室内和室外场景
:剑桥大学公开发布的城市道路场景的数据集
SUN RGB-D:普灵斯顿大学的&Group 公开的一个有关场景理解的数据集
自动驾驶相关数据集 驾驶数据集:
【[ADAS预研笔记]感知算法 - 引言及常用数据集】交通标志数据集:
- Facebook,Kaiming He的PointRend我的阅读笔记
- 游戏的娱乐性与三防笔记本
- 学习笔记:vscode中python+django环境搭建
- LLaVA-Med 论文阅读笔记
- 学习笔记:哈夫曼树及其应用
- 二 深度学习-----学习笔记(修仙~~~ing)
- 数据库复习笔记----关系数据库
- 2022年笔记本电脑市场总结:华为份额激增95%,联想、苹果均下滑
- 【论文笔记】Skills Regularized Task Decomposit
- 1 sklearn的学习笔记--决策树