COCO(Common Objects in Context)数据集现在有3种标注类型:object instances(目标实例), object keypoints(目标上的关键点), 和image captions(看图说话),使用JSON文件存储,包含了对图像中目标的边界框、类别标签、分割掩码等信息。
COCO标注文件是一个包含多个字典的JSON文件,其中每个字典代表一张图像及其对应的标注信息。主要包含以下字段:
-
“info”: 数据集的描述信息,包括版本号、作者、年份等。
-
“licenses”: 数据集的许可证信息,如许可证ID、URL等。
-
“images”: 图像信息的列表,每个元素是一个包含以下字段的字典:
- - “file_name”: 图像文件的文件名。
- - “height”: 图像的高度(以像素为单位)。
- - “width”: 图像的宽度(以像素为单位)。
- - “license”: 图像的许可证ID。
- - “flickr_url”: 图像的Flickr URL(可选)。
- - “coco_url”: 图像的COCO URL(可选)。
- - “date_captured”: 图像的拍摄日期(可选)。 -
“annotations”: 目标标注信息的列表,每个元素是一个包含以下字段的字典:
- - “id”: 标注的唯一标识符。
- - “image_id”: 标注所属的图像的ID。
- - “category_id”: 目标类别的ID