labelme标签格式json转化成yolov8支持是数据集格式

我们用yolov8做实例分割时，需要制作标签，如果用labelme做，不能直接用模型训练，需要利用一个脚本文件进行转换。

 import base64
import random
import shutil
from tqdm import tqdm
import math
import json
import os
import numpy as np
import PIL.Image
import PIL.ImageDraw
import cv2
 
 
class ConvertManager(object):
    def __init__(self):
        pass
 
    def base64_to_numpy(self, img_bs64):
        img_bs64 = base64.b64decode(img_bs64)
        img_array = np.frombuffer(img_bs64, np.uint8)
        cv2_img = cv2.imdecode(img_array, cv2.IMREAD_COLOR)
        return cv2_img
 
    @classmethod
    def load_labels(cls, name_file):
        '''
        load names from file.one name one line
        :param name_file:
        :return:
        '''
        with open(name_file, 'r') as f:
            lines = f.read().rstrip('\n').split('\n')
        return lines
 
    def get_class_names_from_all_json(self, json_dir):
        classnames = []
        for file in os.listdir(json_dir):
            if not file.endswith('.json'):
                continue
            with open(os.path.join(json_dir, file), 'r', encoding='utf-8') as f:
                data_dict = json.load(f)
                for shape in data_dict['shapes']:
                    if not shape['label'] in classnames:
                        classnames.append(shape['label'])
        return classnames
 
    def create_save_dir(self, save_dir):
        images_dir = os.path.join(save_dir, 'images')
        labels_dir = os.path.join(save_dir, 'labels')
        if not os.path.exists(save_dir):
            os.makedirs(save_dir)
            os.mkdir(images_dir)
            os.mkdir(labels_dir)
        else:
            if not os.path.exists(images_dir):
                os.mkdir(images_dir)
            if not os.path.exists(labels_dir):
                os.mkdir(labels_dir)
        return images_dir + os.sep, labels_dir + os.sep
 
    def save_list(self, data_list, save_file):
        with open(save_file, 'w') as f:
            f.write('\n'.join(data_list))
 
    def __rectangle_points_to_polygon(self, points):
        xmin = 0
        ymin = 0
        xmax = 0
        ymax = 0
        if points[0][0] > points[1][0]:
            xmax = points[0][0]
            ymax = points[0][1]
            xmin = points[1][0]
            ymin = points[1][1]
        else:
            xmax = points[1][0]
            ymax = points[1][1]
            xmin = points[0][0]
            ymin = points[0][1]
        return [[xmin, ymin], [xmax, ymin], [xmax, ymax], [xmin, ymax]]
 
    def convert_dataset(self, json_dir, json_list, images_dir, labels_dir, names, save_mode='train'):
        images_dir = os.path.join(images_dir, save_mode)+os.sep
        labels_dir = os.path.join(labels_dir, save_mode)+os.sep
        if not os.path.exists(images_dir):
            os.mkdir(images_dir)
        if not os.path.exists(labels_dir):
            os.mkdir(labels_dir)
        for file in tqdm(json_list):
            with open(os.path.join(json_dir, file), 'r', encoding='utf-8') as f:
                data_dict = json.load(f)
            image_file = os.path.join(json_dir, os.path.basename(data_dict['imagePath']))
            if os.path.exists(image_file):
                shutil.copyfile(image_file, images_dir + os.path.basename(image_file))
            else:
                imageData = data_dict.get('imageData')
                if not imageData:
                    imageData = base64.b64encode(imageData).decode('utf-8')
                    img = self.img_b64_to_arr(imageData)
                    PIL.Image.fromarray(img).save(images_dir + file[:-4] + 'png')
            # convert to txt
            width = data_dict['imageWidth']
            height = data_dict['imageHeight']
            line_list = []
            for shape in data_dict['shapes']:
                data_list = []
                data_list.append(str(names.index(shape['label'])))
                if shape['shape_type'] == 'rectangle':
                    points = self.__rectangle_points_to_polygon(shape['points'])
                    for point in points:
                        data_list.append(str(point[0] / width))
                        data_list.append(str(point[1] / height))
 
 
                elif shape['shape_type'] == 'polygon':
                    points = shape['points']
                    for point in points:
                        data_list.append(str(point[0] / width))
                        data_list.append(str(point[1] / height))
                line_list.append(' '.join(data_list))
 
            self.save_list(line_list, labels_dir + file[:-4] + "txt")
 
    def split_train_val_test_dataset(self, file_list, train_ratio=0.9, trainval_ratio=0.9, need_test_dataset=False,
                                     shuffle_list=True):
        if shuffle_list:
            random.shuffle(file_list)
        total_file_count = len(file_list)
        train_list = []
        val_list = []
        test_list = []
        if need_test_dataset:
            trainval_count = int(total_file_count * trainval_ratio)
            trainval_list = file_list[:trainval_count]
            test_list = file_list[trainval_count:]
            train_count = int(train_ratio * len(trainval_list))
            train_list = trainval_list[:train_count]
            val_list = trainval_list[train_count:]
        else:
            train_count = int(train_ratio * total_file_count)
            train_list = file_list[:train_count]
            val_list = file_list[train_count:]
        return train_list, val_list, test_list
 
    def start(self, json_dir, save_dir, names=None, train_ratio=0.9):
        images_dir, labels_dir = self.create_save_dir(save_dir)
        if names is None or len(names) == 0:
            print('class names will load from all json file')
            names = self.get_class_names_from_all_json(json_dir)
        print('find {} class names :'.format(len(names)), names)
        if len(names) == 0:
            return
 
        self.save_list(names, os.path.join(save_dir, 'labels.txt'))
        print('start convert')
        all_json_list = []
        for file in os.listdir(json_dir):
            if not file.endswith('.json'):
                continue
            all_json_list.append(file)
        train_list, val_list, test_list = self.split_train_val_test_dataset(all_json_list, train_ratio)
        self.convert_dataset(json_dir, train_list, images_dir, labels_dir, names, 'train')
        self.convert_dataset(json_dir, val_list, images_dir, labels_dir, names, 'val')
 
 
if __name__ == '__main__':
    cm = ConvertManager()
    cm.start(r'源文件路径', r'保存新位置路径')复制

labelme标签格式json转化成yolov8支持是数据集格式

基于CSS3媒体查询的响应式旅游网站设计与实现-计算机毕设附源码 12755

Postman导出JSON文件轻松转换为HTML或Markdown

python requests编写 api接收json

用Python开发桌面端软件：pywebview (框架) Python (后端) vue (前端) pyinstaller (打包)

前端-javaScript:jquery补充

基于Vue的求职招聘系统的设计与实现-计算机毕设附源码 25284

java中Object和json相互转换的方式

Flutter Dart Macro 宏简化 JSON 序列化

中国地区 code.json文件

JSONObject 使用对比 hutool、alibaba

前端哥

运行npm error code ENOENTnpm error syscall opennpm error path C:\Users\ultra\Desktop\Vue-Project\pac

前端提高篇（102）：jQuery高级方法callbacks、deferred

解决npm install 报错 “npm err code 1“

【常见错误】npm ERR! code CERT_HAS_EXPIRED & errno CERT_HAS_EXPIRED

vue前端页面弹出红色报错遮罩层 Uncaught runtime errors:at handleError (webpack-internal:///./node_modules/webpack

npm ERR! code CERT_HAS_EXPIRED npm ERR! errno CERT_HAS_EXPIRED npm ERR! request to https://registry.

JQuery中的load()、$

《WEB前端框架开发技术》HTML5响应式旅游景区网站——榆林子州HTML CSS JavaScript (1)

基于Java SpringBoot Vue HTML5药店管理系统(源码 LW 调试文档讲解等)/药店管理软件/药店进销存系统/药店库存管理系统/药店销售系统/药品管理系统/药店收银系统

基于Java SpringBoot Vue HTML5宠物健康顾问系统(源码 LW 调试文档讲解等)/宠物健康/顾问系统/宠物护理/宠物医疗/宠物保健/宠物咨询/宠物医生/宠物健康管理/宠物健康服务

1
【Echarts系列】—— 实现电池图、3D立体圆形柱状图

2024-03-03 11:03:011001

2
CSS常用属性（文本属性）

2024-11-04 09:11:111000

3
TypeScript 中的 Number 类型，Number 类型的特性、常见操作和注意事项

2024-09-30 23:09:061000

4
CSS写代码使页面划分为左右两个区域

2024-09-09 00:09:071000

5
vue使用datav echarts

2024-09-06 00:09:381000

6
使用TweenMax.js和CSS3创建冰球运动员动画效果教程

2024-09-04 23:09:411000

7
使用CDN提高jQuery加载速度

2024-08-24 23:08:211000

8
小兔鲜儿网页首页制作黑马程序员前端基础项目自学笔记

2024-08-19 22:08:161000

9
《Vue》你的弹窗能拖动吗？Vue自定义指令实现可拖动弹窗

2024-08-19 22:08:121000

10
npm的使用

2024-08-18 00:08:131000

	import base64
	import random
	import shutil
	from tqdm import tqdm
	import math
	import json
	import os
	import numpy as np
	import PIL.Image
	import PIL.ImageDraw
	import cv2


	class ConvertManager(object):
	def __init__(self):
	pass

	def base64_to_numpy(self, img_bs64):
	img_bs64 = base64.b64decode(img_bs64)
	img_array = np.frombuffer(img_bs64, np.uint8)
	cv2_img = cv2.imdecode(img_array, cv2.IMREAD_COLOR)
	return cv2_img

	@classmethod
	def load_labels(cls, name_file):
	'''
	load names from file.one name one line
	:param name_file:
	:return:
	'''
	with open(name_file, 'r') as f:
	lines = f.read().rstrip('\n').split('\n')
	return lines

	def get_class_names_from_all_json(self, json_dir):
	classnames = []
	for file in os.listdir(json_dir):
	if not file.endswith('.json'):
	continue
	with open(os.path.join(json_dir, file), 'r', encoding='utf-8') as f:
	data_dict = json.load(f)
	for shape in data_dict['shapes']:
	if not shape['label'] in classnames:
	classnames.append(shape['label'])
	return classnames

	def create_save_dir(self, save_dir):
	images_dir = os.path.join(save_dir, 'images')
	labels_dir = os.path.join(save_dir, 'labels')
	if not os.path.exists(save_dir):
	os.makedirs(save_dir)
	os.mkdir(images_dir)
	os.mkdir(labels_dir)
	else:
	if not os.path.exists(images_dir):
	os.mkdir(images_dir)
	if not os.path.exists(labels_dir):
	os.mkdir(labels_dir)
	return images_dir + os.sep, labels_dir + os.sep

	def save_list(self, data_list, save_file):
	with open(save_file, 'w') as f:
	f.write('\n'.join(data_list))

	def __rectangle_points_to_polygon(self, points):
	xmin = 0
	ymin = 0
	xmax = 0
	ymax = 0
	if points[0][0] > points[1][0]:
	xmax = points[0][0]
	ymax = points[0][1]
	xmin = points[1][0]
	ymin = points[1][1]
	else:
	xmax = points[1][0]
	ymax = points[1][1]
	xmin = points[0][0]
	ymin = points[0][1]
	return [[xmin, ymin], [xmax, ymin], [xmax, ymax], [xmin, ymax]]

	def convert_dataset(self, json_dir, json_list, images_dir, labels_dir, names, save_mode='train'):
	images_dir = os.path.join(images_dir, save_mode)+os.sep
	labels_dir = os.path.join(labels_dir, save_mode)+os.sep
	if not os.path.exists(images_dir):
	os.mkdir(images_dir)
	if not os.path.exists(labels_dir):
	os.mkdir(labels_dir)
	for file in tqdm(json_list):
	with open(os.path.join(json_dir, file), 'r', encoding='utf-8') as f:
	data_dict = json.load(f)
	image_file = os.path.join(json_dir, os.path.basename(data_dict['imagePath']))
	if os.path.exists(image_file):
	shutil.copyfile(image_file, images_dir + os.path.basename(image_file))
	else:
	imageData = data_dict.get('imageData')
	if not imageData:
	imageData = base64.b64encode(imageData).decode('utf-8')
	img = self.img_b64_to_arr(imageData)
	PIL.Image.fromarray(img).save(images_dir + file[:-4] + 'png')
	# convert to txt
	width = data_dict['imageWidth']
	height = data_dict['imageHeight']
	line_list = []
	for shape in data_dict['shapes']:
	data_list = []
	data_list.append(str(names.index(shape['label'])))
	if shape['shape_type'] == 'rectangle':
	points = self.__rectangle_points_to_polygon(shape['points'])
	for point in points:
	data_list.append(str(point[0] / width))
	data_list.append(str(point[1] / height))


	elif shape['shape_type'] == 'polygon':
	points = shape['points']
	for point in points:
	data_list.append(str(point[0] / width))
	data_list.append(str(point[1] / height))
	line_list.append(' '.join(data_list))

	self.save_list(line_list, labels_dir + file[:-4] + "txt")

	def split_train_val_test_dataset(self, file_list, train_ratio=0.9, trainval_ratio=0.9, need_test_dataset=False,
	shuffle_list=True):
	if shuffle_list:
	random.shuffle(file_list)
	total_file_count = len(file_list)
	train_list = []
	val_list = []
	test_list = []
	if need_test_dataset:
	trainval_count = int(total_file_count * trainval_ratio)
	trainval_list = file_list[:trainval_count]
	test_list = file_list[trainval_count:]
	train_count = int(train_ratio * len(trainval_list))
	train_list = trainval_list[:train_count]
	val_list = trainval_list[train_count:]
	else:
	train_count = int(train_ratio * total_file_count)
	train_list = file_list[:train_count]
	val_list = file_list[train_count:]
	return train_list, val_list, test_list

	def start(self, json_dir, save_dir, names=None, train_ratio=0.9):
	images_dir, labels_dir = self.create_save_dir(save_dir)
	if names is None or len(names) == 0:
	print('class names will load from all json file')
	names = self.get_class_names_from_all_json(json_dir)
	print('find {} class names :'.format(len(names)), names)
	if len(names) == 0:
	return

	self.save_list(names, os.path.join(save_dir, 'labels.txt'))
	print('start convert')
	all_json_list = []
	for file in os.listdir(json_dir):
	if not file.endswith('.json'):
	continue
	all_json_list.append(file)
	train_list, val_list, test_list = self.split_train_val_test_dataset(all_json_list, train_ratio)
	self.convert_dataset(json_dir, train_list, images_dir, labels_dir, names, 'train')
	self.convert_dataset(json_dir, val_list, images_dir, labels_dir, names, 'val')


	if __name__ == '__main__':
	cm = ConvertManager()
	cm.start(r'源文件路径', r'保存新位置路径')

labelme标签格式json转化成yolov8支持是数据集格式

微信扫一扫：分享