在制作机器学习数据集的时候,尤其是图片数据集的时候,可能会感到十分的繁琐,本文将介绍简化标注流程的一种思路。

1.收集数据集,清理数据集
2.手动标注部分数据集
3.将标注好的数据集用自己的模型训练
4.将未标注数据用模型进行预测,输出预测文件
5.将预测的数据重新导入标注工具,进行人工调整

在这里插入图片描述
接下来,介绍一个个人使用的,觉得比较方便标注工具CVAT

1.标注类型
边界框——识别追踪任务
多边形——分割任务
折线
点——用于标注姿势估计
在这里插入图片描述
2.标注格式
支持COCO,PASCAL VOC,YOLO…等多种数据格式的方便的导入导出。

3.标注辅助工具
(1) 边缘吸附
在这里插入图片描述
(2) 调节亮度
在这里插入图片描述
(3) 追踪
在这里插入图片描述
4.团队标注
(1)成员管理:成员注册,分组管理
(2)项目任务管理:添加项目,分发任务

5.相关链接
CAVT中文用户指南:https://blog.51cto.com/u_14691718/5063951
英文官方文档:https://openvinotoolkit.github.io/cvat//docs/
项目github地址:https://github.com/openvinotoolkit/cvat

Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐