目标检测需同时识别物体类别和定位边界框;推荐用YOLOv8(Ultralytics)+自定义数据集入门,按YOLO格式组织数据、用LabelImg标注、编写data.yaml配置、一行命令训练、三行代码推理并可视化结果。

目标检测不是分类也不是单纯定位,而是既要识别图像中有哪些物体(类别),又要标出它们的位置(边界框)。Python生态里最实用的入门路径是用 YOLOv8(Ultralytics 实现)+ 自定义数据集,不依赖复杂环境配置,代码简洁、训练快、效果稳。
YOLO要求每张图对应一个同名 .txt 文件,每行描述一个目标:类别索引 x_center y_center width height(归一化到 0~1)。比如一张 640×480 图片里有个猫,框左上(100,80)、宽200、高150,则中心点为 (200,155),归一化后是 0 0.3125 0.3229 0.3125 0.3125(类别0=cat)。
建议操作:
dataset/images/train/、dataset/labels/train/、dataset/images/val/、dataset/labels/val/
Ultralytics 的 YOLOv8 封装极好,无需手动写 Dataloader 或 Loss 函数。
立即学习“Python免费学习笔记(深入)”;
执行:
pip install ultralytics然后直接调用预训练模型开始微调:
from ultralytics import YOLO
<h1>加载预训练权重(自动下载)</h1><p>model = YOLO('yolov8n.pt') # nano 版,轻量适合入门</p><h1>训练(指定数据配置文件 + 超参)</h1><p>model.train(
data='dataset/data.yaml', # 包含 train/val 路径和 nc/classes 的 YAML
epochs=50,
imgsz=640,
batch=16,
name='my_cat_detector'
)
data.yaml 示例:
train: ../dataset/images/train val: ../dataset/images/val <p>nc: 1 names: ['cat']
训练完模型会保存在 runs/detect/my_cat_detector/weights/best.pt,直接加载即可预测:
model = YOLO('runs/detect/my_cat_detector/weights/best.pt')
results = model('test.jpg') # 返回 Results 对象
results[0].show() # 弹窗显示带框结果
若需提取结果:
boxes = results[0].boxes → 获取 xyxy 坐标、置信度、类别cls = boxes.cls.tolist()、conf = boxes.conf.tolist()、xyxy = boxes.xyxy.tolist()
训练不动?检测全漏?先看这几点:
nc(类别数)和 names 必须与你的数据严格匹配imgsz 和推理时输入尺寸一致,YOLO 默认会 resize 保持长宽比基本上就这些。YOLOv8 把工程细节封装得很干净,真正需要你动脑的是数据质量和问题定义——框标得准不准,类别分得清不清,比调参重要得多。
以上就是Python实现机器学习中目标检测的详细教程【教程】的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号