数据集内容
核心特点
-
数据规模与多样性
数据集包含 12,050 张高分辨率图像(部分版本为 10,000 张),涵盖国内外主流烟草品牌(如中华、玉溪、万宝路等),覆盖不同包装类型(硬盒、软盒、塑封盒)及复杂场景(正常光线、反光、部分遮挡)。图像通过手机及专业设备采集,模拟零售货架、仓储物流等真实环境。 -
精细化标注
- 目标检测标注:提供 YOLO 与 VOC 双格式标注文件,标注类别包括烟盒整体边界框(
cigarette_box
)及部分子类(如开口烟盒、破损烟盒),部分版本扩展至吸烟行为检测(如手持香烟)。 - 属性标注:补充烟盒品牌、颜色、包装状态(完整/开封/变形)等标签,支持多任务联合学习。
- 目标检测标注:提供 YOLO 与 VOC 双格式标注文件,标注类别包括烟盒整体边界框(
-
工业适配性
- 缺陷检测支持:针对印刷瑕疵(套印偏差、色差)、包装破损等常见问题,提供专项标注数据,适配质量检测算法开发。
- 模型兼容性:已验证与 YOLOv5/v8、Faster R-CNN 等框架兼容,官方测试中 YOLOv8 模型达到 mAP@0.5=94.5%,推理速度满足实时检测需求(180 FPS)。
技术优势
- 数据增强:通过仿射变换、光照均衡化、拼接增强等手段扩展样本多样性,提升模型泛化能力。
- 场景覆盖:包含塑封烟盒图像修复数据(如去除反光干扰),支持复杂条件下的鲁棒识别。
应用价值
- 智能零售:自动识别货架烟盒库存及陈列合规性,优化补货与巡检流程。
- 工业质检:检测包装印刷缺陷(如文字残缺、色差),降低人工质检成本。
- 防伪溯源:通过品牌特征识别与包装状态分析,辅助打击假冒产品。
本数据集已应用于多个智能制造与零售数字化项目,为烟草行业提供高精度、高鲁棒性的视觉分析基础。完整数据样例与训练脚本可通过合作渠道获取。