爱加猫
数据集内容

核心特点

  1. 数据规模与多样性
    数据集包含 7000+ 张高质量图像,涵盖自然场景(如街道、商场)与模拟环境(如低光照、遮挡),包含正确佩戴口罩、未佩戴、错误佩戴(仅遮挡嘴部/下巴)等多种类别,比例均衡(约 1:1),有效解决长尾分布问题。部分数据通过生成算法合成,结合 29 种口罩模板,模拟不同倾斜角度与遮挡情况,增强模型对复杂姿态的适应性。

  2. 精细化标注

    • 检测标注:采用 VOC 与 YOLO 双格式,标注人脸的边界框(face)及口罩状态(mask/nomask),边界框精度达像素级,人工校验错误率低于 0.5%。
    • 属性扩展:部分版本提供七区域遮挡标签(如左眼、右脸),支持细粒度遮挡分析与多任务学习。
  3. 技术优势

    • 模型兼容性:已验证适配 YOLOv5/v7、Faster R-CNN 等框架,基于 YOLOv5 的基线模型在测试集上达到 mAP@0.5=93%,推理速度 160 FPS(GPU),满足实时检测需求。
    • 鲁棒性优化:通过数据增强(仿射变换、噪声注入)与预处理脚本(光照均衡化),提升模型对模糊、反光等干扰的泛化能力。

应用场景

  • 公共卫生:实时监测公共场所口罩佩戴情况,触发预警并生成合规报告,辅助疫情管控。
  • 安防升级:集成至门禁系统,支持戴口罩人脸识别(准确率超 99%),减少摘口罩感染风险。
  • 算法研究:为遮挡人脸识别、小目标检测等课题提供高质量数据,推动模型在极端姿态下的性能突破。

数据集已成功应用于社区管理、高铁闸机等场景,结合人体 ReID 技术实现身份溯源,显著提升排查效率。完整数据样例与训练脚本可通过开源平台或合作渠道获取。