从‘电池’到‘胡萝卜’：聊聊构建YOLO生活垃圾数据集时遇到的坑与收获

张开发

• 2026/6/6 16:06:19 • 15 分钟阅读

分享文章

从‘电池’到‘胡萝卜’构建YOLO生活垃圾数据集的实战思考去年夏天我在自家小区做垃圾分类志愿者时发现一个有趣现象居民们对1号电池属于有害垃圾这类规则记得很牢但面对半个胡萝卜该扔哪个桶时却会犹豫。这种日常观察直接促成了我的生活垃圾识别项目——用计算机视觉技术解决垃圾分类中的模糊地带。本文将分享构建这个特殊数据集过程中的关键挑战和解决方案这些经验或许能帮你避开我踩过的坑。1. 定义垃圾类别的艺术在项目启动阶段最令人头疼的不是技术问题而是如何定义什么是厨余垃圾。最初我们按照市政分类标准制定了四个大类有害垃圾、可回收物、厨余垃圾和其他垃圾。但实际操作中边界模糊的案例层出不穷。1.1 尺寸引发的分类难题我们遇到了几个典型争议案例电池大小的厨余垃圾最初将小土豆、胡萝卜块定义为尺寸不超过5号电池但实际收集的土豆从鹌鹑蛋到拳头大小都有破碎物品的归属半片瓷碗属于其他垃圾但当它小到一定程度时外观特征几乎消失复合材料的处理带铝箔内层的药品包装究竟算有害垃圾还是可回收物最终采用的解决方案是# 类别定义示例 CLASS_DEFINITION { hazardous: [battery_1, battery_2, expired_medicine], kitchen: [potato_small, carrot_cut], # 尺寸阈值定义 size_threshold: { max_diameter: 5.0, # 单位厘米 min_pixel_area: 300 # 最小像素面积 } }1.2 数据平衡的实战策略原始数据采集后各类别数量严重失衡类别初始数量目标数量采集策略有害垃圾120500模拟不同摆放角度厨余垃圾800800保持原样可回收物300500增加不同品牌变体其他垃圾150500人工制造碎片样本我们采用三种增广方式解决这个问题物理模拟在白色转盘上旋转拍摄小物件数字增广使用Albumentations库进行色彩和几何变换合成数据Blender建模生成特定角度的电池图像2. 标注实战中的魔鬼细节标注过程看似机械实则充满认知陷阱。我们团队在标注2000张图片后才逐渐形成可靠的标注规范。2.1 小物体标注的最佳实践对于小尺寸垃圾如纽扣电池我们发现标注框最小尺寸至少15×15像素否则YOLO难以学习有效特征遮挡处理原则被遮挡≥50%的物体舍弃标注部分遮挡时标注可见部分密集小物体采用Mosaic增广时需注意最小间距标注员培训要点对于不确定的物体宁可标注为未知也不要猜测。我们设置了专门的review流程处理这类边缘案例。2.2 质量控制的四重机制为确保标注质量我们建立了以下流程初级标注使用LabelImg进行初始标注交叉验证不同标注员对同一批图片进行二次标注自动检查运行以下脚本检测常见错误# 标注验证脚本片段 def validate_annotation(ann_file, img_size): with open(ann_file) as f: lines f.readlines() errors [] for line in lines: cls, x, y, w, h map(float, line.split()) if not (0 x 1 and 0 y 1): errors.append(f坐标越界: {line}) if w*h 0.0005: # 面积过小 errors.append(f目标过小: {line}) return errors专家复核每周抽样检查5%的标注结果3. 从数据到模型的闭环验证数据集构建不是终点我们设计了特殊的验证方法确保数据质量能转化为模型性能。3.1 特征空间分析技术使用UMAP可视化特征分布我们发现有害垃圾在特征空间中形成紧密簇厨余垃圾分布最分散可回收物出现多个子簇对应不同材质# 特征可视化代码示例 from umap import UMAP import matplotlib.pyplot as plt def visualize_features(features, labels): reducer UMAP(n_components2) embeddings reducer.fit_transform(features) plt.scatter(embeddings[:,0], embeddings[:,1], clabels, alpha0.6) plt.colorbar() plt.title(Feature Space Distribution)3.2 困难样本挖掘策略模型初步训练后我们重点关注持续误判样本建立专门文件夹收集边界案例如电池与瓶盖的混淆特殊光照条件反光金属表面的识别针对这些问题样本我们不是简单增加数量而是分析误判原因光照角度遮挡设计针对性采集方案重新标注问题区域4. 工程化部署的隐藏成本当数据集达到1.5万张图片时一些非技术因素开始影响项目进度。4.1 存储与版本管理方案我们对比了三种存储方案方案成本访问速度版本管理适合场景本地NAS高快困难小团队高频访问AWS S3中中完善分布式团队阿里云OSS低慢基础归档长期存储最终采用的混合方案热数据本地SSD缓存最近使用的2000张图片温数据企业NAS存储完整数据集冷数据云存储备份原始素材4.2 标注团队管理经验经过三个月实践我们总结出标注团队效率公式每日有效标注量 (基础速度 × 质量系数) / (复杂度因子疲劳度)其中质量系数通过交叉验证计算复杂度因子与物体平均尺寸负相关疲劳度采用工作25分钟休息5分钟的模式控制在项目后期我们为标注工具添加了以下人性化功能自动检测长时间未保存操作标注难度评分系统实时显示个人进度排名记得有次为了确定一个被压扁的铝罐是否还属于可回收物我们专门咨询了垃圾处理厂的技术人员。这种跨界沟通带来的认知提升往往比技术优化更令人惊喜。数据集构建从来不只是机械劳动它要求我们同时具备领域专家的洞察力和工程师的严谨性。

更多文章

前端开发 2026/5/25 3:01:04

[实战指南]DSP28335代码RAM化：从Flash到RAM的搬运与性能调优

1. 为什么需要将DSP28335代码从Flash搬运到RAM运行在实时控制系统中，时间就是生命。以高频逆变器为例，当开关频率达到81kHz时，每个开关周期仅有12.34微秒的宝贵时间窗口。在这短暂的时间内，DSP需要完成电压电流采样、保护判断、P…

在VMware Workstation 17上构建华为FusionCompute 6.5.1实验环境的完整指南对于云计算爱好者和IT学习者来说，搭建一个企业级虚拟化环境的实验平台是提升技能的重要途径。华为FusionCompute作为业界领先的云计算管理平台，其学习价值不言而喻。本文将详细…

张开发

前端开发 2026/5/9 13:06:02

显卡驱动彻底清理终极指南：Display Driver Uninstaller (DDU) 深度解析与实战应用

显卡驱动彻底清理终极指南：Display Driver Uninstaller (DDU) 深度解析与实战应用【免费下载链接】display-drivers-uninstaller Display Driver Uninstaller (DDU) a driver removal utility / cleaner utility 项目地址: https://gitcode.com/gh_mirrors/di/di…

张开发

从‘电池’到‘胡萝卜’：聊聊构建YOLO生活垃圾数据集时遇到的坑与收获

最新文章

别再为SaaS多租户数据隔离头疼了！用MyBatis-Plus Dynamic-Datasource 3.3.1，5分钟搞定SpringBoot多数据库切换

2026届毕业生推荐的降AI率方案推荐

Real-Anime-Z部署教程：Linux服务器一键拉起7860端口WebUI服务

2026届毕业生推荐的十大降AI率工具解析与推荐

告别杂乱点云：PCDViewer地面滤波与智能标注功能详解（附城区车载点云处理实例）

#VCS# 编译选项+vcs+initreg+random实战解析：从后仿困境到高效验证

推荐文章

相关文章

分享文章

更多文章

[实战指南]DSP28335代码RAM化：从Flash到RAM的搬运与性能调优

Shell脚本进阶：如何用while循环处理未知次数的任务（避坑指南）

数据分析中的异常值处理：MAD

如何通过社交媒体来提升网站的 SEO 表现

Mem Reduct内存清理工具：掌握20+语言切换的终极技巧

突破限制的完整指南：Cursor Free VIP开源工具深度解析

从MFCC到SVM：零基础实现语音情感识别的完整Pipeline（附MATLAB代码）

Ansible实战：5分钟搞定批量服务器配置（附常用模块速查表）

机器学习进阶（14）：交叉验证

4个维度解析OpenArm：开源7自由度机械臂的创新价值与实践路径

在VMware Workstation 17上，手把手教你搭建华为FusionCompute 6.5.1实验环境（CNA+VRM保姆级教程）

显卡驱动彻底清理终极指南：Display Driver Uninstaller (DDU) 深度解析与实战应用