去年,一个做精密连接器的老板找我诉苦。他们花了几十万上的“AI视觉检测系统”,验收时挺好,上线三个月后,漏检率飙升到6%——怎么听怎么像段子,对吧?但这是真事。机器在那头不断把残次品判为良品,产线主管每天对着报表挠头。最后发现,相机镜头上落了一层车间特有的油雾。就一层薄薄的油雾。计算机视觉(CV)落地工业,第一个要过的关,往往不是算法,而是这些你想都想不到的物理细节。❗

说实话,CV在制造圈火了好几年。深度学习、卷积神经网络这些词,连产线操作工都能聊两句。但真正铺开看,能稳定跑过24个月的项目并不算多。为什么?因为工厂不是实验室。光照变一点,机械振动大一点,产品批次材料反光不同,整个模型就可能漂移。搞CV的人常吐槽:我们更像是在和物理世界肉搏,而不是优雅地写代码。
从一张“脏图”说起——成像才是CV的地基
很多人以为,工业视觉就是买个高分辨率相机,接个GPU服务器,再跑个YOLO。错了。成像系统如果不到位,后面全是白搭。我曾经在一个汽车零配件项目里,被一个看似简单的问题卡了两个月:金属表面缺陷,在早班和夜班的光照条件下,特征完全不同。车间窗户透进来的自然光会叠加到LED环形光源上,导致采集到的图像灰度值有近15%的浮动。深度学习模型就在那,误报率时高时低,像女人的心思一样捉摸不定。
所以现在我对项目前期的建议非常直接:花30%的预算在成像方案上,别嫌贵。包括选型高均匀性的光源、加装偏振片消反光、设计可防尘防振的相机支架。有一个趋势值得关注:液态镜头和自适应照明开始进入工业领域。系统能根据环境光自动微调焦距和亮度,这才算真正跨进了“智能”的门槛。💡
问:我们厂上了深度学习缺陷检测,为什么误报率还是很高?
答:先别急着调参。去查三样东西:一是图像是否糊了,哪怕只是微小的运动模糊;二是打光方式是不是该换了,尤其对于高反光材质,环形光可能不如低角度光;三是标注质量——这个后面细说。很多误报,根子在成像,不在算法。有一次我们仅仅把曝光时间从20毫秒调到15毫秒,误检就掉了40%。简单得让人想哭。
算法不是万能药:数据标注的坑有多深
说到标注,又是血泪史。不少工厂以为,只要花钱找外包团队标几万张图,扔进GPU训一通,就能得个好模型。结果呢?现场根本用不了。原因出奇地简单:标注标准没有和工艺绑定。什么是“划伤”?多长多深算划伤?在不同产品等级里,同一个表面纹理可能一个是OK一个是NG。外包团队不明就里,统一标成“缺陷”,模型学到后面直接懵了。
更麻烦的是,工业缺陷数据天生就不平衡。一个正常生产线下来的产品,99.9%都是良品,缺陷样本少得可怜。用常规方法训出来的模型,往往偏向于把所有东西都判断为OK——这也是漏检的元凶。我们试过很多招:过采样、生成对抗网络合成缺陷、甚至把良品数据故意做增噪处理,让模型对正常波动更鲁棒。没有银弹,都是手工活。

问:小批量多品种的生产模式,CV系统怎么适应?每次换型都要重新训练模型吗?
答:这正是现在工业CV最头疼的点之一。完全重训不现实,时间成本受不了。比较可行的思路是预训练大模型+小样本微调。比如先用海量公开工业图像训练一个基础模型,让它学到纹理、边缘、形状等通用表征,再针对特定产品用几十张标注图做快速适配。有些平台已经能做到5分钟内完成新品类切换。不过说回来,如果产品差异大到离谱——比如从金属件突然切换到透明塑料件——那还是得重新来过。CV不是孙悟空,不能七十二变。✅
3D视觉的崛起:当平面不够用了

2D视觉统治了很长时间。尺寸测量、定位、字符识别,用得好好的。可一旦遇到高度差、凹凸不平或者随意堆叠的场景,2D就抓瞎了。还记得几年前捡垃圾的机器人竞赛吗?那基本全靠3D视觉。现在工业界,3D的渗透率在急速爬升。结构光、激光三角法、ToF,各种方案争奇斗艳。我在一个铸件打磨项目里,用3D相机获取毛刺的高度和体积,配合机器人自动规划打磨路径,直接把打磨工从粉尘车间里解放出来。那一刻,真有点科技向善的感觉。
不过,3D也娇贵。对环境光干扰更敏感,速度通常比2D慢,数据量更是大得惊人。一个普通的3D点云,动辄几百万个点,处理起来对算力要求直线上升。而且,3D算法的人才储备远比2D少,招聘难度大。有时候想想,这就像当年从模拟相机切到数字相机,阵痛期免不了。
落地即优化:MES对接与实时性挑战

视觉系统在工厂里从来不是孤岛。它得和PLC通信,把结果传给MES,甚至要控制吹气阀把次品直接吹走。这中间涉及到实时性——你算法再牛,每张图推理200毫秒,生产线也不等你。曾经有个食品包装项目,要求每分钟检测600件,折合下来每件只有100毫秒。我们不得不把模型压缩到极致,用了TensorRT和INT8量化,最终勉强卡到80毫秒。即便如此,还得留20毫秒给通信和机械动作。那感觉,就像在刀尖上跳舞。
此外,工业界对“稳定”的定义很苛刻。不是实验室里99.5%的准确率就算赢,而是连续运行72小时不出岔子,换班时模型不衰退。我见过最极端的案例,是一个做锂电池焊接检测的客户,他们要求零漏检——对,一个都不能放过。过杀可以,但漏检就是潜在的安全事故。为了实现这个目标,我们上了冗余视觉系统:两道独立的相机工位加双算法投票,硬件成本翻番,但值。
这几年还有个明显的趋势:视觉系统的边缘化。不再把所有图像传回服务器处理,而是在相机端或边缘盒子进行推理,只传结果和少量缩略图到上位机。这样带宽压力小,实时性更好,而且车间断网也能工作。毕竟工厂的网络环境,远没有办公室那么稳定。
最后聊两句感慨。计算机视觉这行,在工业领域,真的不能只做“刷榜”的玩家。顶会论文精度再高,赛题数据集再花哨,拿到沾满油污的产线面前,经常一文不值。你得懂材料、懂光学、懂自动化,甚至要懂一线工人的心理——他们是否信任这套系统?会不会故意遮挡镜头?这些非技术因素,有时比技术本身更难搞。但正因如此,当一个CV系统真正能替代人眼,做到24小时无疲劳动态质检时,那种成就感又无可替代。就像看着自己亲手锻的一把刀,终于能削铁如泥。💪
免责声明:文章内容来自互联网,本站仅作为分享,不对其真实性负责,如有侵权等情况,请与本站联系删除。
转载请注明出处:计算机视觉(CV)在制造业的实战:不是魔法,是系统工程 https://www.dachanpin.com/a/tg/59276.html