当前位置：首页 > 杂谈 > 正文内容

工业大数据落地实录：从设备联网到预测性维护，那些年被数据坑过的坑

2026-06-27 11:12:38东方不败杂谈2

做了十几年工业自动化和信息化，我越来越觉得，大数据这东西，真不是嘴上说说那么光鲜。前年我们给一家轴承厂上预测性维护，传感器装了上千个，数据呼呼地往里灌，结果呢？模型预测下周要挂的那台磨床，稳如老狗地转了三个月；倒是一台刚大修过的冲床，突然就崩了。一查，数据漂移。传感器零点跑了俩月愣没人发现。

说实话，工业大数据最大的坑，就在数据本身。我见过太多项目，花大价钱搭平台、上算法，最后死在数据质量上。车间里震动、温度、油液颗粒度这些数据，采集上来漂得你怀疑人生。而且——你猜怎么着？很多老师傅凭手感就能判断的东西，数据愣是看不出趋势。

但这不是说大数据没有用。关键在于，你得知道怎么用，以及别对它抱有不切实际的幻想。

数据采集：千万别小看现场

去年在浙江一家注塑机厂，我们想用电流波形做合模机构故障预警。线圈电流理论上能反映很多机械问题，结果一接上传感器，发现波形上全是谐波干扰——变频器一开，信号就像心电图进了KTV。后来加了滤波、接地、屏蔽，前前后后折腾了三个月。有些搞算法的同事觉得这太底层了，但工业现场，数据质量问题百分之八十出在传感器安装和电磁兼容上，剩下的才是传输和存储。

这地方有个要命的事儿：很多老旧设备，连个通讯口都没有。加传感器？可以，但加在哪儿、怎么加、会不会影响运行，都是事儿。更别提有些厂连设备台账都对不上——你都不知道自己有多少台机器，还想做数据驱动？

所以，真想做大数据，先把数据采集这个坎儿迈过去。不是买几个DTU、上个云平台就算完。你得有人趴在现场，盯每一路信号的波形，对着工况记笔记。

工业物联网传感器安装在机床上

建立数据模型：别指望一把梭

我遇到过一位老板，开口就要“工业大脑”，说把所有数据灌进去，让AI自动找出问题。我苦笑——这玩意儿目前还没有。工业场景的知识图谱和机理模型，比通用大数据复杂得多。比如一个简单的轴承，它的失效模式有磨损、剥落、保持架断裂，每种对应的特征频率不一样，而且受载荷、转速、润滑影响。不做特征工程，直接把原始振动数据扔进神经网络？效果往往还不如一个老工人拿着听诊器听听。

我们团队现在的做法，是“机理+数据”双轮驱动。先用物理模型出一堆虚拟故障样本，训练个基线模型，再拿真实数据调优。这么做的好处是，小样本情况下也能用，而且模型可解释性更强——你告诉现场工程师“这个频率分量异常增高，可能保持架出现问题”，比告诉他“模型预测故障概率0.87”要靠谱得多。

但是！注意我说的是“现在的做法”——这条路我们也走了快五年，中间踩了无数坑。最早直接用LSTM，时序预测看上去很美，实际一上线，虚警率百分之三十。车间主任直接把我们赶了出来。

实战问答：你可能遇到的真实问题

问：我们厂数据很少，故障案例更少，怎么搞预测性维护？

答：这是最常见的困境。其实，没有故障数据，也能做异常检测。先用自编码器学个正常状态的压缩表示，实时数据重构误差一增大，就报警。这是无监督的思路，虽然不能告诉你具体什么故障，但至少能提前发现不对劲。另外，可以结合失效物理的仿真，人为生成一些故障特征，做迁移学习。千万别因为数据少就不动——你不动，永远没数据。哪怕先从一个关键设备开始，慢慢积累。

问：我们车间已经装了SCADA，也接了MES，数据都在数据库里，可是用起来发现数据延迟大、对齐难，怎么办？

答：SCADA通常是秒级甚至亚秒级，MES是分钟级或批次级，两个时序要对齐，确实头疼。我们通常会在边缘侧先做流处理，用时间戳重新同步，并且容忍一定的窗口偏移。比如磨床尺寸数据是每件测量，但振动是连续的，那就按工件节拍，把振动数据切分成对应每件的特征。这里需要IT和OT团队坐在一起，定义好数据语义。别指望自动对齐——这事没有银弹。

数据治理：制造业的隐形成本

有一次，客户指着大屏上的“设备综合效率（OEE）”问我：为啥同一个设备，MES报的OEE和数据分析平台算的OEE相差15个点？我一查，MES那边是依据人工录入的停机原因，而平台是按电流阈值自动判断开关机。结果发现，操作工经常忘记录停机原因，尤其是换班、吃饭时停机那十几分钟。数据治理，不仅仅是技术问题，更是管理问题。

你看工业大数据，最后总要落到“人”上。无论采集、标注、还是使用数据，都离不开一线人员的配合。如果系统上线让他们的工作量不减反增，那数据一定会造假或者被忽略。我们现在的原则是：自动化采集为主，人工录入越少越好；实在避免不了，就做成扫码、点选，最多三步完成。