技术巡猎 零跑 动力电池预警方法、电动汽车及存储介质。对电池安全的理解,多数人想到的,都是“起火不起火”这个层面。其实对主机厂来说,如果可以在很早的时候,就发现那种还没发展成故障、但已经开始不对劲的苗头,意义就更大了。
车上的动力电池,其实一直都在受监控的,电压、电流、温度这些数据,BMS都能监测到值。但看见不等于看懂,很多早期异常,刚开始不是那种一眼就能发现的大问题,它可能只是某个单体电压一闪而过的小波动,或者某段时间里温度变化有点别扭,用传统阈值做规则往往是抓不住的,但如果想把所有高频数据都传到云端慢慢算,带宽和成本又扛不住。
车端离电池最近,能看到更细的高频信号,但车上算力有限,不可能长期跑很重的模型。云端算力够,能分析海量车的数据,但上传过去的往往是降频后的低频数据,很多瞬态细节在路上就丢了。一个看得近但脑子不够大,一个脑子够大但看得没那么细。
零跑想做的,就是把这两边的优点拼起来。
它首先是在云端收集很多车上传的低频运行数据,比如电池包总电压、各单体电压、总电流、探针温度这些。这里的低频,大致就是1到10秒一帧。然后它不是直接拿这些数据去做故障分类,而是先训练一个自编码器,也就是先让模型反复学习“正常电池平时长什么样”。你给它一堆正常工况数据,它一边压缩、一边重构,最后慢慢学会把正常状态的共性给提炼出来。
这个动作非常重要。因为电池故障数据天然少,尤其是早期故障,更少。上来就狠狠干监督学习,很容易学偏。先把“正常状态”学透,相当于先建立一个健康基线,后面再看异常,就容易得多。
但光有这个还不够。因为云端这些低频数据,很多细微信号看不到。所以专利里第二步,是拿少量高频数据再去微调模型。高频数据大概是10到100Hz,意思就是一秒钟采很多次。这个频率下,像瞬态电压跌落、细小波动、温度突变这些,才更容易被抓到。
它也没傻到把高频原始数据全往云端扔。那样通信压力太大了,量产也不现实。它做的是让车端先把这些高频数据过一遍编码器,压成一个特征向量。你可以把它理解成,把一大段原始波形浓缩成一个“重点摘要”。这样一来,车端保留了对高频细节的观察能力,云端也拿到了比低频数据更有信息量的东西,而且通信负担也还可以接受。这其实挺像干活的人发周报:它并不需要把一天里说过的每句话都记录下来,把关键变化、异常点、趋势先总结出来,就行了。
后面它再把两部分东西合在一起用。低频运行数据负责看整体状态,高频特征向量负责补细节,然后一起送进预警模型,输出异常概率。这个组合就比单看低频或者单看高频都更靠谱。低频像体检报告,看长期趋势;高频像心电监护,看短时异动。两个东西放一起,判断才更接近真实情况。
专利里还有一个我觉得比较像量产思维的地方,就是闭环更新。车端跑模型,平时持续上传低频数据和压缩后的高频特征;一旦后续真的发生故障,云端就能把那段数据拿来继续训练模型,再做轻量化处理,下发回车端。也就是说,这不是一个一次性训练完就不动的静态模型,而是会随着车越来越多、故障样本越来越丰富,慢慢往前进化。
所以这份专利我会把它理解成一种“分层预警”的思路。云端负责见多识广,先把正常工况的共性学出来;车端负责贴身盯防,把高频细节压缩成有价值的信息;两边再通过模型更新形成闭环。
