在刚刚结束的国际 PHM 数据竞赛中,昆仑数据的 K2 代表队以绝对优势一举夺冠,成为 PHM Data Challenge 十年竞赛史上首个完全由中国本土成员组成的冠军团队。团队由昆仑数据首席数据科学家田春华博士带领四名成员组成,在业余时间完成了本次竞赛的任务。
PHM(Prognostics & Health Management,即故障诊断与健康管理)学会从 2008 年成立一直专注于工业设备故障诊断领域,其每年举办的「PHM 数据竞赛」是国际上高水平的同类赛事之一。首届竞赛由国际 PHM 学会和 NASA 共同举办,此后赛事成为一项传统,受到来自欧美工业界乃至军工界的追捧,至今已经有 10 届。往年的竞赛题目包括「涡轮发动机的剩余寿命预测」、「齿轮箱异常检测」、「晶圆化学机械平坦化异常分类」等,今年则聚焦于「城轨车辆悬挂系统异常检测」。
本次竞赛包括两个问题:
1)健康诊断:判断城轨车辆悬挂系统是否处于故障状态
2)故障定位:从故障车辆的 22 个部件中识别出 1~2 个故障部件
这个题目具有重要的现实意义,可以延伸至高铁、地铁以及汽车等应用领域。
图为悬挂系统模型,分为一级减震和二级减震,由 22 个部件组成(弹簧/阻尼),共安装 18 个振动传感器(红色标识)
本次竞赛分两个阶段,阶段一为模型的训练与测试,训练集为 200 个健康车辆轨道运行数据,测试集为 200 个待判轨道车辆运行数据;阶段二是模型的验证,验证集为 200 个待判轨道车辆运行数据。
「这里的难点在于,训练数据集中都是健康样本,没有异常。」田春华说,「可是往往有价值的则是异常数据,这是工业场景中普遍存在的现象。」实际工业场景中的异常数据较少,而且工业系统进行过多次调优,所以绝大部分工业数据均为正常数据,这与研究人员进行大数据分析的过程中希望具备全模态样本的期望相背。「比如近万台风机中,三年内可能只有个位数的风机出现过重大故障。想想样本得有多么不均衡吧。」他补充道。
解决这个问题有两种思路,一是用数据模型精确刻画所有的正常情形,只要脱离正常情形就判定为异常,这需要进行细致入微的建模,但会存在误判的情况;二是让模型具备通用性,考虑轨道、速度、负载等外生变量对系统产生的影响,同时考虑系统运行是一个动态的过程,要寻找到不变量。
K2 团队在 PHM 竞赛中的解题思路
「好在我们拿到了 18 个传感器的数据,系统内部的相关性非常强,所以可通过信号上下前后的一致性来增加一些判断。」田春华表示,团队为此加工了减振比等特征。「我们过去在这个问题上积累了很多经验,所以一开始就抓住了问题的基本面。在选择了正确的特征加工路径之后,精度可以达到 80% 以上,接下来再进行算法的调整和优化。」此外,团队还使用了基于相似度的轨道位置匹配减弱轨道不平整的影响。
在判断出系统处于正常还是异常状态后,团队面临着第二个考验,即指出到底是哪些弹簧或阻尼发生了故障。据田春华介绍,由于训练集全部为正常样本,所以这里需要结合自动控制理论中频域分析的知识:弹簧可以控制振幅,阻尼会使振幅衰减。在这个机理的基础上,数据驱动才能实现。
「其实当初在第二个问题上,我们也只是有一个大概的想法,没有必胜的把握。后来使用了多模型才有了一点突破,这都是我们意料之外的。而且跟往年的题目相比,今年的题目机理较强。虽然过去我们有很多经验,但是为了进行佐证,团队仍然查阅了大量的文献。」田春华回忆道。
K2 团队在 PHM 竞赛中的调优曲线图
事实上,竞赛的两个问题原本的分值比重各占 50%。各领先团队在第一个问题上的分数相差不多,但由于第二个问题难度较大,K2 团队占据了绝对领先优势。组委会出于竞赛趣味性的考量,更改了规则,把两个问题的分值比重改为 3:1。
「我们还是处于领先,只是优势没有那么大了。」田春华说道。最终,K2 团队的模型在第一个问题上的准确率达到 82.5%,在第二个问题上的灵敏度达到 53.5%,以 0.762 的总成绩摘得桂冠。
在谈到团队夺冠经验时,田春华表示,在短时间内把数据和机理有效结合,这对选手的专业性要求极高。K2 团队成员来自不同的领域,如自动化、统计、计算机,实现了优势互补。特征加工为后续研究奠定了基础,机理确定则帮助团队瞄准了方向。
在工业领域,企业希望最大程度地挖掘工业大数据的潜在价值并将其高效延伸至实际的细分场景,进而实现对工业业务理解的加深、降低实际决策所带来的不确定性。换言之,这些企业需要一个「医生」,这位「医生」需要通过「望闻问切」掌握工业机器的健康状况,不仅要能诊断出机器是否「生病」以及「病因」,并且对症下药,还要具备预测机器什么时候将会「生病」的能力。
举例来说,风机叶片受到低温环境因素的影响,可能会面临结冰的问题,这不仅存在安全隐患,也会对风机的效率与健康带来不良的后果。由于许多风机部署于较为偏远的地区,单纯依靠人力难以实现对风机状况的监测。如果可以使用传感器采集风机的数据指标,然后传输回机控中心加以分析,那么企业员工就能够远程掌控每一个风机的状态信息。因此,一个能够适应复杂地形、复杂气象条件的数据分析模型就十分必要了。
在人工智能技术兴起之后,工业大数据领域的研究人员就开始尝试使用新技术处理问题,并将其应用于一些数据量较大的工业应用案例。田春华介绍,公司在风机结冰问题上就曾使用过深度学习技术进行自动识别,而且表现不错。「在做风机结冰项目的时候,利用深度学习上来就取得 70% 的精度,这样我们对模型精度有了一个基准。然后我们加工特征后,通过白箱模型让精度提升至 80% 以上。」他解释道,「在处理实际工业问题时,我们通常先用深度学习快速得到一个基准,然后再做一个白箱模型,因为工业界的一线操作人员还是希望模型具有可解释性。某种程度上,人工智能技术降低了加工特征的工作量和数据分析的门槛。」
「当前人工智能存在一定的封闭性,虽然具有巨大的发展空间。在工业大数据领域,基于统计的数据分析方法并不是唯一的技术手段。」昆仑数据 CTO 王晨解释道,「我们认为,工业领域人工智能突破的方向在于,如何把统计模型与领域内的知识与机理模型深度融合。这也是我们研究的一个重要方向。」
「具体到工业领域中的实际问题,远比竞赛复杂和有趣得多,从大数据分析应用领域来说,除了 PHM 之外,大数据还可以在生产效率提升、产业互联网等方面发挥相当大的价值。」
在 SMT(印刷电路板)产线,SPI 机台利用光学检测自动研判锡膏涂抹质量,但往往过于严格,导致很多符合工程设计要求的产品被判定不合格。对于高价值产品,SPI 研判为不合格的板子还需要大量的人工复判。使用机器学习方法自动识别,部分筛选出合格品,这将大大降低人的工作量。
但在石油管道泄漏检测中,机器学习的重点就是降低虚假预警。利用负压波检测是否存在泄漏相对容易,但造成压力下降的因素较多,除了泄漏,还有不同油品输送压力不同、油罐更换等正常工况变化的影响。幸运的是,我们发现不同原因造成的压力下降曲线形状存在细微差别,有的曾现底部震荡,有的曲线光滑但间杂毛刺。利用模式识别技术可自动匹配出识别出的压力下降的真正故障原因,降低了虚假预警给实际运维带来的困扰。
工业大数据的三大典型方向
「一个完整的工业大数据分析要整个流程打通,从开始的接入管理、规划、数据整合、深度分析,到后来的应用、业务流程,以及谁是工业产品的目标用户、选择工业产品的原因及利好等等,这些问题都是工业大数据平台要给出的答案。」田春华说道。
昆仑数据专注于做工业企业的大数据合伙人,成立于 2014 年底,创始团队来自 IBM、华为、西门子等科技企业,公司于 2015 年 1 月完成天使轮融资,同年 9 月获得来自达晨创投的数千万人民币 A 轮融资,2016 年 8 月完成 1 亿人民币 B 轮融资,如今团队有 100 余人。目前,昆仑数据已推出工业大数据平台产品 KMX,着眼于管理分析海量机器数据,挖掘展现数据价值,帮助企业为数据赋能、实现业务洞察、形成行动闭环。
以风机的运维场景为例,KMX 平台可以把风机附近的气象信息、地理信息、包含历史养护信息的设备日志等关联起来,为接下来的数据分析提供有力支持。在没有大数据平台的情况下,这些数据是散落在各个系统中的,无法为数据分析提供上下文信息,可能导致数据挖掘和分析结果较为片面。
目前,昆仑数据主要聚焦于能源行业、装备制造以及电子制造这三个领域。王晨介绍,为了保障企业的数据安全,昆仑数据会施行事前及事后的权限管理策略,设定了严格的访问权限及痕迹追踪管理。王晨表示:「工业大数据领域正处于方兴未艾阶段,市场空间较大,我们也正在积极探索的过程中。」
今年,昆仑数据参与举办了首届中国工业大数据创新竞赛,该赛事由工信部指导、信通院主办,吸引了来自海内外 1000 多支参赛团队。昆仑数据受邀承担出题任务并担任决赛评审专家。此次竞赛的两道竞赛题目分别为「风机叶片结冰检测」和「风机齿形带断裂预警」。谈及投入不少精力来推动中国自己的工业大数据竞赛,「也是希望大家能多关注这个领域,这里面的确有许多有意思的问题。」田春华笑道。
至于未来,人工智能是否能在工业大数据领域有所突破?迁移学习是否能在强机理的现实世界中找到落点?工业大数据还隐藏着哪些未被挖掘出的潜力?
想必随着时间的推移,这些专攻工业大数据的科学家们一定会在实践中找到令人惊喜的答案。