当前位置:连云港市交流发电机有限公司 > 科技成果 > 电机控制器出现的一种偶发故障排查与分析

电机控制器出现的一种偶发故障排查与分析

文章作者:科技成果 上传时间:2020-02-21

  电子产品故障类别中,偶发故障由于故障现象的不可重复性,通常查找原因较为困难。本文针对一种电机控制器产品出现的通信偶发故障现象,通过认真细致的分析辅以器件硬件检查结果,最终确定故障原因是塑封集成电路内部分层。对于此类问题及隐患,可以从器件选型、筛选、储存、工艺等方面进行控制,采取相应措施,避免故障的发生,提高产品可靠性。

  随着技术的发展,人们对电子产品质量的要求越来越高,在一些特殊的使用场合,如医疗、军工等领域,可靠性是一项重要指标。对生产企业来说,产品可靠性代表责任、信誉和效益。因此产品研制过程出现故障时,要求快速、准确地定位故障原因,并采取有效措施避免故障再次发生。

  在工程实际中,电子产品的故障表现形式多种多样,从故障现象是否容易复现的角度,将其分为两类,对于能够轻易复现的故障,通过实验对比的方法,查找原因较为简单。而另一类故障很难复现,往往只出现一次或几次,极难捕获,原因也较为隐蔽,因而容易被忽视,但它同样会使产品乃至系统失效,导致严重后果。

  我公司研制的一款永磁电机控制器产品串行通信功能在现场运行时曾出现过此类故障,经过耐心细致的分析及测试,我们对各种情况逐一排查,最终查清原因,排除了隐患。以下做具体分析。

  永磁电机是总体系统若干执行机构中的一个,控制器用于驱动电机,根据检测到的电机转子位置信号发出驱动信号,通过功率开关依次向电机三相绕组供电,驱动电机转动。该控制器同时具有通信和键盘控制方式。

  与上位总控系统之间通过RS422串行通信方式传输信息,控制器接收总控系统发出的电机启动和转速指令,同时向总控系统反馈电机的工作状态,包括电压、电流、转速、转向等信息。通信接口硬件原理见图1。

  图中SCI_RXD、SCI_RXD信号与处理器串口连接, U7为RS422收发器件,U6为通信隔离器件,采用隔离电源为通信接口电路供电。全双工工作模式,实现同时接收控制指令和反馈状态信息。其工作特征是,控制器上电复位后,自动定时向总控系统发送状态信息。

  该控制器已在总体系统中稳定运行数月,在某次例行检查测试中,控制器突然出现通信连接故障,具体现象为:上位总控系统向电机控制器发出1280rpm转速指令,电机启动,上传指令显示控制器状态正常;上位总控系统再发出200rpm变速指令时,发现控制器无响应,电机未减速,状态信息不上传,上位总控系统再发出停机和复位指令,控制器均不响应,显示通信发生故障,无法传输指令和信息,此时,键盘显示正常。

  故障状态一直保持,其间有2次可以正常上传信息,后又进入故障状态。约20分钟后,通信恢复正常,西安租发电机重复进行上述测试,一切正常。

  控制器出现通信故障后又进行了几百次重复测试,测试时用示波器同时监视图1中U6前后、U7之后的上传信号及RS422通信电源电压共4个点的信号,结果故障现象未能复现,4个测试点观测到的信号完全正常。

  上述故障现象和补充测试表明,该控制器发生的通信故障具有偶发性,只出现一次,之后进行的目的为复现故障的测试中,未能再次捕获到通信中断现象,这使得排查故障原因变得相当困难。但该款产品可靠性要求很高,通信功能一旦失灵,作为执行机构的永磁无刷电机将不受控,导致总体系统失效。

  只要故障现象出现一次,就证明了隐患的存在。我们详细了解了故障发生时刻相关信息,包括操作方法、环境条件、供电情况等,分析了控制器通信部分的工作原理,按照故障树自上而下的全系统分析方法,将可能导致通信中断的原因分为三大类:硬件原因、软件原因和电磁干扰。具体做出故障树,按照故障树对引起通信中断的原因进行逐一分析。

  电机控制器采用DSP作为处理器,汇编语言编程,程序中利用一个定时器实现控制器定时向总控系统上传状态信息;接收指令设计为中断方式,一旦收到总控系统发出的启动或停机指令,程序立即响应中断跳入指令处理段。

  通过对通信相关程序进行测试和分析,认为控制逻辑简单清晰、控制合理,编程方面也无漏洞,不会引起通信故障。另一方面,假如通信故障由软件引起,故障现象不会持续20分钟左右自行恢复,而且同批产品中也不可能只有一台出现通信故障,因此排除软件出错的可能。

  电磁干扰是导致电子产品故障发生的一个外在电应力,对产品的影响可能是永久的,也可能是暂时的,引发的故障具有偶发特征,这点与控制器通信故障在一定程度上吻合。但从产品设计方面,已经采取了相应的屏蔽、隔离、滤波去藕、地线处理等电磁兼容措施,控制器产品本身抗干扰能力较强;同时,了解到故障发生时,现场电磁环境无变化,同在现场的同批次控制器均未出现异常情况,可以排除电磁干扰的可能性。

  从硬件角度考虑,器件的管脚虚焊、线缆虚接和有关器件本身质量缺陷可能引起偶发故障,具体到本案,可以分为以下几种情况分析。

  3.3.1控制器内部及外接通信线根线与上位总控系统进行上行和下行数据通信,整个通道上使用了2个航空插头进行连接,根据经验,航空插头焊杯与线缆的焊接处是焊接的薄弱环节,容易发生虚焊、西安租发电机虚接。为此,我们做了2项检查:

  (1) 由总控系统发出指令启动电机运行,再发送不同的转速指令,用示波器监视上传数据信号波形,同时用绝缘棒轻轻晃动航空插头焊杯处线缆,观测上传数据波形的变化。试验结果显示,通信信号波形正常(图3),晃动线缆时,未出现通信中断现象。

  (2) 停机后仔细检查2个航空插头焊杯处的焊接情况,焊接较好,未发现焊接线缆连接不牢靠问题。因此排除通信线控制器印制板上通信相关管脚虚焊

  控制器印制板上几乎都是表贴器件,有些是大规模集成电路,管脚细小密集,如果与通信有关的个别管脚存在虚焊,也会导致偶发的通信故障。将该控制器全部器件焊点置于光学放大镜下做详细检查,重点检查DSP、RS422收发器件管脚焊点情况,检查结果显示器件焊接状况良好,没有发现虚焊和短路。详见图4、图5。

  为保证控制器通信不被干扰,可靠工作,产品设计时将通信电路做隔离处理,专门设计了一路5V隔离电源给收发器供电。

  若该电源电压质量差或掉电,必然导致通信中断。用示波器观测通信隔离电源在电机运行与停机状态的波形,结果显示通信电源电压波形较好,质量稳定;而且,通信电源与处理器电源电压出自同一开关电源,故障发生时刻处理器电源电压正常,通信电源并未掉电。

  控制电路中与通信有关的集成芯片包括处理器、隔离器件、收发器,都属于塑料封装半导体集成电路。将控制器拿到专业的实验室,对这三种器件进行了声学扫描显微镜检查。

  检查结果显示:DSP处理器、通信隔离器2种集成电路内部引线架与塑封料界面、半导体基板与塑封料界面均连接良好,未出现分层(详见图6 图7 图8);RS422通信收发器集成电路内部引线架与塑封料界面出现分层(详见图9),图9中黄色圈住的区域内部显示红色的点,表示内部集成电路引线与管脚连接处出现分离,这种现象与器件管脚虚焊情况类似,表明连接不可靠,有可能导致通信故障。

  综上所述,偶发的通信故障极有可能是由通信收发器集成电路内部分层引起,为进一步确认故障原因,我们对控制器进行了3个循环的温度冲击试验,高温60℃、低温-40℃,之后立即进行通信功能测试,结果出现通信故障,更换收发器件后,再次测试通信情况,一切正常。这就证实了偶发的通信故障确由收发器内部分层引起。

  其中各界面表示含义是:A为芯片与塑封料界面;B为引线架与塑封料界面;C为引线架与塑封料界面;D为基板边缘与塑封料界面;E为基板与塑封料界面。

  各界面若产生分层,表示内部电路布线连接状态异常,很可能发生虚接,直接影响其工作可靠性。如果产生分层的器件再受到温度应力变化的影响,就会使隐性的故障因素显性化,故障现象由偶发变为确定。

  塑封半导体器件产生分层的原因在于器件内部残留少量水分,在温度应力作用下,内部产生微小形变,致使半导体内部不同材料连接处分离。

  针对塑封半导体器件由于分层引起电子产品偶发故障的问题,应从几方面采取措施加以解决和防范:(1)在可靠性要求高的使用场合,关键电子器件的选型要慎用塑封器件;

  电子产品的偶发故障不易捕获,特别是器件本身存在缺陷时,对于产品设计者而言不易查清根源,本文分析了电机控制器通信故障发生的原因,进一步探究了由于塑封半导体器件分层引发故障的机理。只要从器件选型、检验、储存、工艺等环节采取相应措施,这一类偶发故障就可以得到控制,产品可靠度得以提高。

本文由连云港市交流发电机有限公司发布于科技成果,转载请注明出处:电机控制器出现的一种偶发故障排查与分析

关键词: 西安租发电机