一 问题提出
淮安同方水务有限公司下属淮安市第二污水处理厂处理能力10万吨/日,采用BAF工艺。该厂自控系统采用西门子S7300系列PLC,全厂共有两个S7300系列PLC站,分别称为PLC1及PLC2,每个S7300PLC站主机架都有数个通过PROFIBUS-DP总线网络(RS-485电平)连接的远程I/O分站。这两个PLC站都配有以太网模块及以太网交换机。PLC1、PLC2、两台监控上位机以环形光钎以太网形式连成网络,见图一所示(图一中只画出了PLC1、PLC2站的主机架,PLC1及PLC2的远程I/O站通过PROFIBUS-DP电缆与各自的主站以菊花链形式相连接):
图一中1、2、3为带有光口及电口的工业以太网交换机,4、5为PLC1及PLC2站,6、7为监控上位机。交换机的光口分别插入多模光钎构成10/100Mps环形以太网,PLC1、PLC2站中的以太网模块用普通网线插入交换机中的电口。PC1、PC2分别为工程师站及操作员站,这两台监控PC都配有普通网卡,通过网线插入以太网交换机,所配组态软件为杭州和利时自动化有限公司的FACVIEW 6.0。
该污水处理厂2006年6月通过环保验收正式投入运行。全厂自控系统由杭州和利时自动化有限公司集成制作。
自2014年7月起,PLC1站及PLC2站所控制的设备都不同程度出现了异常现象,有些设备在远程手动及远程自动运行时出现不明原因停机现象,并且这些异常停机的设备都由PLC、PLC2的远程I/O站所控制。有时一个班能停好几次,有时好几天又正常。我们还进一步观察到,不明原因停机分两种情况:一种停机现象发生后,必须中控室操作人员从上位机上手动重新启动,才能正常运行;另外一种停机现象不需要中控室操作人员重新在上位机上启动,设备在经过短暂非正常停止运行后,自己又恢复正常运行了。在设备现场印象非常深的是:PLC2站所控制的多台曝气罗茨鼓风机,正常运行时声音很大也很稳,突然之间可能某台风机会嘎然停止运行,很短时间后又自动恢复运行。
设备远程手动或者远程自动运行时,由PLC程序及中控室操作人员命令来决定设备的运行规律,远程手动及远程自动运行出现停机现象我们第一个想到的就是PLC站中控制该设备的梯形图程序是否有问题。打开西门子STEP7进行程序监控,一切都很正常。又想想PLC1及PLC2中程序已经稳定运行8年多,没有人修改过程序,PLC程序中不应该有逻辑及其他编程错误。
我们又怀疑PLC硬件出了问题,就几乎把这两个PLC站所有硬件从主机架CPU模块、到各个远程I/O站PROFIBUS-DP通信接口模块IM153-2 、各个远程站的I/O模块、主机架及远程I/O机架的底板等用备品换了个遍,每次去现场这么折腾一次,似乎能正常运行一段时间,但过一段不定的时间后,老问题又出现了,这个问题曾经在一段时间内让我们很头疼,百思不得其解,CPU模块也没有报硬件故障及与远程站通信故障,似乎PLC系统硬件也是正常的。
图二为PLC2站主机架及远程I/0站。
图二
图二中左上角标有(0)UR为主机架,主机架中有CPU 315-2DP模块一只、以太网通信模块CP 343-1一只、串行通信模块CP340-RS422/485一只。该CPU模块上有两个通信口,一个通信口可通过编程软件选为MPI协议或者DP协议;另外一个通信口只能为DP通信协议,但可通过STEP7选为DP主站或者从站协议。本例主机架中DP那一行左侧拖出一根线连到PROFIBUS(1): DP master system(1)的通信口设置为DP 主站协议,各远程I/O机架中的PROFIBUS DP通信接口模块IM153-2只有从站通信协议。主机架中CPU模块 DP通信口做主站,与各远程I/O站中通信模块IM153-2做从站进行主从通信。
图二中的各个远程I/O站中的(6)、(7)、(8)、、、、、(14)为远程IO/站号,站号旁边的ET 20、或者ET 2 等全称应该为ET 200M,不过在编程软件STEP7中就是这样显示的。
每个远程I/O站中第一槽为通信接口模块IM153-2,然后是根据需要插入的若干数字量及模拟量I/O模块。
主站跟所有从站轮询通信,主站周期地读取从站的输入信息并周期地向从站发送输出信息,通信由主站发起,从站不主动跟主站通信,从站之间不通信。
二 设备异常停机原因分析
经过多次现场检查、更换备件仍然无法解决问题后,我们用电脑连接PLC,用STEP7在线,打开PLC故障诊断缓冲区,查看故障诊断缓冲信息,这一看就发现了问题。该型CPU故障诊断缓冲区中最多可以保留120条信息,根据故障信息中的日期时间及值班人员记录我们发现,每出现一次CPU跟某个远程I/O站通信失败,就有一些设备异常停机,并且从通信失败到通信恢复之间时间一般就几秒钟,每一次通信失败后都能自动恢复。
利用PLC故障诊断缓冲区信息结合相应设备梯形图程序逻辑分析,我们发现正是CPU跟远程I/O站通信失败导致了设备异常停机。
以下以2014年9月26日PLC2站的9号远程I/O站所控制的一号二级提升泵异常停机为例,分析第一种停机即停止后需要中控室操作人员重新启动才能运行情况:
值班记录显示当日晚上9点55分左右该泵出现了异常停机,并且中控室操作人员在上位机上重新手动启动后才运行起来。
下图三为导出的该时段PLC缓冲区部分信息:
从图三中可以看出,2014年9月26日晚上9点55分48秒25毫秒时(event 2 of 10)CPU与9号远程I/O通信失败,2014年9月26日晚上9点55分50秒509毫秒(event 1 of 10)通信恢复,通信中断时间2秒多一点。注意西门子PLC CPU故障诊断缓冲区最早的信息排列在后面。
图三
下图四为该台水泵部分梯形图程序。
图四中I0.0为该台提升泵控制柜上的现场/远程转换开关,当该开关为远程位置时I0.0为1,I0.1为故障信号,当水泵有故障存在时I0.1为1。M100.0及M100.1与上位机通信软件相连,M100.0为上位机设定的提升泵工作模式,当在上位机选定为远程自动模式运行时,M100.0为1,选定为远程手动模式时为0;M100.1为上位机启/停命令,当在上位机点动启动水泵时M100.1为1,再次点动时M100.1为0,再次点动又为1,,,。
M200.0为远程自动工作模式时启/停命令,还有一段梯形图逻辑程序专门用来根据工艺要求确定在自动模式时的M200.0,但该段程序与本论点关系不大,故未列出。Q0.0为输出继电器,控制提升泵启/停。
从NETWORK 1 中可以看出,在现场/远程开关转换选定在远程位置(I0.0为1),无故障(I0.1为0),上位机将该设备选定在远程手动模式时(M100.0为0),在上位机上点动开/停机按钮,则M100.1为1,Q0.0就为1,水泵就运行了,如果要停机,则需要再次点动开/停机按钮,M100.1就为0 . Q0.0就为0,水泵就停止运行了。
本段梯形图程序的输入点现场/远程I0.0、故障I0.1正好来自该9号远程I/O站,输出Q0.0来自另外一个远程I/O站。从图三PLC故障诊断缓冲区信息中我们看到,在2014年9月26日晚上9点55分48秒25毫秒时CPU与9号远程I/O站瞬间通信失败,9点55分50秒509毫秒通信又恢复了,通信中断时间2秒多一点。如果从NETWORK 1 中看,CPU跟9号远程I/O通信中断2秒多一点时间,只是在这2秒多一点时间内Q0.0输出为0,水泵短时停机后就又自动恢复运行了。当从NETWORK 2看,短时间通信中断,CPU读不到该远程站输入模块的信息,会自动将对应输入映像区的值设定为0,从图中可以看出I0.0一为0, 就将上位机开/停机指令M100.1清0,M100.1为0后,Q0.0就为0了,设备就停止运行了。要想设备重新运行,只有在上位机上人为重新点动水泵启/停按钮将M100.1置位为1。我们将PLC故障诊断缓冲区中的通信中断信息、相应异常停机设备的梯形图程序、以及中控室值班记录一起对照一一进行了检查,每一台设备异常停机然后重新远程人为启动后又正常运行都是这个原因造成的。
经过分析后发现,第二类异常停机即设备短时停止很快又自动恢复运行也是由于CPU跟相应远程I/O站通信中断引起的。在此由于篇幅的原因没有列出PLC故障诊断缓冲区信息及设备梯形图程序,只用语言描述一下。假如以某台曝气鼓风机为例,风机梯形图程序与图四水泵程序相似。
由于鼓风机梯形图程序中现场/远程输入点、故障点没有处在中断通信的这个远程I/O站上,只有控制设备运行命令的输出点处在了通信中断的这个远程I/O站上了,从图四梯形图程序中可以看出,秒级时间的通信中断会使命令输出Q0.0秒级断开,一旦通信恢复,设备又自动运行起来了,这跟我们在现场突然听到某台鼓风机嘎然一声停机又很快自动恢复运行这一现象是一致的。我们也对PLC故障诊断缓冲区的信息及中控室设备运行记录一一对照检查,也印证了这一点。
短时间内通信中断后又恢复,由于没有任何规律,也许几天一次也不出现,也许一天出现几次。一旦出现CPU上的通信故障指示LED 灯也是一闪而过又恢复正常,维护人员在现场也无法用常规的万用表等工具检测捕捉这一过程。
三 CPU跟远程I/O站通信中断原因及解决方法
在确立了由于CPU与远程I/0站通信中断而引起设备异常停机这一因果关系后,我们就联系西门子技术支持,询问为什么CPU与远程I/O会出现无规律短时通信中断,他们答复是电磁干扰,因为电磁干扰进入PROFIBUS-DP总线中而引起CPU与远程I/O站瞬间或者短时间通信中断,并且告诉我们减小电磁干扰的途径。我们按西门子技术支持的指导意见于2014年10月份从如下几点进行了整改。经过整改后,从那时到现在,再也没有出现设备异常停机现象。
具体进行了如下整改:
1、PLC CPU所在控制柜及远程I/O站所在控制柜良好接地,等电位联结CPU所在的控制柜与所有远程I/O站所在控制柜接地
本厂PLC2号站CPU所在主机架在一个控制柜中,其它6、7、8、9、10、11、12、13、14远程I/0站分布在三个控制柜中,四个控制柜紧靠在一起,我们对每个柜接地进行了检查,发现个别接地不牢靠,重新进行了紧固;PLC1号站主机架跟远程I/O机架在同一个控制柜中,我们对其接地进行了检查紧固。如果这些控制柜距离较远的话,在每一个柜接地良好前提下,还应该把所有控制柜接地做等电位连结起来。
2、 PLC主机架、远程I/O机架接地
PLC上安装模块的机架有接地点,必须确保模块机架跟本柜体接地良好。
3、选用合格的PROFIBUS-DP电缆及接头,PROFIBUS-DP电缆应尽可能远离动力电缆
为了保证通信质量,应优先选用西门子生产的PROFIBUS-DP通信电缆及PROFIBUS-DP接头。在制作PROFIBUS-DP接头时,应轻轻剥开电缆外皮,不要损坏外包绕的电缆屏蔽层,按要求将电缆屏蔽层牢固地压接在PROFIBUS-DP接头外壳上。PROFIBUS-DP电缆应该尽可能远离动力电缆,特别要远离变频设备的动力电缆。本厂PLC1、PLC2这两个站都存在个别PROFIBUS-DP接头处电缆屏蔽层断裂、与接头外壳接触不好现象。
4、网络两端屏蔽接地
将网络的起始两头站点PROFIBUS-DP接头外壳接地。
5、采取杜绝电源干扰措施
由于电网中变频设备的应用、大功率动力设备的开关等形成的谐波、浪涌等冲击会通过电源对通信造成干扰,建议用UPS 给PLC供电,一般UPS都有减少电源谐波及浪涌、净化电源的作用。
,