揭開自動化冗余的神秘面紗
我從自動化行業(yè)的一些新用戶那里聽說,他們僅僅只了解工業(yè)自動化中一些使用的產(chǎn)品技術,對于那些技術的概念卻一知半解。
而今天這篇文章就旨在幫助那些不熟悉工業(yè)自動化領域的一些專業(yè)人士,無論是在職業(yè)生涯的開始,還是從IT或者其他背景進入到操作技術(OT)世界的你們。
在這篇文章中,我將討論冗余問題。這個術語經(jīng)常被廣泛使用,有時它可以是一個簡單的應用程序,但它也可以快速解釋為具有大量技術細節(jié)的復雜討論問題,它的存在比一篇博客文章關于它所能涵蓋的范圍更廣。
我的重點是深入了解使用冗余的原因,推動冗余程度的業(yè)務因素,自動化系統(tǒng)中的類型或級別,以及自動化軟件系統(tǒng)實施的注意事項。
什么是冗余?
冗余是指系統(tǒng)中的備份組件可以在主要組件發(fā)生故障時接管它們的工作。但是備份哪些組件?我會說,任何對你的操作至關重要的組件,都可能是一個會阻止整個過程的單點故障。
我們可以看到人們在冗余系統(tǒng)中實現(xiàn)的一些組件包含但不限于:
-
物理網(wǎng)絡
-
網(wǎng)絡適配器,網(wǎng)卡(NIC)
-
PLC的
-
輸入傳感器
-
輸出控制設備
-
OPC服務器軟件
-
物理服務器
-
HMI / SCADA操作員站和服務器
-
電源/ UPS
失敗,碰撞和后果的要點
冗余的目標是消除單點故障,并為你的過程提供可靠的正常運行時間。在考慮你的冗余需求時,你應該檢查整個系統(tǒng),并了解任何一個部分失敗后的后果。非計劃停機的一些主要后果是以生產(chǎn)能力的損失,生產(chǎn)廢料以及工人和設施安全等因素來衡量。這些因素的業(yè)務成本越高,冗余對于最大化系統(tǒng)生產(chǎn)至關重要的可能性就越大。
你可以在冗余上花費的數(shù)量沒有限制,但所有決策都必須考慮在沒有冗余系統(tǒng)的情況下失敗的代價。
冗余中的常見術語是“碰撞”。“碰撞”是指過程中斷,例如計劃外停機,機器停機。每個工業(yè)過程在碰撞的后果方面都是不同的。如果你處于連續(xù)鋼板生產(chǎn)過程中,輸入原材料流量恒定,連續(xù)鋼板輸出,下游機器將鋼材切割成不同尺寸,你可以想象任何一個部件的停工都會造成多么大的破壞!
連續(xù)過程通常會使用累加器來緩沖一定數(shù)量的產(chǎn)品以允許短暫停止或暫停,但即便是那些只能走到這一步。在紙張生產(chǎn)中,其涉及將濕紙漿連續(xù)進料到以極高速度移動的幅材上,超過幾百毫秒的碰撞可能都是不被接受的。你的生產(chǎn)過程可以承受的“碰撞”越短,那么你的自動化系統(tǒng)中的冗余就越重要。
影響冗余要求的另一個因素是:如果生產(chǎn)過程停止,重新啟動生產(chǎn)過程需要多長時間。在關閉后,有一些連續(xù)的過程可能需要數(shù)小時甚至數(shù)天才能重新啟動。重啟的時間越長,冗余就越重要。
同樣,過程關閉的要求也很重要?;瘜W品和煉油的過程無法做到以無序方式關閉而不會造成災難性后果。通過這些系統(tǒng),你將找到專業(yè)供應商,他們制造三重冗余安全關閉系統(tǒng),具有三重冗余輸入和輸出,以及復雜的三分之二投票方案,以確保無論如何都能使該過程有序地降低!從邏輯上講,在完全冗余的系統(tǒng)中是沒有單點故障的。每個硬件或軟件組件都需要是冗余的,或者根據(jù)需要支持冗余架構。
作為控制工程師,你的工作是尋找適合你流程的冗余級別,然后確定最有可能導致故障的系統(tǒng)組件,并且這些組件需要多少冗余才能達到預期的系統(tǒng)可靠性水平。
故障轉移,故障恢復,可見性
一旦了解了要冗余的內(nèi)容,接下來要做的就是必須決定何時以及如何在系統(tǒng)之間進行故障轉移。你需要確定將使用哪些信號和標準來確定一個主系統(tǒng)不可用?這些信號能夠以足夠快的速度告訴你,以確保你的故障轉移,而不會在你的過程中造成不可接受的碰撞嗎?選擇正確的標準和信號是一種謹慎的平衡。如果你選擇過于敏感的東西,你可能會得到誤報并產(chǎn)生不必要的故障轉移。如果它們不夠敏感,你會得到不必要的碰撞。
你需要決定哪個系統(tǒng)將決定故障轉移到備份系統(tǒng)。如果發(fā)生這種決定,將針對每個流程和應用程序以及可接受的碰撞時間而定。
對于非常重要的事情,你顯然希望確保合適的人知道故障轉移已經(jīng)發(fā)生,何時以及為什么,以便他們可以采取措施來修復主系統(tǒng),并為備份系統(tǒng)可能出現(xiàn)的更大問題做好準備,然后做到失敗只在主服務器返回服務之前。 要做到這一點,那些決定故障轉移的系統(tǒng)應提供可由警報系統(tǒng)監(jiān)視的數(shù)據(jù),這些警報系統(tǒng)會向正確相關的人員發(fā)送電子郵件,短信或其他提示。這些系統(tǒng)甚至可能具有生成通知的內(nèi)置功能。 關鍵是你必須隨時了解系統(tǒng)狀態(tài),以及一些主動通知異常狀態(tài)的方法。
接下來你需要決定,我怎么知道主系統(tǒng)又回來了?你是否希望主系統(tǒng)在返回時成為新的輔助系統(tǒng),或者你是否希望在主系統(tǒng)返回指定的時間段后進程自動故障回復到主系統(tǒng)?你是否希望被告知主系統(tǒng)已經(jīng)返回,然后手動故障回復到主系統(tǒng)?在你開始選擇軟件和硬件組件之前,這些都是你想要了解的因素。
接下來,讓我們探討一些常見的冗余區(qū)域,這些區(qū)域是用戶將軟件應用程序集成到自動化系統(tǒng)中時常聽到的。
網(wǎng)絡冗余
網(wǎng)絡冗余的目標是為了防止通過網(wǎng)絡丟失與其他系統(tǒng)的連接。這對你來說是否重要主要取決于你運行的系統(tǒng)類型。獨立的HMI與單個PLC通信,直接連接到PLC,否則只能將網(wǎng)絡訪問作為“不錯的”功能,可能不需要冗余。
具有多個操作員站,通過以太網(wǎng)連接的多個PLC,通過以太網(wǎng)連接到驅動器的PLC,多個服務器或系統(tǒng)間通信的系統(tǒng)可能具有嚴重的冗余要求。如果失去網(wǎng)絡連接則意味著你的過程可能會停止和失控,與此相關的成本是不可被接受的,那么你此時將需要擁有一個冗余網(wǎng)絡。
這可能涉及冗余網(wǎng)絡布線,交換機,可能的環(huán)網(wǎng)以及任何其他網(wǎng)絡基礎設施,以確保即使網(wǎng)絡中的一個網(wǎng)絡出現(xiàn)故障,網(wǎng)絡流量也將始終有效。目標是提供冗余通信路徑。
在PC或服務器級別,你可能需要計算機中的冗余網(wǎng)卡(NIC)。這樣,如果主NIC失敗,則網(wǎng)絡流量可以使用備份NIC。
無論你擁有多少冗余,你用于數(shù)據(jù)收集,記錄和報告的軟件都需要能夠通過故障轉移順利地與你的架構協(xié)同工作。網(wǎng)絡基礎設施的某些部分對計算機和軟件是透明的,并且可能不需要軟件中的任何特殊功能。通常來說,冗余網(wǎng)絡交換機屬于此類別。
當你開始在計算機中使用冗余網(wǎng)卡以及具有不同IP地址的冗余網(wǎng)絡路徑到達同一目標設備時,你的數(shù)據(jù)收集軟件(如OPC服務器軟件)可能需要進行設置以了解何時應該將故障轉移到備份網(wǎng)絡。
控制硬件冗余
運行對生產(chǎn)至關重要的任務的PLC也很常見。其想法是為控制設備提供冗余。通常,這是你的數(shù)據(jù)收集軟件還需要支持冗余的區(qū)域。
如果你正在使用OPC服務器軟件,并且具有冗余PLC,那么與這些PLC通信的軟件必須能夠支持該架構。軟件需要知道哪個PLC是主PLC,哪個是次級PLC,什么條件會導致故障轉移到輔助PLC,以及何時切換回主PLC。
理想情況下,該軟件還將為你提供在HMI,SCADA或報警系統(tǒng)中監(jiān)視和顯示OPC服務器與之通信的PLC(主要或次要)的方法。
軟件和IT硬件系統(tǒng)冗余
我們不想在這里停下來讓我們的OPC服務器運行的計算機成為單點故障。這意味著我們需要冗余PC上的冗余OPC服務器。為此,我們的OPC客戶端能夠支持冗余OPC服務器。
支持冗余OPC服務器意味著OPC客戶端 - 你的HMI / SCADA系統(tǒng),報警系統(tǒng),MES系統(tǒng)或其他系統(tǒng) - 將需要知道與哪個OPC服務器進行通信。你還需要確定是否希望兩個OPC服務器同時輪詢你的設備,或者你是否希望一個OPC服務器進行輪詢,備份是否處于備用狀態(tài)而不是輪詢。通過管理OPC服務器中項目的活動狀態(tài),這是 OPC 客戶機在 OPC 主從式架構(OPC客戶端到OPC服務器)中的責任,因此有可能實現(xiàn)上述兩種情況。
大多數(shù)OPC客戶端不處理冗余管理的這些細節(jié)。一些HMI / SCADA系統(tǒng)支持冗余,但有時它涉及腳本和其他自定義編寫的代碼。因此,在許多情況下,你需要一個軟件來管理和優(yōu)化與兩個OPC服務器的連接。你的OPC客戶端與冗余管理軟件對話,就好像它是實際的OPC服務器一樣。
顯然,有很多與這些配置相關的細節(jié)超出了我這篇文章所能涵蓋的范圍。冗余可以很簡單,也可以根據(jù)你的業(yè)務需求迅速變得復雜。去仔細考慮,了解你的業(yè)務需求,并了解你當前的應用程序在冗余方面可以處理和不能處理的內(nèi)容是非常重要的。
目前有現(xiàn)成的軟件應用程序,如TOP Server,可以幫助你管理冗余要求。