複製鏈接
請複製以下鏈接發送給好友

系統故障

鎖定
故障是指系統不能執行規定功能的狀態。在計算機中,系統故障是指系統在運行過程中,由於某種原因,造成系統停止運行,以致事務在執行過程中以非正常的方式終止,致使內存中的信息丟失,而存儲在外存上的數據未受影響。
2017年12月1日,《公共服務領域英文譯寫規範》正式實施,規定系統故障標準英文名為Out of Order。 [1] 
中文名
系統故障
外文名
Out of Order
學    科
計算機
定    義
由於某種原因,造成系統停止運行
有關術語
事務
領    域
操作系統

系統故障系統故障簡介

故障是計算機程序的語法錯誤或邏輯錯誤。 [2]  系統故障是指系統在運行過程中,由於某種原因,以致事務在執行過程中以非正常的方式終止。按故障的部件可將故障分為硬件故障和軟件故障。硬件故障是指故障因硬件系統失效。軟件故障是指程序運行一些非法指令,如特權指令。

系統故障事務

事務的定義
事務是用於訪問和修改各種數據項的一個程序單位。事務也可以被看做是一系列相關讀和寫操作。被訪問的數據可以分散地存放在同一文件的不同記錄中,也可放在多個文件中。只有對分佈在不同位置的同一數據所進行的讀和寫(含修改)操作全部完成時,才能再以託付操作(Commit Operation)來終止事務。只要有一個讀、寫或修改操作失敗,便須執行夭折操作(Abort Operation)。讀或寫操作的失敗可能是由於邏輯錯誤,也可能是系統故障所導致的。
一個夭折的事務,通常已執行了一些操作,因而可能已對某些數據做了修改。為使夭折的事務不會引起數據的不一致性,須將該事務內剛被修改的數據項恢復成原來的情況,使系統中各數據項與該事務未執行時的數據項內容完全相同。此時,可以説該事務“已被退回”(rolled back)。不難看出,一個事務在對一批數據執行修改操作時,要麼全部完成,並用修改後的數據去代替原來的數據,要麼一個也不修改。
事務記錄(Transaction Record)
為了實現上述的原子修改,通常須藉助於稱為事務記錄的數據結構來實現。這些數據結構被放在穩定存儲器中,用來記錄在事務運行時數據項修改的全部信息,故又稱為運行記錄(Log)。該記錄中包括有下列字段:
· 事務名:用於標識該事務的惟一名字;
· 數據項名:指被修改數據項的惟一名字;
· 舊值:修改前數據項的值;
· 新值:修改後數據項將具有的值。
在事務記錄表中的每一記錄,描述了在事務運行中的重要事務操作,如修改操作、開始事務、託付事務或夭折事務等。在一個事務 T i 開始執行時, 〈T i 開始〉記錄被寫入事務記錄表中;在 T i 執行期間,在 T i 的任何寫(修改)操作之前,便寫一適當的新記錄到事務記錄表中;當 T i 進行託付時,把一個〈T i 託付〉記錄寫入事務記錄表中。 [3] 

系統故障分類

按故障的持續時間分類
按故障的持續時問可將故障分為永久故障、瞬時故障和間歇故障。永久故障由元器件的不可逆變化所引發,其永久地改變元器件的原有邏輯.直到採取措施消除故障為止;瞬時故障的持續時間不超過一個指定的值.並f1只引起元器件當前參數值的變化,而不會導致不可逆的變化;間歇故障是可重複出現的故障,主要由元件參數的變化、不正確的設計和工藝方面的原因所引發。
按故障的發生和發展進程分類
按故障的發生和發展過程可將故障分為突發性故障和漸發性故障。突發性故障出現前無明顯的徵兆,很難通過早期試驗或測試來預測;漸發性故障是由於元器件老化等其他原因,導致設備性能逐漸下降並最終超出正確值而引發的故障.因此具有一定的規律性,可進行狀態監測和故障預防。
按故障的部件分類
按故障的部件可將故障分為硬件故障和軟件故障。硬件故障是指故障因硬件系統失效
按故障的嚴重程度分類
按故障的嚴重程度可將故障分為破壞性故障和非破壞性故障。破壞性故障既是突發性的又是永久性的.故障發生後往往危及設備和人身的安全:而非破壞性的故障一般是漸發性的又是局部的,故障發生後暫時不會危及設備和人身的安全。
除此之外.還可以按照故障的因果關係分成物理性故障和邏輯性故障,按故障的表徵分為靜態故障和動態故障.按故障變量的值分為確定值故障和非確定值故障等。 [4] 

系統故障閉環系統故障

隨着科學技術的發展 , 現代工業系統的規模和複雜程度都在日益提高 . 這類複雜大系統一旦發生故障 , 就可能帶來重大的財產損失和人員傷亡 . 因此 , 如何提高系統在運行中的安全性與可靠性 , 減少生產生活中的安全隱患 , 成為現代工業系統中的重大問題。故障診斷技術是提高系統運行可靠性、降低系統運行風險的重要方法。 故障診斷技術對系統運行狀況進行監測 ,判斷是否有故障發生 ,同時確定故障發生的時間、位置、大小和種類等情況 , 即完成故障檢測、分離和估計。在過去的數十年時間裏 , 故障診斷技術得到了廣泛研究 。大量研究成果得到發表。
目前有部分學者認為,與開環系統相比,閉環系統中的故障診斷性能下降主要由於如下兩個原因 : 1) 反饋系統的引入通常會使得系統對於外部擾動更魯棒 , 因此當故障處於早期階段或幅值較小時,所帶來的影響可能會被控制量所掩蓋 . 發生故障時殘差信號可能仍在較小範圍內變動,使得故障難以被檢測到,導致了更高的漏報率。 2) 反饋控制可能使得故障在系統內傳播,導致多處信號發生異常。以傳感器故障為例,在開環系統中,某傳感器發生的故障不會對系統中其他傳感器造成影響,其他傳感器的測量信號仍然處於正常範圍之內 . 而在閉環系統中,由於引入了反饋信號,某個異常的測量值被反饋控制器採用之後 , 可能導致控制信號偏離正常值 , 進而通過反饋使得系統整體脱離正常工作範圍 , 此時其他傳感器測量得到的也同樣是異常信號 . 這種故障傳遞現象也增加了故障分離的難度。
參考資料
  • 1.    麻辣燙、拉麪等國家標準英文名公佈  .網易 [引用日期2017-11-30]
  • 2.    許鎮宇;鄭爾章,翁瑞琪.計算機科學與工程百科全書 :天津科學技術出版社,1991
  • 3.    湯子瀛.計算機操作系統:西安電子科技大學出版社,2010
  • 4.    慕曉冬,易昭湘,趙鵬,張力著.軟件密集型裝備軟硬件故障理論分析:西安電子科技大學出版社,2015