フォールトトレランス(ふぉーるととれらんす)情報マネジメント用語辞典

fault tolerance / 故障許容 / 耐障害性

» 2009年09月22日 00時00分 公開
[@IT情報マネジメント編集部,@IT]

 部分的に障害やエラーが発生しても、全体としては正常な動作を保ち続けるようなシステム特性のこと。こうした特性の実現を図る設計思想や運用アプローチをいう場合もある。

 フォールトトレランスは、システムを構成する個別要素の信頼性を高めるには限界があるという立場に立つもので、その対蹠概念はフォールトアボイダンスである。フォールトトレランスを実現する方法としては誤り検出、誤りマスク、冗長化、再構成、一貫性回復などがある。

 IT分野ではハードウェアやソフトウェアに障害があっても処理が中断せず、故障個所の修復もシステムを停止しないで行えるコンピュータを「フォールトトレラント・コンピュータ」という(fault tolerantは形容詞)。これを実現する技術としてはプロセサの複数搭載、ディスクのRAID構成化、ネットワークインターフェイスや電源装置、冷却ファンの多重化、無停電電源装置の導入、ディスクやメモリのエラー検出機能などが挙げられる。

 初期のコンピュータは真空管やリレーなどの素子で構築されていたが、これらは品質が低く、高い頻度で故障するために計算処理がたびたび中断された。さらに計算結果そのものの信頼性が低いという問題があった。そこでこの時代のコンピュータ科学者は、信頼性に欠けるデバイスを使ってきちんと動作するコンピュータを作る方法について研究を行っていた。フォールトトレラントに関する諸概念の多くは、この先駆的研究に基づいている。

 1960年代になって信頼性の高い集積回路が登場すると、これらの研究は一端下火になるが、1960年代末にコンピュータシステムを連続運転するという需要から「フォールトトレラント・コンピューティング」の概念が登場し、1970年代から1980年代にかけてフォールトトレラント・コンピュータやノンストップ・コンピュータなどの特殊なコンピュータが登場した。今日、これらのテクノロジはHAコンピューティングに引き継がれている。

参考文献

▼『フォールト・トレラント・システム』 ジェイムズ・N・グレイ=著/渡辺榮一=編訳/マグロウヒルブック/1986年10月(『Fault-Tolerant Microprocesser-Based Systems』『Fault-Tolernt Systems in Commercail Applications』『Transsaction Concept: Virtues and Limitaions』『Transaction Monitoring in Encompass』の邦訳)

▼『コンピュータシステムの高信頼化技術入門??フォールトトレラントシステムの基礎』 向殿政男=編/当麻喜弘=監修/日本規格協会/1988年3月

▼『フォールト・トレランス入門』 パラ・K・ララ=著/古屋清、玉本英夫=訳/当麻喜弘=監訳/オーム社/1988年9月(『Fault Tolerant and Fault Testable Hardware Design』の邦訳)

▼『フォールト・トレラント・コンピューティング』 向殿政男、秋田雄志=著/丸善/1989年9月


Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ