ITmedia NEWS > 社会とIT >

システム過負荷でなぜATMにトラブルが? みずほ銀システム障害、運用面の課題あらわに

» 2021年03月02日 07時00分 公開
[谷井将人ITmedia]

 2月28日に発生したみずほ銀行のシステム障害。同行の藤原弘治頭取は3月1日に記者会見を開き、システムの過負荷が原因だったとして謝罪した。この障害の影響で、同行が持つATM約5900台のうち4318台が一時取引できない状態に。ATMに挿入したまま戻ってこなくなった通帳やキャッシュカードは5244枚あったという。

photo 左から、常務執行役員の片野健氏、藤原弘治頭取、執行役員の清水英嗣氏

 障害の原因となったシステムの過負荷はなぜ起きたのか。そして、なぜATMにトラブルが波及したのか。藤原頭取は、「今回の障害は想定の甘さに起因するもの」と説明する。会見の質疑応答から、システム障害の全貌が垣間見えた。

データ更新と月末処理がバッティング

 みずほ銀は27日、1年以上動いていない定期預金口座のステータスを「不稼働」に変更するデータ更新作業を行っていた。処理したデータは45万件。この作業を行うにはシステムに十分なデータの空き容量が必要だという。

 同行は事前のテスト環境でシステムに掛かる負荷を計算した上で本番作業を行ったが、同行常務執行役員の片野健氏によると「データ更新作業自体は今回が初めてだった」という。この日は、毎月行っている定期預金の月末処理も15万件同時に処理していたが、問題は起こらなかった。

 障害が起きた28日も、みずほ銀行は約45万件のデータ更新作業を行っていた。しかしこの日は、27日を10万件上回る25万件の月末処理が重なった。システム上の空き容量が不足した結果、インターネットバンキングやATMで定期預金の取引ができなくなる障害が発生したとしている。

ATM誤作動は“リスク軽減”の結果

 みずほ銀行の基盤システムには、どこかで問題が起きた場合にシステム全体がダウンしないよう、一部の機能に制限を掛けて負荷の軽減を図る機能がある。今回もその機能が稼働し、全体的な障害は免れた。

 しかしその結果として、インターネットバンキングやATMをつかさどる部分の機能が制限される事態に。リスクを最小限に食い止めるためにATMの機能が制限され、障害となって現れた。ATMには不正利用の食い止めや、不完全な処理の確認のため、通帳やキャッシュカードを一時的に取り込む機能がある。これが誤作動した。

 Twitterではこの障害で通帳などを取り出せなくなった人たちから、銀行スタッフの対応の遅さを批判する声も上がっていた。

 通常、ATMに通帳やキャッシュカードが取り込まれたまま戻ってこない場合はATM横の電話からATM監視センターに連絡すると、警備会社のスタッフが駆け付け、本人確認などを行って返却する流れになっている。

 今回は障害の規模が大きかったことに加え、規模の正確な把握も遅れたことで十分な対応ができなかったとしている。「長時間お待たせしてしまった。不十分な部分については深く反省している」(藤原頭取)

過去2回の大規模障害を経てのシステム構築は「成功している」

 みずほ銀は過去にも大規模なシステム障害を経験している。同行は、2002年4月1日に営業を始めたその日にシステム障害を起こし、ユーザーは二重引き落としや口座振替の遅延などのトラブルに見舞われた。11年3月14日の障害では、送金時の処理に障害が起き、異常な振り込みなどの問題が起きた。

photo

 同行は過去2回の障害を受け、再発防止策として「システム基盤の充実」「管理上の課題のクリア」「緊急時の対応体制の整備」などの方針を掲げた。11年の障害の後には4000億円以上を投じて基幹システムを刷新。19年夏に本格稼働を始めていた。

 藤原頭取は「過去2回の障害の教訓については、システム構築、運用、リスク管理についてしっかり対処してきたつもりだ」とした上で「今回の障害の問題は運用面にあった」とみる。

 再発防止策については「まだ発生から間もない。しっかり真の原因を調べ、別途改めて再発防止策を策定しなければいけない」(藤原頭取)とした一方で「ハード面と運用面の両方について、いま一度点検する必要がある」と現状の課題を繰り返し強調した。

 藤原頭取は障害の責任について「お客さまに向き合うみずほ銀行が全ての責任を負う。(ベンダーによる)システム構築は無事に成功しており、運用面でみずほグループに不十分なところがあった。グループが責任を持って対処すべき」との見方を示した。

Copyright © ITmedia, Inc. All Rights Reserved.