株式売買システム「arrowhead」で10月9日に起きたシステム障害について、東京証券取引所(東証)は23日、詳しい原因を説明した。メリルリンチ日本証券がarrowheadに注文を発注する際、誤って2台の仮想サーバに同じIPアドレスを設定した状態で同時に接続したことにより、短時間で大量の通信電文が発生。これにより接続装置のうち1台が高負荷でダウンし、障害が起きたという。
証券会社は発注する際、自社の仮想サーバからarrowheadの接続装置に注文電文を送信する。arrowheadの接続装置は1号機〜4号機の4台あり、それぞれ、ゲートウェイサーバの1〜4号機につながっている。
9日午前7時31分、メリルリンチ日本証券が、2台の仮想サーバに同一のIPアドレス・ポート番号を設定した状態で、同時にarrowheadに接続。1台のTCPコネクションが確立した直後に、重複して同一のTCPコネクションの確立が試みられたため、TCPコネクションの管理番号で不整合が起き、短い間隔で大量の再送要求伝聞を送信。接続装置1号機の負荷が高まって安全機構が働き、その先のゲートウェイサーバ1号機も機能を停止した。このため、接続装置1号機に接続していたほかの証券会社の仮想サーバからの注文も受けられなくなった。
東証は午前8時3分と7分、各証券会社に対して、通常稼働している2号機〜4号機に接続されている仮想サーバを利用するように依頼。これらの発注経路を使って問題なく発注できた証券会社もあったが、対応に時間がかかったり対応できなかった証券会社もあったため、午前11時20分にWebサイトで障害発生を報告した。
東証は再発防止に向け、同様な事態が起きた場合もゲートウェイサーバの全機能を停止させないようにシステム設定を変更するほか、接続使用で禁止する事項の具体化、外部からのアクセスで負荷が高まる通信パターンがほかにないか点検。証券会社との間で障害テストも行う。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR