ユナイテッド航空はなぜ、世界的に発生したシステム障害からいち早く復旧できたのか。実はシステム障害対応とは別の目的で導入した「ある機能」が復旧に役立ったというが、それは何か。
この記事は会員限定です。会員登録すると全てご覧いただけます。
限られたIT予算の中で何を優先し、何を優先しないかを決めるのは難しい。特にリスク管理に関する項目は、懸念される事象が発生するかどうかが分からないこと、また直接利益を生まないことから後回しにされがちだ。「有事が発生しないことを願いつつ、後回しにする」という選択肢を取る企業もあるだろう。こうした“賭け”に勝ったのか負けたのかは、ある程度の時間が経過しなければ明らかにならない。
2024年7月19日未明(現地時間、以下同)にサイバーセキュリティプロバイダーのCrowdStrikeが実施したアップデートによって数百万台のコンピュータがダウンした中で、United Airlinesのシステムが他社に先駆けて復旧したことは記憶に新しい。
これは、同社が導入した「ある機能」が奏功したためだが、United Airlinesが“賭け”に勝ったのかどうかの判断は難しい。というのも、実はその機能は、システム障害への対応とは別の目的で導入されたものだったからだ。それは何か。
United Airlinesがシステム障害から早々に復旧できた背景には、同社が導入したリアルタイムデータ機能があるという。
United Airlinesがテクノロジー戦略においてリアルタイムデータ機能を優先した際、ソフトウェアのアップデートや脅威の検出、IT障害については考慮されていなかった。同社CIO(最高情報責任者)のジェイソン・バーンバウム氏が当時最も重視していたのは、顧客体験と業務効率の向上だったという。
「顧客は情報を強く求めていた。航空業界の専門用語ではなく、顧客が理解できる言葉でより早く、より正確に情報を提供する優れた方法が必要だった」(バーンバウム氏)
United Airlinesはまた、通常運航時および天候による危機的状況において、従業員にリアルタイムでデータを提供することにも重点を置いていた。ただし、2024年7月19日未明(現地時間、以下同)にサイバーセキュリティプロバイダーCrowdStrikeが実施したアップデートによって数百万台のコンピュータがダウンしたのは、バーンバウム氏にとっても想定外だった(注1)。
「われわれはハリケーンや吹雪など常に厳しい環境にさらされているため、迅速に決断を下し、復旧する準備ができていなければならない。そのため復旧能力に投資し、異なるネットワークグループ間のコミュニケーションを強化していた。全員が同じデータを持ち、同じ画面を見ているので非常に厳しい状況でも多くの要素を活用できた」(バーンバウム氏)
CIOは、問題発生時にビジネスを継続させるための技術やプロセスを整備している。しかし、CrowdStrikeのシステム障害は、予測不可能な事態に備えることは難しいということを痛感させるものだった。
航空会社は特に大きな打撃を受けた。追跡サービスを提供するFlightAwareによると、United Airlinesでは2024年7月19日に約700便、その後の2日間でさらに700便以上が欠航になった(注2)。ただし、Delta Air Linesでは2024年7月22日に1000便以上が欠航し、翌日も数百便を欠航になったのに対し、United Airlinesの1日当たりの欠航便数は100便を下回った(注3)(注4)。
復旧には柔軟性と迅速な対応能力が必要だった。United Airlinesのスコット・カービーCEOは、危機発生からわずか3日後に発表された公開書簡で、365の空港にある2万6000台以上のコンピュータとエンドポイントデバイスを再起動するために技術者チームを派遣したことを明らかにした(注5)。
「現場をサポートする組織はあるが、全ての場所に人がいるわけではない。自分の子どもを連れて現地に自動車で向かったスタッフもいた。公式の評価基準はないが、当社は業界で最も早く復旧した企業の一つだろうというのが私の見解だ」(バーンバウム氏)
United Airlinesのモダナイゼーションへの道のりはクラウドから始まった。IT部門が意思決定とデータ共有の全社的な見直しを促した。その目的は、「最新の情報を顧客に提供し、乗務員が飛行機を定刻通りに運航できるようにすること」だった。
同社は2021年にAWS(Amazon Web Services)をクラウドベンダーとして選択した。マイク・レスキネン氏(CFO《最高財務責任者》)によると2024年4月には全体の70〜90%の業務がクラウドに移行し、長い移行作業は終わりに近付いていたという(注6)。
CrowdStrikeの障害が発生する24時間前の2024年7月18日の決算説明会では、カービー氏とレスキネン氏は、ITチームとオペレーションチームが定期的な障害の復旧時間とコストを削減したことを称賛していた。
United Airlinesが技術とプロセスをアップグレードする中、世界的な経営学の教育・研究機関であるMIT Sloan School of Managementのピーター・ワイル氏(上級研究員 兼 MIT Center for Information Systems Research会長)は、リアルタイムビジネスの利点を模索していた(注7)。バーンバウム氏はワイル氏のプレゼンテーションに参加し、United Airlinesが研究者の注目を集めるような共通点を見いだした。
「バーンバウム氏は立ち上がり、『これはわれわれがUnited Airlinesで実施しようとしていることだ』と言った」とワイル氏は「CIO Dive」のインタビューで語っている。
ワイル氏の研究は、バーンバウム氏が優先したユーザー体験の改善に焦点を当てていた。
「われわれの研究は危機やリスクに関するものではなく、顧客と従業員をいかに満足させ、柔軟に対応できるようにするかを重視していた。飛行機や支払いに関することであっても、すぐに答えを得られれば顧客はより満足するものだ」(ワイル氏)
United Airlinesの改善はクラウド技術に根差しつつも、チームにリアルタイムデータと通信のアクセスを提供するエッジ技術と結び付いていた。
「われわれは燃料補給や修理、機内サービス、乗客の搭乗といった航空機の作業をより効率的に進めたかった。われわれがリアルタイムで測定したいデータは、約250種類に上る」(バーンバウム氏)
United Airlinesは2023年、Appleの「iPad」が搭載する生体認証技術「Touch ID」機能を導入し、整備書類の電子化を米連邦航空局から承認された最初の航空会社になった。同社のリンダ・ジョジョ氏(エグゼクティブバイスプレジデント 兼 CMO《最高顧客責任者》)は2023年10月、「これにより何千ものフライト遅延の防止に貢献した」と、「CIO Dive」に語った(注8)。
「われわれはモバイルデバイスにかなり投資した。当社の従業員は必ずデスクで作業しているわけではなく、移動中でもデータにアクセスする必要があるからだ」(バーンバウム氏)
データの信頼や最新化はテクノロジーから始まるが、データの成功はエンドユーザーにとっての満足度と生産性の向上によって測定される。
「データへの信頼、従業員の意思決定への信頼、顧客がデータを効果的に使用することへの信頼が重要です」(ワイル氏)
CIOはチームを信頼して、ある程度のコントロールを譲る必要もあるとワイル氏は言う。「意思決定権を変えなければ、リアルタイムビジネスにはならない。これまでで一番難しいのはデータやシステムインターフェース、APIではなく、意思決定プロセスを変えることだ」
バーンバウム氏にとって、手綱を緩めるのは容易なことではなかった。
「CIOとして評価されるのは、CEOに全ての状況を伝えられることだ」とバーンバウム氏は言う。「CEOから質問されたときに何かについて知らないのではないかという恐れから、従業員から聞き取ることに多くの時間を費やすことになる」
リアルタイムデータへのアクセスと、結果を監視しているチームへのアクセスは、「全ての小さな開発」を追跡するよりも強力だ。
「私が就任してからの9年間、われわれは多くの良いアイデアを出してきた。以前はそれを実行するのに非常に苦労したが、今は本当に良いアイデアの幾つかに取り組む余裕ができた。ただし、それがどのような結果を出すのかは分からない」(バーンバウム氏)
(注1)Top takeaways from the CrowdStrike outage for IT teams(CIO Dive)
(注2)United completes manual reboot as aviation industry reels from CrowdStrike outages(CIO Dive)
(注3)FlightAware.com live flight delay and cancellation statistics for today(FlightAware)
(注4)Delta grapples with $500M in CrowdStrike outage costs(CIO Dive)
(注5)United completes manual reboot as aviation industry reels from CrowdStrike outages(CIO Dive)
(注6)United Airlines nears final mile of cloud migration(CIO Dive)
(注7)New MIT CISR Research Reports Leading “Real-Time” Businesses Had 62% Higher Revenue and 97% Higher Profit Margins(CIO Dive)
(注8)United Airlines digitizes maintenance documents using Apple Touch ID(CIO Dive)
脱VMware旋風が吹き荒れる中、Broadcomはなぜ“余裕”なのか?
「生成AIを全社にスケールさせるのは難しい」 アクセンチュアCEOが指摘する“そのシンプルな理由”
VMwareの料金体系変更をめぐる裁判の行方 Broadcomの“言い分”は?
生成AIは2025年には“オワコン”か? 投資の先細りを後押しする「ある問題」© Industry Dive. All rights reserved.