ユナイテッド航空はなぜ早期復旧できたのか? 思いがけず奏功した「ある機能」:CIO Dive
ユナイテッド航空はなぜ、世界的に発生したシステム障害からいち早く復旧できたのか。実はシステム障害対応とは別の目的で導入した「ある機能」が復旧に役立ったというが、それは何か。
限られたIT予算の中で何を優先し、何を優先しないかを決めるのは難しい。特にリスク管理に関する項目は、懸念される事象が発生するかどうかが分からないこと、また直接利益を生まないことから後回しにされがちだ。「有事が発生しないことを願いつつ、後回しにする」という選択肢を取る企業もあるだろう。こうした“賭け”に勝ったのか負けたのかは、ある程度の時間が経過しなければ明らかにならない。
2024年7月19日未明(現地時間、以下同)にサイバーセキュリティプロバイダーのCrowdStrikeが実施したアップデートによって数百万台のコンピュータがダウンした中で、United Airlinesのシステムが他社に先駆けて復旧したことは記憶に新しい。
なぜ他社に先駆けて復旧できた? 実は別目的で導入していた「ある機能」
これは、同社が導入した「ある機能」が奏功したためだが、United Airlinesが“賭け”に勝ったのかどうかの判断は難しい。というのも、実はその機能は、システム障害への対応とは別の目的で導入されたものだったからだ。それは何か。
United Airlinesがシステム障害から早々に復旧できた背景には、同社が導入したリアルタイムデータ機能があるという。
United Airlinesがテクノロジー戦略においてリアルタイムデータ機能を優先した際、ソフトウェアのアップデートや脅威の検出、IT障害については考慮されていなかった。同社CIO(最高情報責任者)のジェイソン・バーンバウム氏が当時最も重視していたのは、顧客体験と業務効率の向上だったという。
「顧客は情報を強く求めていた。航空業界の専門用語ではなく、顧客が理解できる言葉でより早く、より正確に情報を提供する優れた方法が必要だった」(バーンバウム氏)
United Airlinesはまた、通常運航時および天候による危機的状況において、従業員にリアルタイムでデータを提供することにも重点を置いていた。ただし、2024年7月19日未明(現地時間、以下同)にサイバーセキュリティプロバイダーCrowdStrikeが実施したアップデートによって数百万台のコンピュータがダウンしたのは、バーンバウム氏にとっても想定外だった(注1)。
「われわれはハリケーンや吹雪など常に厳しい環境にさらされているため、迅速に決断を下し、復旧する準備ができていなければならない。そのため復旧能力に投資し、異なるネットワークグループ間のコミュニケーションを強化していた。全員が同じデータを持ち、同じ画面を見ているので非常に厳しい状況でも多くの要素を活用できた」(バーンバウム氏)
CIOは、問題発生時にビジネスを継続させるための技術やプロセスを整備している。しかし、CrowdStrikeのシステム障害は、予測不可能な事態に備えることは難しいということを痛感させるものだった。
航空会社は特に大きな打撃を受けた。追跡サービスを提供するFlightAwareによると、United Airlinesでは2024年7月19日に約700便、その後の2日間でさらに700便以上が欠航になった(注2)。ただし、Delta Air Linesでは2024年7月22日に1000便以上が欠航し、翌日も数百便を欠航になったのに対し、United Airlinesの1日当たりの欠航便数は100便を下回った(注3)(注4)。
復旧には柔軟性と迅速な対応能力が必要だった。United Airlinesのスコット・カービーCEOは、危機発生からわずか3日後に発表された公開書簡で、365の空港にある2万6000台以上のコンピュータとエンドポイントデバイスを再起動するために技術者チームを派遣したことを明らかにした(注5)。
「現場をサポートする組織はあるが、全ての場所に人がいるわけではない。自分の子どもを連れて現地に自動車で向かったスタッフもいた。公式の評価基準はないが、当社は業界で最も早く復旧した企業の一つだろうというのが私の見解だ」(バーンバウム氏)
航空業界で求められるリアルタイムデータの重要性
United Airlinesのモダナイゼーションへの道のりはクラウドから始まった。IT部門が意思決定とデータ共有の全社的な見直しを促した。その目的は、「最新の情報を顧客に提供し、乗務員が飛行機を定刻通りに運航できるようにすること」だった。
同社は2021年にAWS(Amazon Web Services)をクラウドベンダーとして選択した。マイク・レスキネン氏(CFO《最高財務責任者》)によると2024年4月には全体の70〜90%の業務がクラウドに移行し、長い移行作業は終わりに近付いていたという(注6)。
CrowdStrikeの障害が発生する24時間前の2024年7月18日の決算説明会では、カービー氏とレスキネン氏は、ITチームとオペレーションチームが定期的な障害の復旧時間とコストを削減したことを称賛していた。
United Airlinesが技術とプロセスをアップグレードする中、世界的な経営学の教育・研究機関であるMIT Sloan School of Managementのピーター・ワイル氏(上級研究員 兼 MIT Center for Information Systems Research会長)は、リアルタイムビジネスの利点を模索していた(注7)。バーンバウム氏はワイル氏のプレゼンテーションに参加し、United Airlinesが研究者の注目を集めるような共通点を見いだした。
「バーンバウム氏は立ち上がり、『これはわれわれがUnited Airlinesで実施しようとしていることだ』と言った」とワイル氏は「CIO Dive」のインタビューで語っている。
ワイル氏の研究は、バーンバウム氏が優先したユーザー体験の改善に焦点を当てていた。
「われわれの研究は危機やリスクに関するものではなく、顧客と従業員をいかに満足させ、柔軟に対応できるようにするかを重視していた。飛行機や支払いに関することであっても、すぐに答えを得られれば顧客はより満足するものだ」(ワイル氏)
United Airlinesの改善はクラウド技術に根差しつつも、チームにリアルタイムデータと通信のアクセスを提供するエッジ技術と結び付いていた。
「われわれは燃料補給や修理、機内サービス、乗客の搭乗といった航空機の作業をより効率的に進めたかった。われわれがリアルタイムで測定したいデータは、約250種類に上る」(バーンバウム氏)
United Airlinesは2023年、Appleの「iPad」が搭載する生体認証技術「Touch ID」機能を導入し、整備書類の電子化を米連邦航空局から承認された最初の航空会社になった。同社のリンダ・ジョジョ氏(エグゼクティブバイスプレジデント 兼 CMO《最高顧客責任者》)は2023年10月、「これにより何千ものフライト遅延の防止に貢献した」と、「CIO Dive」に語った(注8)。
「われわれはモバイルデバイスにかなり投資した。当社の従業員は必ずデスクで作業しているわけではなく、移動中でもデータにアクセスする必要があるからだ」(バーンバウム氏)
データの信頼や最新化はテクノロジーから始まるが、データの成功はエンドユーザーにとっての満足度と生産性の向上によって測定される。
「データへの信頼、従業員の意思決定への信頼、顧客がデータを効果的に使用することへの信頼が重要です」(ワイル氏)
CIOはチームを信頼して、ある程度のコントロールを譲る必要もあるとワイル氏は言う。「意思決定権を変えなければ、リアルタイムビジネスにはならない。これまでで一番難しいのはデータやシステムインターフェース、APIではなく、意思決定プロセスを変えることだ」
バーンバウム氏にとって、手綱を緩めるのは容易なことではなかった。
「CIOとして評価されるのは、CEOに全ての状況を伝えられることだ」とバーンバウム氏は言う。「CEOから質問されたときに何かについて知らないのではないかという恐れから、従業員から聞き取ることに多くの時間を費やすことになる」
リアルタイムデータへのアクセスと、結果を監視しているチームへのアクセスは、「全ての小さな開発」を追跡するよりも強力だ。
「私が就任してからの9年間、われわれは多くの良いアイデアを出してきた。以前はそれを実行するのに非常に苦労したが、今は本当に良いアイデアの幾つかに取り組む余裕ができた。ただし、それがどのような結果を出すのかは分からない」(バーンバウム氏)
(注1)Top takeaways from the CrowdStrike outage for IT teams(CIO Dive)
(注2)United completes manual reboot as aviation industry reels from CrowdStrike outages(CIO Dive)
(注3)FlightAware.com live flight delay and cancellation statistics for today(FlightAware)
(注4)Delta grapples with $500M in CrowdStrike outage costs(CIO Dive)
(注5)United completes manual reboot as aviation industry reels from CrowdStrike outages(CIO Dive)
(注6)United Airlines nears final mile of cloud migration(CIO Dive)
(注7)New MIT CISR Research Reports Leading “Real-Time” Businesses Had 62% Higher Revenue and 97% Higher Profit Margins(CIO Dive)
(注8)United Airlines digitizes maintenance documents using Apple Touch ID(CIO Dive)
© Industry Dive. All rights reserved.
関連記事
脱VMware旋風が吹き荒れる中、Broadcomはなぜ“余裕”なのか?
Broadcomは2023年のVMware買収によりソフトウェア部門を拡大したが、製品価格の引き上げにより顧客の流出が懸念される。同社が見据える次のターゲットはどこなのだろうか。
「生成AIを全社にスケールさせるのは難しい」 アクセンチュアCEOが指摘する“そのシンプルな理由”
多くの企業が生成AIの導入を急いでいるが、アクセンチュアによると、多くの企業はまだ実験段階にあり、全社にスケールするのは難しいという。その理由とは。
VMwareの料金体系変更をめぐる裁判の行方 Broadcomの“言い分”は?
VMwareの製品ラインアップや料金体系の変更による動揺が収まらない中で、ユーザー企業がBroadcomを相手に訴訟を起こした。裁判で明らかになったBroadcomの「言い分」は。
生成AIは2025年には“オワコン”か? 投資の先細りを後押しする「ある問題」
世間の注目が生成AIに集まる中、デロイト トウシュ トーマツが実施した調査によると、CFO(最高財務責任者)の3分の2近くが今後、生成AIへの投資を控えようとしているという。その背景にある「ある問題」とは。