最新記事一覧
人材不足やシステムの複雑化が進む中、従来の人手中心のIT運用は限界に近づきつつある。日本企業の多くが依然として初期段階にある。Dynatraceが整理した「自律運用への4段階」を基に考える。
()
リソースが限られる中堅・中小企業にとって、属人的なスキルに頼った復旧作業はもはや限界だ。UTMを核として拠点全体を可視化する方法と、トラブルの原因特定をAIアシスタントとの対話で「ものの数分」に短縮する運用手法を紹介する。
()
動画配信サービス「ABEMA」で6月10日の夜間に大規模なシステム障害が発生し、約4時間17分にわたり動画が視聴できない状態が続いた。人気番組の配信時間帯と重なったため、SNS上では視聴を楽しみにしていたユーザーから落胆や不満の声が多数投稿された。現在は復旧しており、見逃し配信などの対応が予定されている。
()
Elasticは、「セキュリティ」「サーチ」「オブザーバビリティー」向けに、AIチャット上でインタラクティブなUIを出力するMCPサーバを公開した。
()
日立製作所は、医薬品/化粧品の国際展示会「第28回 インターフェックスWeek 東京」において、設備保全支援AIエージェント「現場サポートAIナビ」による設備故障対応の迅速化や作業者の負荷軽減を訴求した。
()
物理的な配線状況さえ把握できていない「見えないネットワーク」は、トラブル発生時の業務停止を長期化させるだけでなく、セキュリティ侵害時の致命的なリスクとなる。リソースが限られる中堅・中小企業にとって、属人的なスキルに頼った復旧作業はもはや限界だ。UTMを核として拠点全体を可視化する方法と、トラブルの原因特定をAIアシスタントとの対話で「ものの数分」に短縮する運用手法を紹介する。
()
NTTドコモは19日、同日朝からSNSなどで話題になっていた携帯電話サービスの障害について、一部MVNOの設備不具合が原因だったと発表した。これとほぼ同時刻にDTIも障害復旧を報告していた。
()
職人技と人海戦術頼みのネットワーク運用管理は限界が近づいている。原因不明の障害対応は現場を疲弊させ、DXの阻害要因にもなりかねない。かつてない難問に直面するIT担当者は、どうすれば楽になれるのか?
()
障害対応やベンダー調整を担う情報システム部門では、「人をどう動かすか」が重要な課題だ。本稿では、AI時代に求められる情シス像をテーマに、組織作りやリーダーシップに関する2本の記事を紹介する。
()
問い合わせ対応や障害対応に追われる情シス担当者の中には、学習を継続できず悩む人もいる。習慣科学の専門家ジェームズ・クリアー氏は、原因は意志の弱さではなく「続けられる仕組み」の不足にあると指摘する。
()
オブザーバビリティーツール「New Relic」を導入した東京ガスは、受付システム「TG-WISP」における問題の対処にかかる時間を大幅に短縮した。その背景にある運用の変化とは何か。
()
システムの不具合は売り上げ減だけではなく、緊急の復旧作業などの重い負担を生む。約7割の企業が、低品質に起因するトラブル収束までに多大な時間と労力を奪われている。目先の費用削減が招く、品質リスクの実態とは。
()
Googleは、「Gemini CLI」を活用してインシデント対応を高速化する実践手法を公開した。アラートの受信から緩和策の実行、根本原因の特定、事後検証報告(ポストモーテム)の作成までの全工程にわたって活用しているという。
()
複数ベンダーの機器が混在して複雑化するインフラは、人海戦術での障害対応に限界を突き付けている。ネットワーク復旧作業の省力化と属人化をなくすために、NTTドコモがAWSのAIサービスで構築したシステムとは。
()
NTTドコモはネットワーク保守のためのAIエージェントシステムを商用化した。100万台以上の装置データをリアルタイム分析し、複雑な故障の対応時間を50%以上削減。自律運用と品質向上を目指す。
()
住信SBIネット銀行は勘定系システムのAWS移行に伴い、Datadogの統合プラットフォームを採用した。導入実績による運用効率化と障害対応の迅速化を背景に、AI活用も視野に入れ、安定稼働とレジリエンスの強化を図る。
()
アスクルは28日、ランサムウェア攻撃によるシステム障害の影響で、2026年5月期第2四半期連結決算にシステム障害対応費用の52億1600万円を特別損失として計上すると発表した。
()
北陸コカ・コーラボトリング(富山県高岡市)のコンタクトセンターでは、昼夜問わず電話が鳴り続けていた。自動販売機の故障対応や請求業務の確認など、その数は日中だけで「年間10万件」に上る。時には、「緊急対応が必要」と見なされ、担当営業が“緊急で呼び出される”ことも多々あった。
()
アサヒビールやアサヒ飲料を擁するアサヒGHDは、2025年9月に発生したサイバー攻撃の詳細を説明した。アサヒGHDのシステムはどのようにして侵入されたのか。復旧作業が長期化している原因と、今後の再発防止策は。
()
デジタル庁は4日、iPhoneでマイナンバーカードを利用できる「iPhoneのマイナンバーカード」がシステム障害から復旧し、正常に申請できるようになったと発表した。10月30日の朝から新規発行申請が完全に終了できない状況になっていた。
()
アスクルはランサムウェア感染により物流システムが停止し、受注・出荷業務を中断している。外部専門家を含む約100人規模で原因調査と復旧作業を進めている。個人情報流出は確認されていないが、引き続き調査が継続されている。
()
バッファロー(東京都千代田区)は10月17日、ストレージ機器からデータを復旧する「データ復旧サービス」において、復旧作業を最優先で行う「緊急復旧サービス」を開始した。対応料金は通常の30%増しで、「可能な限り最短時間でデータ復旧を完了する」としている。
()
気軽に試せるラップトップ環境で、チャットbotを提供するオールインワンの生成AI環境構築から始め、Kubernetesを活用した本格的なGPUクラスタの構築やモデルのファインチューニングまで解説する本連載。今回は、OpenAIが公開したオープンウェイトモデル「gpt-oss」を活用したAIエージェント構築方法を解説します。
()
9月19日午後4時半ごろから発生していたeSIMの開通トラブルについて、NTTドコモは20日の午前9時36分ごろに復旧したと発表した。これに合わせて、販売を停止していたeSIMの申し込みと、「iPhone 17」シリーズや「iPhone Air」など、eSIMのみに対応した端末の販売も順次再開する。
()
筑波大学、熊谷組、奈良先端科学技術大学院大学は、自然災害発生時の復旧作業での活用を想定した建設用ロボットハンドと、自動掘削AIの動作実験を公開した。ロボットハンド技術は、チューリッヒ工科大学との国際共同開発し、壊れやすい物体でも柔らかく把持できる。自動掘削AIは「Sim-to-Real」強化学習を応用し、現場環境に合わせた最適な施工方法を自ら立案して、掘削と同時に地中埋設物もすくい取る自動化施工の技術だ。
()
X(旧Twitter)関連サービスを運営するトゥギャッターが、Xのポストをブログ形式で保存するサービス「Twilog」(ツイログ)について、約1年分の投稿ログが消失したと発表した。原因はデータベースの復旧作業中に発生したオペレーションミス。最新のバックアップで復旧しても、1年近く前にデータが巻き戻る見込みという。
()
ヤマト運輸は5月12日、基幹システムの移管に伴い、一部サービスで不具合が発生していると発表した。再配達依頼や通知の遅延、チャットボットの不具合などが起きており、復旧作業を進めている。
()
NEXCO中日本は7日午後2時までにETCシステム障害が発生していたすべての料金所で応急復旧作業が完了したと発表した。
()
オンプレミスとマルチクラウドを融合したハイブリッドIT環境は、多くの企業で普及している。一方で運用の複雑性は増大の一途をたどっており、異なるシステム間の相互運用やパフォーマンス監視、障害対応など、さまざまな問題が顕在化している。小手先の対応ではこの課題を解決することはできず、経営目標の達成に主眼を置いた戦略的なモダナイゼーションを実践する必要がある。この取り組みを推進する上で基本となるのが、キンドリルが提唱する「Run and Transform」と呼ばれる方法論だ。
()
ファストリーは、「年次グローバルセキュリティレポート」を発表した。それによるとサイバーセキュリティへの支出を削減している企業では「インシデントからの復旧時間」が長期化しているという。
()
JR武蔵野線では、線路の冠水を防ぐ排水ポンプの遠隔監視に、パナソニック エレクトリックワークス社のAIカメラで監視するシステムを導入した。これまでポンプの異常通知があった場合、現地に行かなければ異常内容が分からずタイムロスだったが、素早い復旧作業が可能となった。
()
大規模なセキュリティ訓練で知られるfreeeが、社内での注意喚起用に作成した漫画を翻案して連載。とある会計ソフトベンダーで働く「ルカワくん」が、大規模インシデントを起こすまでの出来事を、カウントダウン形式で描きます(原作:freee CSIRT 画:立枯なろ)
()
JR東海が11月7日、東海道新幹線の総合事故対応訓練を報道公開した。会場は静岡県三島市の「三島車両所」で筆者にとっては初めての見学だったが、「いままでの事故復旧とは考え方が変わってきている」と感じた。今回は訓練の模様と、私が感じた復旧に対する変化をお伝えしたい。
()
VMwareからの移行先として多くの企業が検討しているのが「Nutanix環境」だ。しかし現場の運用管理者は、Nutanix環境への移行方法、VMware環境を再現できるか、障害対応の手順など不安や疑問は尽きない。こうした現場担当者からよく寄せられる疑問と回答について、Nutanixテクノロジーの先駆者たちに聞いた。
()
ユナイテッド航空はなぜ、世界的に発生したシステム障害からいち早く復旧できたのか。実はシステム障害対応とは別の目的で導入した「ある機能」が復旧に役立ったというが、それは何か。
()
PagerDutyは国内企業に所属するITリーダーおよび意思決定権者を対象に実施したシステム障害対応の調査結果を発表した。調査から、日本企業はシステム障害に対応する上で複数の課題を抱えていることが分かった。
()
ハートランド・データの動的テストツール「DT+」のユーザーズカンファレンスにパナソニック エレクトリックワークス社の横山一直氏が登壇。同社ソリューションエンジニアリング本部が手掛ける機器や設備の組み込みソフトウェア開発にて、動作確認や障害対応の効率化に動的テストを活用した事例を紹介した。
()
「地震当初は断水状態になっていて、できることが限られていた」など復旧で苦労したことも。
()
サイバー攻撃により復旧作業が続くニコニコは6月19日、「ニコニコ生放送(Re:仮)」を公開した。「ニコニコ生放送」の仮設サービスとして提供するもので、同サービス代表の栗田氏は「視聴とコメントのみ、必要最低限の機能ですが、サービス一時停止中の間、ユーザーの皆さんが集まる場所をという想いで開発した」とX(旧Twitter)にポストしている。
()
メルカリは、フリマサービス「メルカリ」で5月14日の午前中に発生した障害から復旧したと発表した。
()
江崎グリコは基幹システムの切り替え失敗によって、チルド食品の出荷に影響が出ていると発表した。システム障害によって物流センターの業務を一時停止するとともに復旧作業を実施している。
()
フォーティネットジャパンはエネルギー業界に関するOTセキュリティ関連法改正などの概要について説明会を開催した。
()
システムの障害対応と泣く新生児への対応は案外似ている?
()
自然災害に備えてBCPを見直すならば、通信障害対策を忘れてはいけない。電話やインターネットが使えなくなる事態に備えて、何を用意すればよいのか。平時にも役立つ対策を紹介する。
()
1月1日に発生した「令和6年能登半島地震」を受けて、石川県の一部でモバイル通信サービスが使えない状況が続いていたが、ドコモ、KDDI、楽天モバイルの3社が3月21日までに応急復旧を完了し、震災前のエリアカバーに戻った。ただし、土砂崩れなどで立ち入りが困難な箇所については復旧作業に着手できていない。
()
航空機事故や海難事案ではしばしば「事故原因調査を優先すべき」「責任処罰捜査を優先すべき」という議論がなされるケースが多い。ここで注意したいのは、事故原因調査と責任処罰捜査は必ずしも相反するものではなく、両方が適切に組み合わせられることが“国際標準の事故調査メソッド”において認められていることだ。それぞれが独立してなされることで、より包括的な事故対応が可能になるとされている。
()
モバイルオーダーとデリバリーはメンテ中。
()
PCのキッティングや故障対応で消耗している情シスは多いが、それは本来担うべき業務なのか。中小企業のPC運用に関する課題と解決策を久松 剛氏に聞いた。
()