2015年7月27日以前の記事
検索
ニュース

情シスが「日本1位のAIスパコン」作るまで 猶予は4カ月、ソフトバンク“社長プロジェクト”の舞台裏(1/2 ページ)

ソフトバンクのスパコンが、AI計算性能で国内1位を獲得した。実は、これを開発したのは「情シス」のメンバーだった。“社長プロジェクト”に挑んだメンバーの奮闘を追う。

Share
Tweet
LINE
Hatena
-

 2025年11月、ソフトバンクが快挙を遂げた。同社のAI計算基盤「CHIE-4」が、スーパーコンピュータ(スパコン)の性能ランキングにおける「AI処理性能」を図る指標で国内1位、世界5位に輝いたのだ。

 「うれしかった。AIの計算性能でスパコン『富岳』を超えたというのがなおさらに」――CHIE-4の構築を指揮したソフトバンクの種邑宏平さん(AI&HPCインフラ統括部 統括部長)は、こう話す。

 同社の宮川潤一社長執行役員兼CEOによる大号令で始まった“国産AI基盤構築プロジェクト”。その成功を託されたのは、いわゆる「情報システム部」(情シス)のメンバーたちだ。そのミッションは、プロジェクト発足の4カ月後に初号機「CHIE-1」を稼働させること。しかし、試算したスケジュールから5カ月も前倒しが必要だと分かった。

 スパコン用語を前に「?」状態だった“元情シス部隊”は、この難局をいかに乗り越えて、国内1位の座を手にしたのか。

photo
国内1位に輝いた、ソフトバンクのAI計算基盤CHIE-4(提供:ソフトバンク)

社長プロジェクト始動 情シス業務と並行で「超やばい」

 ソフトバンクがAI計算基盤の構築を打ち出したのは、2023年のこと。生成AIの利用が急増する中で、国産AIインフラの必要性を認識したのが始まりだった。さらに、日本語や国内商習慣に対応する国産生成AI「Sarashina」(サラシナ)の開発を決定。その開発基盤として、CHIE-1を作ることになった。

 「大プロジェクト。社長プロジェクトですよ。ソフトバンクが目指す『次世代社会インフラ』の一角を成す、AI計算基盤の構築プロジェクトに急きょアサインされました」(種邑さん)

photo
ソフトバンクの種邑宏平さん(共通プラットフォーム開発本部 AI&HPCインフラ統括部 統括部長)(編集部撮影)

 アサインされたメンバーは、AI基盤やスパコンに詳しい顔ぶれではなかった。社内ネットワークなどを管理する「コーポレートIT本部」、世にいう情シスだ。当初は、AI計算基盤に必要なシステム「NVIDIA DGX SuperPOD」の名前を聞いても「スーパーポッドって何?」という状態だったという。

 AI計算基盤に専念できるわけではなく、通常の情シス業務と並行させなければならない。当時の多忙さについて、同社の前田高尚さん(AIネットワーク開発部 部長)は「超やばかった」と振り返る。

 「何が衝撃かと言えば、予算規模とスケジュールです。さらに技術的な部分も把握できていない。本当にがむしゃらでした」(前田さん)

「100億円の発注を1週間で」 スケジュールに追われる現場模様

 2023年4月5日にチームが始動。CHIE-1の構築に当たって「8月にAIモデルの学習を始めたい」と告げられた。プロジェクト発足から約4カ月後だ。しかし、スケジュールを試算すると、順調に進んでも完成見込みは12月ごろ。「社長から言われているからどうにかしなければなりません」(種邑さん)

 AI計算基盤を構築するには、多様な部品――GPUサーバ、ネットワーク機器、ストレージ、ラック、電源設備などを購入しなければならない。データセンターの契約も必要だ。米NVIDIAのGPU(画像処理半導体)は、1基当たり数百万円に上る。高額なため社内稟議(りんぎ)にも時間がかかる。

 「ものすごく高価だが、過去のどの案件よりも最短で発注しなければなりません。例えるなら『100億円を超えるのに、1週間以内に発注が必要』というスケジュール感です。何よりもスピード優先でした」(種邑さん)

 発注は急ぐが、調達ルールやコンプライアンスは無視できない。発注先や協力会社、CHIE-1を利用するAIモデル開発チームなどと連携して、プロジェクトを進行した。

 「毎日、次の日のための仕事をしていました。明日期限のものを今日やるので、1つでもコケられない綱渡り状態です」(種邑さん)

昼夜交代で作業、ケーブル1万本を敷設……CHIE-1構築の舞台裏

 機器の調達にも腐心した。NVIDIA製のGPUサーバやネットワーク機器などを購入したが、発注後に「ネットワーク機器が手に入らない」「7月……やっぱり8月に届く」といった連絡が来る。その度にスケジュールを調整したという。

 当初想定したネットワーク機器を入手できず、別モデルに切り替えたため通信ケーブルの敷設方向が変わり、データセンター側の設備を変更したこともあった。

 機器がそろって本格的な工事に入ると、土日問わず昼夜交代制で急ピッチで作業を進めた。作業員の安全管理や健康管理もソフトバンクの責任だ。参考にできる前例が社内になく、手探りだったという。

 ネットワーク環境を担当した前田さんは「約1万本のケーブルを敷設しました。人手で対応しなければならず、ケーブルの重さや設置ルートなどを考える必要があるため苦労しました」と語る。

 ハードウェアだけでなく、ソフトウェア面でも難しさがあった。前田さんによると、2023年当時はAIインフラ用サイバーセキュリティ対策が発展途上で“鉄板構成”がなかったという。「セキュリティの第一関門であるネットワークをいかに守るか苦心しました」(前田さん)

 「『NVIDIAのシステムを入れるだけ』と思われがちですが、セキュリティや運用管理といった社内システムと連携させて初めて利用できます。作業期間が限られる中、大変なところでした」(種邑さん)

photo
ソフトバンクの前田高尚さん(共通プラットフォーム開発本部 AI&HPCインフラ統括部 AIネットワーク開発部 部長)(編集部撮影)

Copyright © ITmedia, Inc. All Rights Reserved.

       | 次のページへ
ページトップに戻る