2025年11月、ソフトバンクが快挙を遂げた。同社のAI計算基盤「CHIE-4」が、スーパーコンピュータ(スパコン)の性能ランキングにおける「AI処理性能」を図る指標で国内1位、世界5位に輝いたのだ。
「うれしかった。AIの計算性能でスパコン『富岳』を超えたというのがなおさらに」――CHIE-4の構築を指揮したソフトバンクの種邑宏平さん(AI&HPCインフラ統括部 統括部長)は、こう話す。
同社の宮川潤一社長執行役員兼CEOによる大号令で始まった“国産AI基盤構築プロジェクト”。その成功を託されたのは、いわゆる「情報システム部」(情シス)のメンバーたちだ。そのミッションは、プロジェクト発足の4カ月後に初号機「CHIE-1」を稼働させること。試算すると、堅実な構築スケジュールから5カ月も前倒しが必要だと分かった。
スパコン用語を前に「?」状態だった“元情シス部隊”は、この難局をいかに乗り越えて、国内1位の座を手にしたのか。
ソフトバンクがAI計算基盤の構築を打ち出したのは、2023年のこと。生成AIの利用が急増する中で、国産AIインフラの必要性を認識したのが始まりだった。さらに、日本語や国内商習慣に対応する国産生成AI「Sarashina」(サラシナ)の開発を決定。その開発基盤として、CHIE-1を作ることになった。
「大プロジェクト。社長プロジェクトですよ。ソフトバンクが目指す『次世代社会インフラ』の一角を成す、AI計算基盤の構築プロジェクトに急きょアサインされました」(種邑さん)
アサインされたメンバーは、AI基盤やスパコンに詳しい顔ぶれではなかった。社内ネットワークなどを管理する「コーポレートIT本部」、世にいう情シスだ。当初は、AI計算基盤に必要なシステム「NVIDIA DGX SuperPOD」の名前を聞いても「スーパーポッドって何?」という状態だったという。
AI計算基盤に専念できるわけではなく、通常の情シス業務と並行させなければならない。当時の多忙さについて、同社の前田高尚さん(AIネットワーク開発部 部長)は「超やばかった」と振り返る。
「何が衝撃かと言えば、予算規模とスケジュールです。さらに技術的な部分も把握していない。本当にがむしゃらでした」(前田さん)
2023年4月5日にチームが始動。CHIE-1の構築に当たって「8月にAIモデルの学習を始めたい」と告げられた。プロジェクト発足から約4カ月後だ。しかし、スケジュールを試算すると、順調に進んでも完成見込みは12月ごろ。「社長から言われているからどうにかしなければなりません」(種邑さん)
AI計算基盤を構築するには、多様な部品――GPUサーバ、ネットワーク機器、ストレージ、ラック、電源設備などを購入しなければならない。データセンターの契約も必要だ。米NVIDIAのGPU(画像処理半導体)は、1基当たり数百万円に上る。高額なため社内稟議(りんぎ)にも時間がかかる。
「ものすごく高価だが、過去のどの案件よりも最短で発注しなければなりません。例えるなら『100億円を超えるのに、1週間以内に発注が必要』というスケジュール感です。何よりもスピード優先でした」(種邑さん)
発注は急ぐが、調達ルールやコンプライアンスは無視できない。発注先や協力会社、CHIE-1を利用するAIモデル開発チームなどと連携して、プロジェクトを進行した。
「毎日、次の日のための仕事をしていました。明日期限のものを今日やるので、1つでもコケられない綱渡り状態です」(種邑さん)
機器の調達にも腐心した。NVIDIA製のGPUサーバやネットワーク機器などを購入したが、発注後に「ネットワーク機器が手に入らない」「7月……やっぱり8月に届く」といった連絡が来る。その度にスケジュールを調整したという。
当初想定したネットワーク機器を入手できず、別モデルに切り替えたため、通信ケーブルの敷設方向が変わり、データセンター側の設備を変更したこともあった。
機器がそろって本格的な工事に入ると、土日祝日問わず昼夜交代制で急ピッチで作業を進めた。作業員の安全管理や健康管理もソフトバンクの責任だ。参考にできる前例が社内になく、手探りだったという。
ネットワーク環境を担当した前田さんは「約1万本のケーブルを敷設しました。人手で対応しなければならず、ケーブルの重さや設置ルートなどを考える必要があるため苦労しました」と語る。
ハードウェアだけでなく、ソフトウェア面でも難しさがあった。前田さんによると、2023年当時はAIインフラ用サイバーセキュリティ対策が発展途上で“鉄板構成”がなかったという。「セキュリティの第一関門であるネットワークをいかに守るか苦心しました」(前田さん)
「『NVIDIAのシステムを入れるだけ』と思われがちですが、セキュリティや運用管理といった社内システムと連携させて初めて利用できます。作業期間が限られる中、大変なところでした」(種邑さん)
「AI需要で半導体不足」の裏で本当に起きていること 東京エレクトロン デバイス幹部が明かす
「なくなったら半導体産業が成立しない」 ソフトバンクGが絶大な信頼を置く企業「Arm」とは何者か
「データセンター」の中ってどうなってるの? 潜入して分かった、生成AIを支える「冷却技術の進化」
「一番になりたい」──孫正義氏が語った野望 OpenAI「10兆円超」などAI革命への投資が徐々に結実
孫正義「SBGで10億のAIエージェントを作る」 生成AIが「自己増殖する仕組み」構築へCopyright © ITmedia, Inc. All Rights Reserved.
Special
PR注目記事ランキング