生成AIの請求書、人件費と並べる時代へ 国内5社のAI責任者が語る「トークンマネジメント」の現在地(2/4 ページ)
経費精算SaaSのLayerXやラクス、名刺管理から事業を広げたSansan、会計クラウドのfreee、フリマアプリのメルカリ。取材した5社のAI・人事責任者から、驚くほど重なるトーンでAIのトークンコストを語る声が聞こえてきた。
トークンと人件費が同じ天びんに
トークンマネジメントとは何をすることなのか。最も具体的に語ったのは、freeeでCAIO(最高AI責任者)を務める横路隆氏だ。同氏は「管理会計のアップデート」そのものだと位置付ける。
freeeでは、どの部署の誰が何の目的でトークンを使ったかを全てログに残す仕組みを整えている。そのうえで部門別のPLに費用を割り付け、各部門のPL責任者に予算の権限を委譲している。トークン費用が情報システム部門の一括管理から、事業部門の責任へと移った形だ。
ここから先が、従来のコスト管理とは違う。「今期は外注費と採用費をこれだけ減らすから、AIトークン費用にこれだけ投資する」──横路氏によると、PL責任者たちはこうした投資計画を立てるようになったという。人件費とトークン費用を合わせてROIが成立しているかを見るわけだ。
さらに、人件費をトークン費用に置き換えてアウトカムを伸ばせないかまで考える。「経営の根幹をなすようなところでのトークンマネジメントが必要になってきている」と横路氏は話す。
可視化の徹底ぶりでは、LayerXが目立つ。同社は全社員のトークン使用量を、金額に換算して実名で開示している。2月から5月まで、誰が何トークン使ったかが全員に見える。人事・広報を担当する執行役員の石黒卓弥氏は「福島(CEO)がどれだけ使っているかも見える」と語る。月ごとの残高まで全社員が把握できるという。
ただ、狙いは締め付けではない。「あの仕事はこのくらいなんだ、という感覚を持つこと」という。AI利用のコスト意識を、現場の肌感覚として根づかせる試みだ。
石黒氏はトークン費用を「減価償却費のように見る」とも表現する。外注に払った金は組織に残らないが、AIに使ったトークンは結果がフィードバックされ学習され組織や製品に蓄積される。今年度だけでなく、翌年度以降の基盤になる支出だと捉えている。
ラクスもまさに取り組みを始める。CAIOの本松慎一郎氏は、トークンと人件費を一体で見る取り組みを「まさに今そこを始めようとしているフェーズ」と話す。「人の推移とトークンを人月換算したときの比較で、過剰なAI投資になっていないかを見ていく」という。翌月の取締役会で議題に上げ、継続的に点検する考えだ。
実装の度合いには差があるが、AIを最大活用している各社の向かう先は同じ。トークンと人件費を同じROIの土俵に載せて測ることだ。週に何回AIを使ったかを数えていた段階から、各社はひとつ先へ進もうとしている。
「高いから使わない」ではなく「どう安く使うか」
コストが膨らむなら、使用を抑えればいい。そう考えがちだが、取材した各社の力点は単純な抑制ではなかった。コストを抑えつつ使い続けるための最適化。どのタスクにどのモデルを充てるかを選び分けることで、使う量を減らさなくてもコストは下げられるという立場だ。
カギはモデルの使い分けだ。freeeの横路氏は、複雑な戦略や設計を考える部分にだけ高性能なフロンティアモデルを使い、実行段階は安いモデルに任せる構図を描く。「全部の業務がOpus、Sonnetでなくても回る。モデルを変えてもエージェントが動き続ける基盤さえあれば、コストの安いモデルに切り替えていける」(横路氏)。要件定義からデリバリーまで、どのモデルをどう組み合わせ、どの順で走らせれば一番安く速いか。その設計が腕の見せどころになる。
「Claude Codeの責任者に聞いたら、Anthropicの社内も同じようになってきていると話していた」と横路氏。コストを抑えて大量に作る仕組みづくりへ、開発現場は動いている。
メルカリも同じ方向を見る。CHROとCAIOを兼務する木村俊也氏も、トークンコストをいかに抑え込むかに関心を寄せる。「何でもかんでも高級なモデルに全部任せると跳ね上がる。ルーティングを自動的にすれば、コントロールできる」(木村氏)
ただし、コストを意識させすぎれば、現場は萎縮し、試す手が止まる。LayerXはむしろ「今は使い倒すべきだ」という考え方を前面に出す。石黒氏は今を「バーゲン期間」と呼ぶ。AIベンダー各社が赤字覚悟で安く提供している今のうちに使い倒すことに意味がある、という考えだ。
「本来2倍、3倍、5倍、10倍するものを、このボーナス期に圧倒的に使わせてもらっている」(石黒氏)。値上げが本格化する前に、組織として使いこなせる状態を作っておく。コスト最適化と、あえての先行投資。各社はこの2つを同時に走らせている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
「使い物にならなくなった」──6月1日からの「GitHub Copilot」新料金、SNSで不満続出 他ツールへの移行表明も
GitHubが6月1日に施行したCopilotの従量課金制を巡り、X上で「クレジットの消費が想定より速い」とする投稿が相次いでいる。
それで、メモリ不足はいつまで続くの? なかなか終わらない狂騒のウラ側
長引くメモリ不足。いつ安く購入できるようになるのか……。
「ChatGPTにうちの会社が出てこない」──採用担当を悩ます“AI就活時代”の容赦なき実態
採用やHRの界隈で、じわじわと語られ始めている問題意識がある。就活生、それも優秀な層ほど、キャリア相談をLLMにするようになった。その結果、Web上での露出が乏しくLLMO対策をしていない企業は、学生から“見つけてもらえなく”なってきている――というものだ。
「AIコーディング」がたった5年で急進化したワケ NTT「tsuzumi 2」開発者が分析
コーディングに長けた大規模言語モデル(LLM)が登場したのは2021年ごろだ。それから5年で、競技プログラミングの問題を解けるレベルにまで成長した。なぜAIはコーディングがこれほど得意になったのか──「Interop Tokyo 2026」(幕張メッセ)で、LLM「tsuzumi」のコーディング能力向上を担当するNTT人間情報研究所の風戸広史さんが解説した。

