ミスを指摘されたSakana AI、「AI CUDA エンジニア」の評価誤りを認める　性能は確実に向上

Sakana AIは2025年2月に発表した「AI CUDA エンジニア」について、性能評価が過大にされていたことを認めて謝罪した。再調査で性能向上は確認されたものの、初期の速度評価に誤りがあった。

[後藤大地，有限会社オングス] PC用表示関連情報

LINE

Hatena

　Sakana AIは2025年3月3日、「X」（旧Twitter）の公式アカウントで「AI CUDA エンジニア」の初期発表において性能を過大に評価していたことを認め、謝罪した。同社が再調査を実施した結果、全体的な性能向上を確認したものの、当初発表した最大速度向上の数値には誤りがあった。

　「AI CUDA エンジニア」はLLMでPyTorchコードを高度に最適化されたCUDAカーネルに自動変換することを目的としたエージェントフレームワークだ。進化的最適化の技術を適用することでより高速なカーネルを生成し、AIモデルの実行速度を大幅に短縮できるとしていた。しかし公開後すぐに、その実行速度の妥当性に疑問の声が上がった。

　Sakana AIで改めて内部調査を行った結果、当初発表されたデータの速度最大値に誤りがあった。一方で再検証の結果、AI CUDA エンジニアによる最適化は依然として有意な性能向上をもたらしていることも確認された。

　今回のミスについて同社は「今後はチェック体制を強化し、再発防止を徹底する」と述べ、論文の改訂版を公開する予定であることを明らかにした。

　AI CUDA エンジニアはCUDAカーネルの自動生成と進化的最適化を組み合わせたシステムであり、従来の手動による最適化をAIで置き換えることで、より高速かつ効率的なAIモデルの開発を目指している。Sakana AIは今後もこの技術を発展させ、AIの計算コストを大幅に削減することを目標としている。

関連情報

Sakana AI　スマホで動く小さくて高性能な日本語SLM「TinySwallow-1.5B」を公開
Sakana AIが日本語特化の小規模言語モデル「TinySwallow-1.5B」を公開した。独自の知識蒸留手法「TAID」を活用し、同規模の他モデルを上回る性能を発揮する。
Anthropic、最新モデル「Claude 3.7 Sonnet」リリース　「拡張思考モード」で性能ブースト
Anthropicは、高速応答と高度な推論を両立した新AIモデル「Claude 3.7 Sonnet」を発表した。このモデルはコーディングの精度向上に特化している他、開発者向けツール「Claude Code」も導入されている。
HUE Asset、新リース会計に向け「貸手・サブリース」機能追加　グループ間取引はどう変わる？
ワークスアプリケーションズは新リース会計基準に対応した固定資産管理システム「HUE Asset」に貸手・サブリース機能を追加した。新基準の要請に応じ特に貸手側の会計処理変更をサポートし、企業の会計業務を支援する。
note、クリエイターにAI学習の報酬を還元するトライアルプロジェクト
noteはクリエイターの権利を保護しながらAI学習を進めるトライアルプロジェクトを開始する。AI学習データとして利用されたテキストコンテンツに対して、還元額がAmazonギフトカードで支払われる。
ChatGPTの利用者が全人類の5%に　GPT4.5、GPT5の提供もそろそろ
OpenAIのCOO、ブラッド・ライトキャップ氏は、ChatGPTの週間アクティブユーザーが4億人を超えたと報告。GPT-4.5とGPT-5の導入計画も発表した。

ミスを指摘されたSakana AI、「AI CUDA エンジニア」の評価誤りを認める　性能は確実に向上

関連記事

関連リンク

ミスを指摘されたSakana AI、「AI CUDA エンジニア」の評価誤りを認める 性能は確実に向上

関連記事

関連リンク

ミスを指摘されたSakana AI、「AI CUDA エンジニア」の評価誤りを認める　性能は確実に向上