連載

OpenAIがローカルで実行可能な言語モデル「gpt-oss」シリーズを公開/Google DeepMindがリアルタイム生成可能なAIモデル「Genie 3」を発表週末の「気になるニュース」一気読み!(1/3 ページ)

うっかり見逃していたけれど、ちょっと気になる――そんなニュースを週末に“一気読み”する連載。今回は、8月3日週を中心に公開された主なニュースを一気にチェックしましょう!

 うっかり見逃していたけれど、ちょっと気になる――そんなニュースを週末に“一気読み”する連載。今回は、8月3日週を中心に公開された主なニュースを一気にチェックしましょう!

OpenAIがローカルで実行可能な言語モデル「gpt-oss」シリーズを公開

 OpenAIは8月5日、オープンウェイト(学習済みモデルを公開すること)の大規模言語モデル「gpt-oss」シリーズを発表した。117b(1170億)パラメーターを持つ「gpt-oss-120b」と、21b(210億)パラメーターを持つ「gpt-oss-20b」がリリースされており、Apache 2.0 ライセンスの下、Hugging Faceから無料でダウンロードできる。


OpenAIがローカルで実行可能な言語モデル「gpt-oss」シリーズを公開した

 gpt-oss-120bは80GBのメモリ内で実行でき、コア推論ベンチマークでOpenAIの「GPT-4o mini」とほぼ同等の性能を達成できる。

advertisement

 gpt-oss-20bは16GBのメモリで実行でき、一般的なベンチマークでOpenAI o3 miniと同様の結果を示した。エッジデバイスでの使用やローカル推論に適しているという。

 両モデルはmixture-of-experts(MoE)アーキテクチャを活用し、入力処理に必要なアクティブパラメーター数を削減している。gpt-oss-120bはトークンあたり51億パラメーター、gpt-oss-20bは36億パラメーターをアクティブ化する。

 OpenAIによると、gpt-ossシリーズのリリースの一環として、Microsoftはgpt-oss-20bモデルのGPU最適化バージョンをWindowsデバイスに導入するという。

Google DeepMindがリアルタイム生成可能なAIモデル「Genie 3」を発表

 Google DeepMindは8月5日、テキストプロンプトからインタラクティブ環境を生成できる汎用(はんよう)のワールドモデル「Genie 3」を発表した。


Google DeepMindが、リアルタイムにナビゲーションできる世界モデル「Genie 3」を発表した

 Genie 3は、テキストプロンプトを与えると、ユーザーが720p/24fpsでリアルタイムに移動できる動的な世界(3Dのオープンワールドマップのようなもの)を生成する。従来のGenie 2と比較して一貫性とリアリティーが向上したという。同社は、Genie 3はリアルタイムインタラクションを可能にした初の世界モデルだとしている。

 主な機能としては、水や照明などの自然現象、動物の行動から複雑な植物まで含む生態系のシミュレーション、アニメーションキャラクターを含むファンタジーシナリオの創造、地理的/時間的境界を超えた場所や過去の時代の探索が可能になる。また、「Promptable world events」と呼ばれる機能により、天候の変更や新しいオブジェクト・キャラクターの導入など、テキストベースでの世界変更も行える。

 現在は限定的な研究プレビューとして、少数の学術研究者とクリエイターに早期アクセスを提供している。

       | 次のページへ

Copyright © ITmedia, Inc. All Rights Reserved.