うっかり見逃していたけれど、ちょっと気になる――そんなニュースを週末に“一気読み”する連載。今回は、8月3日週を中心に公開された主なニュースを一気にチェックしましょう!
OpenAIは8月5日、オープンウェイト(学習済みモデルを公開すること)の大規模言語モデル「gpt-oss」シリーズを発表した。117b(1170億)パラメーターを持つ「gpt-oss-120b」と、21b(210億)パラメーターを持つ「gpt-oss-20b」がリリースされており、Apache 2.0 ライセンスの下、Hugging Faceから無料でダウンロードできる。
gpt-oss-120bは80GBのメモリ内で実行でき、コア推論ベンチマークでOpenAIの「GPT-4o mini」とほぼ同等の性能を達成できる。
gpt-oss-20bは16GBのメモリで実行でき、一般的なベンチマークでOpenAI o3 miniと同様の結果を示した。エッジデバイスでの使用やローカル推論に適しているという。
両モデルはmixture-of-experts(MoE)アーキテクチャを活用し、入力処理に必要なアクティブパラメーター数を削減している。gpt-oss-120bはトークンあたり51億パラメーター、gpt-oss-20bは36億パラメーターをアクティブ化する。
OpenAIによると、gpt-ossシリーズのリリースの一環として、Microsoftはgpt-oss-20bモデルのGPU最適化バージョンをWindowsデバイスに導入するという。
Google DeepMindは8月5日、テキストプロンプトからインタラクティブ環境を生成できる汎用(はんよう)のワールドモデル「Genie 3」を発表した。
Genie 3は、テキストプロンプトを与えると、ユーザーが720p/24fpsでリアルタイムに移動できる動的な世界(3Dのオープンワールドマップのようなもの)を生成する。従来のGenie 2と比較して一貫性とリアリティーが向上したという。同社は、Genie 3はリアルタイムインタラクションを可能にした初の世界モデルだとしている。
主な機能としては、水や照明などの自然現象、動物の行動から複雑な植物まで含む生態系のシミュレーション、アニメーションキャラクターを含むファンタジーシナリオの創造、地理的/時間的境界を超えた場所や過去の時代の探索が可能になる。また、「Promptable world events」と呼ばれる機能により、天候の変更や新しいオブジェクト・キャラクターの導入など、テキストベースでの世界変更も行える。
現在は限定的な研究プレビューとして、少数の学術研究者とクリエイターに早期アクセスを提供している。
10月にWindows 10のサポートが終了! カウントダウンに向けたMicrosoftの動き
片手で持てる合体ミニPC! スマホサイズでデスクトップPC向けGPUもドッキングできる「Khadas Mind 2s」はロマンの塊だった
オンライン会議こそこだわりたい! 「Poly Voyager Legend 50」は使いやすい片耳ヘッドセットだった
JR東日本トレインシミュレータに「東武鉄道編」登場 スカイツリーラインと東上線を運転できて3980円(本編が別途必要)
バッテリー搭載の“ポータブルNAS”「UnifyDrive UT2」は誰におすすめできる製品か? 性能テストで見えてきた答えCopyright © ITmedia, Inc. All Rights Reserved.