Microsoftは4月30日(現地時間)、Windows 11向けに2025年5月度の非セキュリティプレビュー更新プログラムをリリースした。Windows 11 バージョン 26H1向けが「KB5083806」、25H2と24H2向けが「KB5083631」となっている。
Windows 11 25H2向け更新プログラムの主な変更点は下記の通りだ。
非セキュリティプレビュー更新プログラムは、月例のセキュリティ更新プログラムに先駆けて変更内容をプレビューする目的のものだ。適用は必須ではなく、オプションを有効にしていなければ自動でアップデートされない。アップデートしなかった場合、基本的には翌月のセキュリティ更新プログラムと同時に適用される。
Googleは5月5日(現地時間)、同社のオープンモデル「Gemma 4」ファミリー向けに、推論速度を最大3倍に高速化する「マルチトークン予測(MTP:Multi-Token Prediction) ドラフター」をリリースした。出力品質や推論ロジックを劣化させずに高速化を実現するとしている。
Gemma 4は4月に公開された最新オープンモデルで、リリース後数週間で6000万回以上ダウンロードされたという。今回のMTPドラフターは「投機的デコーディング(speculative decoding)」アーキテクチャを採用したものだ。
Gemma 4 31Bなどの大規模なターゲットモデルに、軽量なドラフター(MTPモデル)を組み合わせ、ターゲットモデルが1トークンを処理する間にドラフターが複数の将来トークンを予測する。ターゲットモデルがそれらを並列に検証することで、品質を維持したまま生成を高速化する仕組みだ。
通常のLLM推論は、メモリ帯域幅がボトルネックとなり、数十億のパラメーターをグラフィックスメモリから演算ユニットに移動するために大半の時間が費やされる。今回のMTPドラフターは、その遊休状態の演算リソースを活用するアプローチとなる。
Googleは具体的なメリットとして、リアルタイムチャットや音声アプリケーション、エージェント型ワークフローでのレイテンシ削減、26B MoEや31B Denseモデルを個人PCやコンシューマー向けGPUで高速実行できる点、エッジデバイスでのバッテリー消費抑制などを挙げている。
Apple Siliconのバッチサイズ4〜8で最大約2.2倍、NVIDIA A100でも同様の速度向上が確認されたとしている。
MTPドラフターはGemma 4本体と同じApache 2.0ライセンスで提供され、Hugging FaceやKaggleからダウンロード可能だ。Hugging Face Transformers/MLX/vLLM/SGLang/Ollamaなどの主要な推論フレームワークで利用でき、Android/iOS向けの「Google AI Edge Gallery」アプリでも試せる。
Microsoftが描く「定額+従量課金」のAI新時代と、無制限の“エッジAI”へと向かうWindowsのゆくえ
画面を持たない約12gの超軽量ウェルネストラッカー「Google Fitbit Air」 1万6800円で5月26日に発売
モジュール型ミニPC「Khadas Mind」をSurface風に変貌させる拡張ディスプレイ「Mind xPlay」レビュー
まるで工芸品な3kg超のアルミ塊! 官能的すぎる“磁気×メカニカル”なキーボード「Lofree Hyzen」を試す
Macの容量不足をThunderbolt 5で解決! 80Gbps対応SSDケース「D1 SSD Pro」で爆速ローカルLLM環境を作るCopyright © ITmedia, Inc. All Rights Reserved.