Microsoft、OpenAIに頼らない初の自社製基盤モデルと高効率な音声AIを発表
米Microsoftは8月28日(現地時間)、自社開発した2つのAIモデル「MAI-Voice-1」と「MAI-1-preview」を発表した。
MAI-Voice-1は、MicrosoftのAI部門Microsoft AI(MAI)が開発した初の音声生成モデル。単一スピーカーからマルチスピーカーのシナリオまで、高音質で表現豊かなオーディオを提供するとしている。単一のGPUで1分間のオーディオを1秒未満で生成でき、「現在利用可能な音声システムの中で最も効率的なものの1つ」。既に「Copilot Daily」や「Podcasts」の機能に活用されており、「Copilot Labs」で、表現豊かな音声やストーリーテリングのデモを試せる。例えば、簡単なプロンプトで「choose your own adventure」のような物語を作成したり、睡眠を助けるためのオーダーメイドの瞑想を作成したりすることが可能だ。MAIは、音声をAIコンパニオンの未来のインタフェースとして位置づけている。Copilot Labsで試すことができる。
MAI-1-previewは、米OpenAIと協力せずにMAIがエンドツーエンドで訓練した初の基盤モデル。約1万5000基のNVIDIA H100 GPUで事前学習、事後学習を行った。日常的な質問に対して役立つ応答を提供する、強力な機能を求める消費者向けに設計されているという。現在、コミュニティモデル評価のためのプラットフォーム「LMArena」で公開テストを開始しており、今後数週間のうちにCopilot内で特定のテキスト利用ケースに展開され、ユーザーフィードバックに基づいて学習および改善を進めていく計画だ。
MAIのムスタファ・スレイマンCEOはLinkedInへの投稿で、MAI-Voice-1について「私が今まで使った中で最も表現力豊かで自然な音声生成モデル」とし、今回の発表は「氷山の一角にすぎない。われわれは、モデルの進歩だけでなく、さらに多くの価値を引き出すためにさまざまな特殊なモデルを調整することなど、次の方向性について大きな野心を持っている」と語った。また、Xでは「われわれの次の目標は大きく、モデルの進化、コンピューティングのエキサイティングなロードマップ、Microsoftの製品を通じて何十億もの人々にリーチするチャンスだ。われわれはみんなのためのAIを構築している。共感する人は、ぜひ一緒に作ろう。私のDMはオープンだ」と開発者に呼び掛けた。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「Claude Fable 5」をサブスクの標準機能に――AnthropicのエンジニアがXに投稿 7月8日以降の「早期復活目指す」
-
2
人型ロボットが工場で稼働する様子を6日間生配信、作業成功率99.99%をうたう 中国メーカー
-
3
「Claude Fable 5」の性能が落ちた? 提供停止前後で比べた結果 米AI企業2社がそれぞれ報告
-
4
Meta、「Claude Codeと組織改編で爆速開発」のはずが「想定より加速せず」 ザッカーバーグ氏、社内集会で発言
-
5
国内大手ロボットメーカー3社が協力、「フィジカルAI」向けデータセット構築へ
-
6
ゲームエンジン「Godot」AI生成コードを原則禁止へ レビュアー疲弊「機械と話したくない」
-
7
農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた
-
8
AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか? 11のLLMで“ミルグラム実験” 抵抗できたのは……
-
9
3万円で「Yahoo!ニュース」にPR掲載 プレスリリースをAIで「ニュース風記事」に
-
10
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えたヘビーな利用実態
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR