“AIトランスフォーメーションの時代”へようこそ――Microsoftの生成AI戦略に見る、AI活用のカギ

» 2024年07月02日 10時00分 公開
[PR/ITmedia]

 “AIトランスフォーメーションの時代”へようこそ――2024年5月、米Microsoftの開発者向けイベント「Microsoft Build 2024」はこんなメッセージから始まった。

 インターネットの登場によって誰もが情報にアクセスできる世界が到来してから30年以上がたった今、次の時代の入り口にいるという。そのビジョンを実現するのが「生成AI」だ。

 Microsoftは「この新時代のAIはあらゆる人のためのものです」と表現した。その言葉通り、世界中の企業や個人が生成AIの活用に取り組んでいる。MicrosoftはAIアシスタント「Microsoft Copilot」やAI基盤になるインフラを提供して、AI活用をリードしている。

 Microsoftの戦略と製品展開を見れば、今後の生成AIのトレンドや活用のヒントが見えてくる。Microsoft Build 2024の内容から生成AIの展望とAIインフラの今を解き明かしていこう。「最新の内容をビジネスに落とし込むのはまだ先」と感じる読者でも、何ができるのか知ることで今後に生かせるヒントが得られるはずだ。

Microsoft Build 2024でAIトランスフォーメーションについて語るサティア・ナデラCEO Microsoft Build 2024に登壇したMicrosoftのサティア・ナデラCEO

進化する生成AI ナデラCEOは「ITシステムの黄金期」と表現

 Microsoft Build 2024の基調講演に登壇した同社のサティア・ナデラCEOは、講演の冒頭で「人生の節目にMicrosoft Buildがある」と振り返った。「Win32 API」「.NET Framework」「Microsoft Azure」などを例に挙げながら、生成AIはそれらを上回る規模と範囲のインパクトがあると語った。

 ナデラCEOは、開発者たちがコンピュータに対して2つの夢を抱いていたと話す。一つは、私たちがコンピュータを理解するのではなく、コンピュータが私たちを理解できるようになること。もう一つは、多くのデジタル情報を集めて、その情報を基にコンピュータが効果的に計算や推論をして私たちの手助けをすることだ。

 今、その2つでブレークスルーが起きており、ナデラCEOは「ITシステムの黄金時代かもしれない」と興奮気味に表現する。その変革を後押ししているのが米OpenAIの研究者が発表した「スケーリングの法則」だ。自然言語処理モデルにおいて、パラメーター数とデータセットのサイズ、計算量が増えればAIの性能がべき乗則に従って向上するというもので、生成AIの基盤モデルの巨大化や性能アップにつながった。

「GPT-4o」に見る「マルチモーダルAI」の衝撃

 「ムーアの法則」が情報革命を導いたように、スケーリングの法則はAI革命を力強く推進している。AIの進化が表れているのが「マルチモーダルAI」の登場だ。これまでのAIは画像生成やテキスト生成など特定の用途にのみ対応していた。しかしマルチモーダルAIは、テキストや画像、音声、動画など種類が異なるデータを1つのAIモデルで処理できることがポイントだ。

 OpenAIの生成AIモデル「GPT」を例に見てみよう。2024年5月に発表された「GPT-4o」はチャット形式での対話に加えて、デバイスのマイクやカメラを使った音声や動画での入力、音声での応答などに対応している。

 前モデルである「GPT-4」の登場からわずか1年2カ月しか経過していない。Microsoftによると、GPT-4oの性能はGPT-4と比べて処理速度は6倍、コストは12分の1に抑えられるという。この成長速度がAI革命をさらに推し進める原動力になる。

 ではマルチモーダルAIをどう使えばいいのか。Microsoft Build 2024では、ゲーム「Minecraft」をGPT-4oを搭載したMicrosoft Copilotと一緒にプレイする動画が紹介されて大きな話題を呼んだ。Microsoft Copilotにゲーム画面を見せながら、ユーザーが「剣の作り方を考えているんだ」と口頭で話しかける。するとMicrosoft Copilotが「まずはEボタンを押して」など操作方法を音声で説明したり、「ゾンビだ! 逃げろ!」と反応したりするなど、AIが状況を判断して適切に返答している様子が分かる。

 マルチモーダルAIを活用すれば、チャット入力ができない状況でもAIに指示を出したり、テキストでは説明しにくいことを映像で伝えられたりする。定着した「テキスト入力UI」が一変するかもしれない。

 AIを組み込んだシステムのパフォーマンスが向上する可能性も高い。例えば音声で応答するAIシステムの場合、これまでは「人間の発言を文字起こしするAI」「文字起こしした内容から返答を生成するAI」「生成した返答を音声に変換するAI」という複数のAIモデルにまたがった工程があったため処理速度に遅れが生じてしまう。しかしマルチモーダルAIは1つのAIモデルで全工程を処理できるので処理スピードの向上が期待できる上に、変換の過程で抜け落ちていた情報ももらさず処理できる。

小規模言語モデル(SLM)が登場 エッジで生成AIを実行可能に

 マルチモーダルAIと並んで注目したいのが「SLM」だ。「小規模言語モデル」(Small Language Model)の頭文字を取ったもので、大規模言語モデル(LLM)よりもパラメーター数が小さいコンパクトなモデルを指す。

 マルチモーダルAIをはじめとするLLMはパラメーター数を増やすことで高いパフォーマンスを保っている。そのため学習や推論には大量のGPUなどコンピュータリソースが必要で、データセンターでの処理やクラウド経由での利用が基本だった。

 それに対してSLMはモデルを小型化することで、ローカルPCやスマートフォンでの動作を実現した。クラウドを介さずエッジ環境で生成AIを実行できることで処理速度の向上が期待される他、チューニングの容易さや処理コストが低い点がメリットだ。データをクラウドに送信する必要がないのでセキュリティ面でも強みがある。

 MicrosoftはSLM「Phi-3」を公開している。最小モデルの「Phi-3-mini」は38億パラメーターだ。数百パラメーターを超えるモデルも珍しくない中、Phi-3-miniは小型といえる。Phi-3にはマルチモーダルな「Phi-3-vision」も用意されている。

Microsoftの「Azure AI」で使えるモデル一覧 「Azure AI」で使えるモデル一覧。Phi-3シリーズ以外にもさまざまなモデルを使える(2024年5月時点)

“魔法のようなAI”をビジネス活用する3つのポイント

 GPT-4oのデモンストレーションをナデラCEOは「魔法のようだ!」と表現した。おとぎ話の魔法は、魔法使いと呼ばれる特殊能力を持つ人しか使えない特別なスキルだ。しかしAIは違う。あらゆる人がAIを使って業務に変革をもたらしたり、ビジネスを改革したりできる。まさにAIトランスフォーメーションの世界だ。

 AIトランスフォーメーションを実現するために、Microsoftは3つのポイントを提唱している。その内容は、企業がAI活用を進める指針にもなるものだ。

 1つ目は、AIを使ってビジネス全体の生産性を向上させることだ。何よりもまず、AIを使って従業員の生産性や創造性を高めることが重要だ。そのためには何の目的でAIを使うのかという戦略を立てて、どの業務にAIを導入するのかというユースケースの特定から始めることが肝心だ。他社事例を参考にしても良いし、SIerやベンダーなどのパートナー企業に頼っても良い。

 2つ目は、オープンなAIプラットフォームで自社独自のAIを構築することだ。自社独自のAIを構築することが望ましい。AIをイチから作らなくても、既存モデルに自社データを加えてチューニングすれば対応できる。自社のことを理解したAIは利便性の観点でメリットがあり、オリジナリティーが生まれることで競合優位性を得られる。そのためには適切なデータとAIインフラを用意する必要がある。

 3つ目は信頼できるイノベーションでビジネスを保護することだ。生成AIに入力するデータが漏えいすることはないか、AIの学習に使われないかといったガバナンス面を考慮する必要がある。Microsoftは「責任あるAI」を掲げて信頼できるパートナーとしてビジネス変革をサポートできるように取り組んでいると公表している。

AIトランスフォーメーションをどう起こせばいいのか

 ナデラCEOはMicrosoft Build 2024の基調講演で「一部の人だけが恩恵を得るイノベーションではなく、全ての人の役に立ちたいという思いが開発を続ける原点」だと語った。生成AIはそのビジョンを実現するだろう。

 生成AIを使い始めれば、明日の業務や来期のビジネスから変わるかもしれない。Microsoftが提唱した活用ポイントにもあるように、まずは使ってみる。そしてAIの真価を引き出せるデータやインフラを準備することが重要だ。

 もう一つ大切な視点が、AIトランスフォーメーションを自力で起こそうと思わなくてもいいということだ。最新情報を追い、データ基盤を整えてインフラを用意するのは簡単ではない。Microsoftはもちろん、同社が認定するパートナーに頼ることもAI活用を成功させるカギになる。Microsoftはパートナー向けの技術支援や勉強会を開催しており、安心して任せられるはずだ。

 生成AIでビジネスを変えたいと考えたら、Microsoftとそのパートナーに相談してみるのがいいかもしれない。豊富な実績に裏打ちされた知見と技術力で支援してくれるはずだ。

Copyright © ITmedia, Inc. All Rights Reserved.


提供:日本マイクロソフト株式会社
アイティメディア営業企画/制作:ITmedia AI+編集部/掲載内容有効期限:2024年7月19日

関連リンク