ビジネス向け生成AI開発最前線、日本IBMが仕掛けるアプローチ

「ChatGPT」の登場で急速に進む生成AIブーム。企業が自社のビジネスに特化した生成AIを開発するためにはどうすればいいのか。AI開発の歴史を振り返りつつ最適なアプローチを日本IBMが推奨した。

» 2023年05月26日 10時12分 公開
[田渕聖人ITmedia]

この記事は会員限定です。会員登録すると全てご覧いただけます。

 日本アイ・ビー・エムは(以下、日本IBM)は2023年5月24日、同社のAI(人工知能)についての方針と製品戦略に関する説明会を開催した。同説明会では、日本IBMがAIをどのようにビジネスに生かす方針なのか、またそれを実現するAIおよびデータプラットフォーム「IBM watsonx」(以下、watsonx)について詳細な解説があった。

 「ChatGPT」の流行に伴い、生成AIのビジネス利用が大きなムーブメントとなっている今、多くの企業がAI構築および活用方法を模索している。watsonxはこれをどのように支援するのか。

激化するAI競争 企業は「+AI」から「AI+」へ

日本IBMの村田将輝氏

 はじめに、日本IBMの村田将輝氏(常務執行役員 テクノロジー事業本部長)がAIについての方針を発表した。

 「AIのビジネス利用が拡大する今、当社は『+AI』ではなく『AI+』、つまりAIの利用を前提とした『AIファースト』で変革を進めていく」(村田氏)

 空前のAIブームが訪れた今日、日本市場ではAI開発のスケールアップやスピードアップ、これを担うAI人材の獲得や維持に向けた競争が激化している。日本IBMはこうした現状において、パートナーがAIユーザーになるだけではなく、AIバリュークリエイター、つまりAIを活用して自社の価値を創造する企業になるのを支援する方針だ。

AI構築に訪れた変化 時代は「基盤モデル」に

 しかし、AI価値創造企業になるとは具体的に何を指すのか。そのためにはAI学習に訪れている変化について知る必要がある。日本IBMによると、従来のAI学習は案件ごとにデータを準備して学習するというのが主流だった。だが急速に変化する時代、これからは学習済みの「基盤モデル」を用意し、これを活用してAI構築を効率化することが求められている。

AI学習にも変化が訪れている(出典:日本IBM提供資料)

 これについては、日本IBMの田中 孝氏(テクノロジー事業本部 Data and AIエバンジェリスト)から詳細な説明があった。同氏によると、AI構築の歴史を振り返ると2017年頃から「基盤モデルの時代」が訪れているという。

日本IBMの田中 孝氏

 「今も重要ではありますが、1980年代から2010年まではML(機械学習)のアプローチが非常にもてはやされました。その後、ビッグデータ時代の訪れとともに、ディープラーニング技術が開発され、より大量のデータに対して機械学習をかけられるようになりました。そして2017年以降、基盤モデルというアプローチが出てきました」(田中氏)

AIは基盤モデルの時代に(出典:日本IBM提供資料)

 基盤モデルは従来のアプローチとどう異なるのか。田中氏によると、従来は利用したい用途ごとに学習データを用意してAIモデルを作成していた。しかし、当然これらはそれぞれの用途に特化したAIモデルになるため、他の用途には転用できない。そのため「大量の学習データを収集し、そのデータでAIモデルを作る」というコストをかけられる、つまり“成果が見込まれる”領域でのみ、機械学習やディープランニングが利用されるといった課題があった。

 対して基盤モデルは、大量の文書データを使った自己教師あり学習のアプローチを取る。この汎用的な用途で作られた基盤モデルに少量の学習データを追加することでチューニングをかけ、特定の用途に特化したAIモデルを作成できる。つまり、基盤モデルに対して自社のサービスに合わせた学習データを使うことで、企業は少ないコストで自社向けに特化したAIモデルが開発できるようになった。これが基盤モデルのブレークスルーであり、AI価値創造企業が目指すところだ。

従来と異なる基盤モデルによるAI開発(出典:日本IBM提供資料)

 「ただし、基盤モデルによるAI開発においても、作成したAIモデルが正確かどうか、バイアスが掛かっていないかどうか、AIモデルを作るために集めたデータの出どころの透明性や説明性などは引き続き考慮する必要があります」(田中氏)

watsonxで基盤モデルによるAI開発アプローチはどう変わる?

 そしてこの基盤モデルによる企業固有のAI開発アプローチを支援するのがwatsonxプラットフォームである。watsonxは、「IBM watsonx.ai」(以下、watsonx.ai)と「IBM watsonx.data」(以下、watsonx.data)、「IBM watsonx.governance」(以下、watsonx.governance)の3つのコンポーネントで構成されている。

watsonx.aiで基盤モデルを生かした生成AIを構築

 watsonx.aiは2023年7月に提供を予定する、AI構築のための企業向けスタジオ(ツール/機能群)だ。従来のラベル付けされた大量の学習データを集めてAIモデルを構築する機械学習と基盤モデルを活用した生成AI機能の両方を学習、検証、調整、導入できる。

watsonx.aiは従来の機械学習と基盤モデルを使ったAIモデル作成のどちらにも対応可能だ(出典:日本IBM提供資料)

 田中氏は「コード生成向け基盤モデル『fm.code』や大規模言語モデル(LLM)『fm.NLP』、地理空間データ基盤モデル『fm.geospatial』といったIBMが提供する独自の基盤モデルに加え、米国のAI企業Hugging Faceが公開しているオープンソースの基盤モデルを取り込む機能を1つのプラットフォームの中で提供できるのが特徴です」と話す。

 特に生成AIの領域では、IBMが提供するこれらの基盤モデルをベースとしつつ複数のチューニングアプローチが使用できる。生成AIに対して前提をせずに質問する「Zero-Shotプロンプティング」や、手動作成した例示によって特定のタスクに関する実行方法を学習させる「Few-shotプロンプティング」、一定量の学習データを加えることでより強力にチューニングする「データ駆動チューニング」などを利用することで、基盤モデルの能力を十分に活用しながら、企業固有の要件に合わせたAIモデルを作成できる。

 「先ほど複数の基盤モデルについて触れましたが、IBMは単一の基盤モデルだけで企業におけるAI活用を全てカバーできるとは思っていません。やはり目的に応じて適切なモデルを使用し、自社のデータを使ってカスタマイズし、その結果を持って業務の中でのAI活用を最大化する。それを支援するのがwatsonx.aiです」(田中氏)

watsonx.dataで散在するデータを一元管理

 watsonx.dataは2023年7月提供開始予定で、watsonx.aiの追加学習用のデータを供給する基盤であり、オープン・レイクハウス・アーキテクチャによって構築されたデータストアだ。オープン・レイクハウス・アーキテクチャを採用することで、安価なオブジェクトストレージの中に企業におけるさまざまな業務データや競争力の厳選となるデータを蓄積し、複数のクエリエンジンでこれにアクセスできる環境を作る。

 田中氏は「企業にとって重要な資産であるデータをオンプレミスとマルチクラウドなどで個別に管理するのではなく、watsonx.dataの中で一元的に管理することで、多様なデータに素早くアクセスし、データアーキテクチャを最適化します」と語る。

watsonx.dataはオンプレミスとマルチクラウドでワークロードを管理する(出典:日本IBM提供資料)

watsonx.governanceで企業におけるAIリスクを把握

 watsonx.governanceは、2023年後半提供開始予定のデータおよびAIガバナンス管理を実現するツールキットだ。

 機械学習アプローチや基盤モデルベースで開発したAIモデルをそのまま使うだけでなく「AIモデルがどういったデータによって作られたのか」「誰がデプロイしたのか」「本番で使われているのか」「データに対するメタデータの管理」といったガバナンスを効かせつつ、AIライフサイクル全体を統制する。

 現場や本番で使われているAIモデルの挙動をモニタリングすることで、精度や公平性、バイアスを検知し、企業におけるAIリスクを把握、低減することも可能だ。昨今多くの企業で生成AIに対する規制が発表されているが、企業として取り組むべきポリシーを定義し、そのポリシーに対して実際のAI活用が準拠しているかどうかを照らし合わせるための仕組みもwatsonx.governanceで提供する。

 これら3つのコンポーネントを組み合わせると以下の図になる。「固有のデータを加えて自社の業務の用途に合わせたAIモデルを作成する中で、データを供給するデータソースの役割をwatsonx.dataが担い、そのデータをチューニングをし、構築をし、デプロイする役目をwatsonx.aiが担当します。そして、本番環境に展開されたAIモデルをモニタリングし、リスクを低減させながらAIの価値を最大化させるのがwatsonx.governanceです」(田中氏)。

watsonx.aiとwatsonx.data、watsonx.governanceを組み合わせる(出典:日本IBM提供資料)

今後はコード生成ソフトウェアも提供予定

 watsonxプラットフォームの機能は既存のIBMのソフトウェアにも組み込まれる予定だ。田中氏はこの例として「Watson Code Assistant」についても触れた。

 Watson Code Assistantは2023年後半提供開始予定で、自然言語での命令に基づきコードを生成するソフトウェアだ。最初は「Ansible」の構成管理コードの自動生成からサポートする。その他、企業固有のデータをWatson Code Assistantの基盤モデルに適用することでコード提案の精度が向上し、その結果、特定のニーズに合わせたプライベートなカスタムAIモデルが完成する。

 「日本IBMのAI戦略は一貫して『ビジネスのためのAI』です。AIをビジネスの現場で活用するには信頼性を確保しつつ、ビジネスの文脈を理解したAIモデルの挙動が大事です。watsonxプラットフォームはただのサービスではなく、各企業のビジネスプロセスの中に組み込んだAI活用の実現を支援していきます」(田中氏)

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ