エンタープライズ品質のAI IT部門に課される課題【特集】エンタープライズ品質のAI活用

生成AIブームをきっかけに改めて企業におけるAIの利用が注目を集める。全社規模で多様なAIモデルを扱い、成果を挙げるにはデータサイエンティストだけでなくIT部門の強いリーダーシップが必要になると目されているが、課題も多い。

» 2023年08月16日 11時00分 公開
[荒 民雄ITmedia]

この記事は会員限定です。会員登録すると全てご覧いただけます。

 AI(人工知能)というコトバは時代や文脈によって指し示す技術が異なるため、その定義は非常にあいまいだ。現代においては、将来予測や特徴量抽出、時系列分析などの機械学習モデルに加えて、ニューラルネットワークを利用した深層学習による画像認識の飛躍的な精度向上をきっかけに登場したStable Diffusionなどの画像生成AI、そして大規模言語モデル(LLM)に基づく言語生成AIを、まとめて「AI」と語ることが多い。

 いままで企業においてデータサイエンティストが扱ってきた領域は前者だろう。将来予測や特徴量抽出などの機械学習はすでに市場分析やマーケティングリサーチ、技術開発、商品開発などの分野で広く取り入れられており、ユースケースも豊富にある。企業が保有する情報を生かし、新しいインサイトを得る目的で自社データ基盤の整備に取り組む企業も増えてきた。一方で生成AI、特にLLMを使った言語生成AIへの対応は、バックオフィス業務の自動化をさらに強化し、顧客サービスの改善などにも大いに役立つとして期待する声が大きいものの、具体的に取り組めていない企業も多い。

広がるLLM開発競争と企業利用の課題

 GPT-3.5の登場と2022年11月30日 の「ChatGPT」の公開をきっかけに、いわゆるビッグテックの多くがLLMへの投資を拡大させた。

 例えばGoogleは「PaLM」、Amazonは「Amazon Titan」、Metaは「Llama 2」を相次いで発表している。日本でもLINEが「japanese-large-lm」を、サイバーエージェントも独自の言語生成AIモデルを公開している。NECも独自のLLMサービスとして「NEC Generative AI Service」の提供を始めた。東京大学発のスタートアップ企業Lightblueも2023年7月に67億パラメータのLLMをApach 2.0ライセンスで公開した。他の国に目を向けると、例えば中国は政府の支援を受けた北京智源人工知能研究院(BAAI)が「悟道2.0」という1兆7500億パラメータのLLMモデルを発表している。他にも独自LLM開発を進める企業は多数存在しており、ここに挙げたものはLLM開発競争のごく一部に過ぎない。

 NRIによる2023年6月の調査によれば、日本におけるChatGPTの利用率は人口比で見ると世界的に見ても突出しており、期待の高さがうかがえる。

 国内でもすでにプロンプトエンジニアリング専門のコンサルティング事業を立ち上げている企業も複数存在する。生成AIを含むAIの企業利用に関する具体的な指針についてはアクセンチュアをはじめとする各社が方法論を示しており、自社実践をもとにしたノウハウの提供も進んでいる。

データ活用からAI学習データ整備、AIモデル運用へ IT部門は何を担うか

 『ITmediaエンタープライズ』が2023年に実施した読者調査によれば、いまや中堅規模クラスの企業においても何らかのデータ基盤整備に着手しており、「データ活用」「データドリブン経営」に向けた手は打ちつつある状況が分かっている。

 一方で生成AIについては今も日々新しい手法やソリューションが登場しており、情報のキャッチアップと自社への取り込み方を日々アップデートしながら検討しなければならない状況が続いている。企業が利用するに当たっては、これ以外にもコンプライアンスやガバナンスに関する国際的な議論、ルールにも目を配らなければならない。業界ごとの生成AIガイドライン整備もようやく進みだしたところであり、多くの企業が取り組むべきと考えていながらもその扱いに苦慮する状況がある。

 またデータサイエンティストとIT部門が協調して推進してきた既存の(広義の)機械学習全般の運用体制に生成AIを含む新たな技術をどう取り込むか、現在整備を進めるデータ基盤と生成AI向けの学習データ整備をどう進めるかも大きな課題となっている。

 こうした状況下でMLの専門家ではない中で対応を迫られる企業情報システム部門やDX推進リーダーらは、次の成長ドライバーとなるはずのAI導入に「絶対に失敗することができない」という強烈なプレッシャーにさらされていると指摘する声もある。

生成AIで再び注目が集まるAI利用 今までと状況はどう変わったのか

 こうした中でもビジネスアプリケーションへの言語生成AIの取り込みはすでに進み始めている。

 OpenAIの発表によればChatGPTはリリース後5日間で100万人が利用、 2カ月間で1億ユーザーが利用した。2023年3月14日にはより精度を高めた「GPT-4」が登場したことで、日本国内でも破壊的イノベーションにつながる技術として注目が集まっている。

 日本におけるAI研究の第一人者であり、日本ディープラーニング協会理事の松尾 豊氏も2023年3月に開催されたオンラインセミナーで「ChatGPTという現象は、『技術の蓄積』と『ソーシャルな相互作用による急激な普及』という2つの側面を持っています。特に新しい使われ方についてはAIの研究者や技術者でも思い付かないようなものもあり、大変驚いています」と語っているように、爆発的な普及によって、社会とツールの在り方が大きく変わる可能性を示唆していた。

 ChatGPTの開発元であるOpen AIに大きな投資をし、独占的な利用権を得たMicrosoftはすでに自社が提供するOSやアプリケーション、クラウドサービスに生成AI機能やAIアシスタント機能を取り込み始めている。日本国内でも「Azure OpenAI」や「Microsoft 365 Copilot」を全社的に利用し、これらを使ったユースケース開発を急ぐ企業が出始めている。

基盤モデル、マルチモーダルなAI

 OpenAIの躍進以前、AIの研究開発においては長らくGoogleがリードしてきた。そのGoogleは独自LLMの開発だけでなく、生成AIを含む多様なAIモデルの開発、運用環境に加えて、「BigQuery」や「Dataflow」といったデータ基盤サービスとの連携を強みとする「Vertex AI」ブランドでフルマネージドのAIプラットフォームを提供している。LLMへの注目度は高いが、企業実務において求められる画像認識物体検出、予測分析などでの利用は実績も増えている。Amazon Web Services(AWS)も、多様なAIモデルを使って独自に拡張可能な生成AI向けの開発、運用基盤として「Bedrock」を発表している

 LLMを含むAIモデルの開発競争が激しい状況が続くが、今後はコモディティ化が進むと目されており、適材適所で汎用のAIモデルを活用する「基盤モデル」が注目されている。例えばIBMが発表した「IBM watsonx」は基盤モデルを軸に傘下のRed Hat OpenShiftの運用環境と組み合わせて業界特化型のAIの提供を目論んでいる。企業がAI利用による効果を最大化するには汎用モデルと自社独自のモデルの組み合わせをどう生かすか、事前学習済みモデルに対する事後学習でどう精度を高めるかも重要になる。

 日本語に特化したAIやその研究開発を強みとするスタートアップ企業ELYZAは汎用モデルをベースに独自のLLM開発を支援するプログラムの提供を発表した。業務自動化の領域においてLLMを使ったAIチャットをインタフェースとしたマルチモーダルAIとノーコード開発と組み合わせて提供する「AIエージェント「Heylix」を発表したAI insideのCEO 渡久地 択氏は、「いまや企業がAI適用を想定する業務の大半は汎用のAIモデルの組み合わせで対応できる。独自のモデル生成が必要なものであっても、モデル生成を半自動化できる。企業の課題はAIモデル構築のためのデータ整備に焦点が当たっている」と指摘する。

 ここまでで見てきた情報は、企業におけるAI利用を取り巻く話題のごく一部にすぎない。AIモデルの利用ノウハウ、ユースケース創出やそのためのデータ整備、コンプライアンスやガバナンス、組織内のナレッジ獲得の方法など、おそらく今後IT部門が主軸となって判断を迫られるであろう課題は多岐にわたる。

 本特集ではLLMの登場で改めて注目が集まるAIの企業利用とその課題、IT部門が担う役割や価値創出につながる取り組み方、企業における実践例などを発信していく。

Copyright © ITmedia, Inc. All Rights Reserved.

注目のテーマ