4社らはLLMを事業でも取り扱っている。サイバーエージェントとrinnaは独自開発したLLMをオープンソースで公開中で、サイバーエージェントは自社の広告事業にも活用している。また、メルカリやSansanは各サービスに生成AIを組み込んだ新機能を展開している。
メルカリの大嶋さんは、生成AIを自社サービス内に取り入れた感想として「自由な入力形式を受け付けて、柔軟な出力を返せるのは、生成AIならではの魅力だ」と話す。ただし、問い合わせや返答が柔軟にできるがゆえに、生成AIならではの実装上の難しさもあるという。
1つには、自由なユーザー入力をどう制御するかが挙げられる。ユーザーの中には、生成AIを“言いくるめて”、与えられた指示を聞き出そうとするユーザーも存在する。「プロンプトインジェクション」と呼ばれるこうした攻撃の対策は、試行錯誤の段階にあるとしている。
メルカリの場合、生成AIをプロダクトに実装する場合には、完全に自由な入力を行わせず、ある程度制限した内容を入力させる形式を取ることで対策している。メルカリアプリ内で実装した、ユーザー向け機能「メルカリAIアシスト」では、ユーザーには選択式でAIへの応答操作を提供している。
また、出力の柔軟さについても課題がある。チューニングを行ったLLMであっても、AIが根拠のない回答をしてしまう現象「ハルシネーション」の問題は避けがたい。他にも、情報源となるマニュアルを参考にして応答するような生成AIが、情報源に無い項目について問われた際、一般的な応答を返してしまうといった癖もある。
Sansanの猿田さんは「生成AIは多種多様な出力が可能なので、アウトプットの品質をどの程度確保するかという点での合意形成が難しい」と、この課題を表現。対策として、例えば同社が提供している「セミナー集客メールメーカー」では、出力する文章の形式を固定することで、ミスが生じにくく、修正しやすいようにしている。
生成AIの性能評価も、各社共通の課題だ。応答を評価する手法も提案されているが「実際のビジネス上で反映されやすい技術指標のスコアと、実際に使ってみたときの応答性がどうかというのはまた話が別」(石上さん)という。
評価についてメルカリでは「ユーザーからの反応を見たり、GPT-4のような上位モデルに評価させるテクニックを使うなど試行錯誤している」(大嶋さん)と説明。
rinnaの沢田さんは、同社が手掛けている“キャラクター風の生成AI”を実用的に評価する手法として「キャラクターの創作者に試してもらう」を提案。創作者の監修が入ることで、キャラクターのコンセプトに沿った応答ができているか確認できるだけでなく、ファンの納得感を得やすいという利点があるとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR