ChatGPTの登場で、にわかに活気づいたAIの世界。ChatGPTには間違いもありますが、AIを古くから知る人にとって、それは「不思議」でも「残念」でもないそうで……？　ゲーム系AIの第一人者でグラフィッククリエイターの森川幸人さんによる「初心者でも分かる生成系AI入門」、後編では生成系AIの現状や課題についてゆるく教えてもらいました。

【前編】初心者でも分かる生成系AI入門：ChatGPTが開いた「AIブーム3.5」の扉

AI研究者にとってChatGPTの「間違い」は想定内

　ChatGPTの登場以来、たくさんの人が遊んだ結果をSNSなどに投稿しています。それを読んでいると驚き以外にも「なるほどなー」と気づかされる点があります。多くのユーザーが「マジ、すげー」とビックリしていると同時に「正しくないことを返してくる」と残念がっています。

　昔から対話型AIに取り組んでいる身としては、ChatGPTに対しては「マジすげー。勝負は終わった。以上！」というのが素直な感想で「正しいことを言わないことがある」ことに対しては、さほど残念に感じないというより、「Transformerという技術を使っているのだからしょうがないよね。むしろ、それでもここまでできるのか！」という気持ちがあります。

　「Transformer」は2017年にGoogleとトロント大学で開発された自然言語を処理する仕組みで、最初は翻訳を活躍の場と想定していたようですが、いざフタを開けたところとんでもないポテンシャルのある機能であることが分かり、今ではテキスト生成AI（以後、TGA）には欠かせない学習モデルとなっています。

　Transformerの機能や構造についての分かりやすい説明は、インターネット上にいっぱいありますので、興味のある方は探してみてください。基本構造の理解は超簡単ですが、「細かいところまでの理解は地獄」という覚悟が必要です（笑）。

　とはいえ、Transformerをざっくりと説明すると、今まで人間が作ってきた文章を利用して、「言葉A」と関連してよく出てくるのは「言葉B」である、といった結びつきや、文節の関連付けを学習して応用するという仕組みです。

　例えば、「柿食えば」という言葉は「岩にしみ入る」につながるより、「鐘が鳴るなり」につながる文章の方が断然多い。「梨も食う」につながる例はない、といった言葉と言葉の関連付け（の重み）を学習していきます。そしてその学習を利用して、ユーザーが「柿」というキーワードを使えば、即座に“「柿食えば」→「鐘が鳴るなり法隆寺」→「といいますが……”といった具合に文章を作っていきます。

　つまりは基本的に統計的な判断をしているわけです。だから、人間のように真に言葉を理解していない。それで、正しくない回答をしてしまうわけです。次につなげる単語なり文節は出現頻度に応じて確率的に選ばれるので、確率のいたずらで間違った選択をすることがあるのです。

　そういった背景があるため、AI研究者たちは、ChatGPTがたまに間違ったことを言うと「Transformerを使ってるとそういうこともあるよねー」と、つい同情的になってしまうのですが、そうした事情を知らない人は、ちょっと失望するかもしれません。

　ほとんどの場合は素晴らしく正確な内容を返してくれるので、ちょっとの間違いがかえって目立ってしまうのでしょう。

不気味の谷の住人

　「不気味の谷」という言葉があります。芸術やロボット工学、心理学などの世界で使われますが、人工物が、ある一定のところまでであれば好感度が高くても、その線を超えて人間らしさを獲得すると、急激に「キモい、怖い、残念」と負の気持ちを持たれてしまう現象です。

　TGAもChatGPTの登場により、いきなりその域に達してしまったのかもしれません。

　一昔前のTGAなら、人の発話や会話と比べられるようなレベルにまったく達していませんでした。そのため、人間から「AI君もがんばっているよね」と余裕を持って好意的に、安心して接してもらえていた。しかし、いざ人間っぽくしゃべれるようになると今度は「TGAは怖い、危ない、間違えたことを言うので残念」と、TGAが不気味の谷の住人と見なされてしまうのも不思議ではありません。

　もう1つ問題点があります。

　学習する人の文章や会話データは、インターネット上から採取されます。ここでも既存のDB（データベース）が活躍します。GPT-xではCommon Crawl（インターネット上の文書や画像などを周期的に収集／アーカイブし、無償でデータベースを提供する非営利団体）が公開しているDBを利用しています。

　これは誰でも自由にアクセスできるDBですが、TB（テラバイト）サイズの大きさがあり、GPT-3はそのうち45TB程度のテキストデータで学習しているといわれています。

　このように、GPT-xはインターネット上に転がっている文章をAIの学習に使っていますが、それゆえ起こる問題もいくつかあります。

　1つは情報の鮮度です。GPT-3は2021年までに採取した文章を元に学習しています。そのため、2022年以降に発信されたネタについては学習できていません。例えばロシアがウクライナに軍事侵攻したことを知らないのです。

学習の偏りとバイアス

初心者でも分かる生成系AI入門：ChatGPTが開いた「AIブーム3.5」の扉（前編）
何かと話題の生成系AIの歴史は、実はとても古いもので、現在は「第3次ブーム」。画像系／テキスト系の生成AIの歴史や、それぞれの基本的な仕組みをざっくりと解説します。
プロイラストレーターが最近のAI「どうすんだこれ感」について思ったこと
IT業界に限らず、AI関連の話題がホットだ。プロイラストレーターのrefeiaさんに、昨今の事情を踏まえて思いの丈をまとめてもらった。
「ChatGPT」とは一味違ってさらに便利！　Googleとの違いは？　Microsoft Bingの「AI検索」を試して分かったこと
Microsoftが2月7日（米国太平洋時間）、自社の検索エンジンとWebブラウザにOpenAIの「次世代大規模言語モデル」を実装することを発表した。ChatGPTとは何が違うのか、実際に使って検証してみよう。【更新】
一部組織では利用禁止も！　OpenAIの「ChatGPT」のスゴさとMicrosoftの戦略
Microsoftが、OpenAIに対して日本円で約1.3兆円の追加投資を行うことが話題となっている。そのことで再び脚光を浴びているのが、OpenAIのチャットボットサービス「ChatGPT」である。スゴさと課題を検証しつつ、OpenAIに追加投資を行うMicrosoftの狙いについて簡単に解説する。
「ChatGPT」で話題　MicrosoftとOpenAIの関係と目指すものを整理
Microsoftが、OpenAIへ3回目の投資が行われた。両者のつながりと、今後のMicrosoft製品への導入に関する話をまとめてみた。
「Microsoft Security Copilot」によるAIセキュリティ対策　“人力”任せからの脱却につながるか
Microsoftが最近推し進めているアプリへの「AIコパイロット」機能の搭載。そのポートフォリオに「セキュリティ」が加わる。同社は、セキュリティ対策にどのようにAIコパイロットを適用しようとしているのだろうか。

　　　　　　 1|2 次のページへ

SpecialPR

アクセストップ10

2024年04月27日更新

8K／30fpsで撮影できる「Insta360 X4」は想像以上のデキ　気になる発熱と録画可能時間を検証してみたら（2024年04月26日）
Microsoftが「MS-DOS 4.0」をオープンソース化　IBMの協力で（2024年04月26日）
AI PC時代の製品選び　展示会「第33回 Japan IT Week 春」で目にしたもの　AI活用やDX化を推進したい企業は要注目！（2024年04月25日）
Micronが232層QLC NAND採用の「Micron 2500 SSD」のサンプル出荷を開始　コスパと性能の両立を重視（2024年04月26日）
ワコムが有機ELペンタブレットをついに投入！　「Wacom Movink 13」は約420gの軽量モデルだ（2024年04月24日）
プロセスノードに加えて新技術も売り込む！　Intelが半導体の「受託生産」で使う“武器”【後編】（2024年04月26日）
わずか237gとスマホ並みに軽いモバイルディスプレイ！　ユニークの10.5型「UQ-PM10FHDNT-GL」を試す（2024年04月25日）
エレコム、10GbEポートを備えたWi-Fi 7対応無線LANルーター（2024年04月25日）
あなたのPCのWindows 10／11の「ライセンス」はどうなっている？　調べる方法をチェック！（2023年10月20日）
QualcommがPC向けSoC「Snapdragon X Plus」を発表　CPUコアを削減しつつも圧倒的なAI処理性能は維持　搭載PCは2024年中盤に登場予定（2024年04月25日）

ランキングトップ30

最新トピックスPR

過去記事カレンダー

2024年

2023年

2022年

2021年

2020年

2019年

2018年

2017年

2016年

2015年

2014年

2013年

2012年

2011年

2010年

2009年

2008年

2007年

2006年

2005年

2004年

2003年

Feed Back

利用規約

ITmediaはアイティメディア株式会社の登録商標です。

初心者でも分かる生成系AI入門：ChatGPTが開いた「AIブーム3.5」の扉（後編）（1/2 ページ）

この記事について

i4Uとは

筆者紹介：森川 幸人