ITmedia NEWS > STUDIO >
ITmedia AI+ AI活用のいまが分かる

AI記者、AI小説家、そしてAI作曲家も――創作する人工知能を支える技術よくわかる人工知能の基礎知識(3/5 ページ)

» 2019年10月07日 07時00分 公開
[小林啓倫ITmedia]

文章生成

 まずは文章生成だが、一口に「文章」といってもその内容は多種多様だ。チャットbotで使われるような口語による会話文から、一定のパターンを持つニュース記事、短いが創造的な内容を含むショートショート、それをさらに長くした小説、静止画や動画の内容を要約した説明文まで、それぞれに適した技術が研究・開発されている。

 本連載の第7回でも簡単に触れたが、19年2月、AIを研究する非営利団体のOpenAIは、非常に精巧な文章を生成する言語モデル「GPT-2」を発表した。この技術はフェイクニュースなどに悪用される危険があり、OpenAI自ら情報公開を制限したことでも話題になった。

 OpenAIは米ソーシャルニュースサイトのredditを参照し、そこでユーザーに高く評価されているオンライン上の文章40GB分を収集。それを学習することで、与えられた文章に続く可能性の高い文章を予測して自動生成するGPT-2を完成させた。

 それが生成する文章の「人間らしさ」は非常に高く、米コーネル大学の研究者らの発表によれば、被験者の83%がGPT-2によって自動生成された記事に対して米New York Timesと同程度の信頼性を感じたそうである。

 スポーツの試合結果や企業業績、選挙の結果などの記事をAIで作成する場合は、収集したデータをある程度決められたパターンに落とし込めば十分だろう。米Washington Postや米Bloombergなどの大手メディアも記事作成にAIを活用している。人間の記者は、より重要な事件や事故の取材に時間を割くことができるようになる。

画像・動画生成

 次に画像・動画生成だ。文章生成と同じく、大量の教師データをAIに読み込ませることで、クオリティーの高い画像や動画を生成できるようになってきている。

 先述したOBVIOUSの「Edmond De Belamy」の場合、14世紀から20世紀までに描かれた肖像画1万5000枚のデータを参考にしている。彼らはディープラーニングアルゴリズムの一種である「GAN」(Generative Adversarial Networks)と呼ばれる手法を用いた。

 GANは日本語では敵対的生成ネットワークと訳される。「敵対的」という言葉が使われる理由は、GANのAIには2つの役割が与えられているからだ。一方は与えられたデータに基づいて新たなコンテンツをつくる「ジェネレーター」で、もう一方はそのコンテンツが本物か否かを見破る「ディスクリミネーター」の役割を持つ。

 ジェネレーターはディスクリミネーターからのフィードバックを得ると、それに基づいて何がダメだったのかを分析し、「本物らしい」データを作成。再びディスクリミネーターに評価してもらい、フィードバックを得る――という行為を繰り返すことで、非常に精巧な偽造データが完成する。

 GANは画像系のコンテンツ生成で広く活用される手法となっており、例えば米NVIDIAは19年3月、人間が描いたごく簡単な風景画を、写真のようにリアルな絵に変換する技術「GauGAN」を発表した。

ベタ塗りで書いたような単純な絵を、ディープラーニングを用いてリアルな風景画に変換する技術「GauGAN」

 これは人間がインプットを与えているため、純粋な創作活動とはいえないかもしれないが、GANの持つ可能性を見事に示したデモといえる。一方で、GANは悪用も懸念されている。AIを使ってリアルなフェイク動画をつくる「ディープフェイク」もその一種だ。ディープフェイクの作成にGANを活用する例が、多く見られるようになっている。これは大きな問題だが、逆にそれだけ精巧な画像や動画をAIが生成する時代に突入したわけだ。

Copyright © ITmedia, Inc. All Rights Reserved.