画像や動画に比べて、文章に電子透かしを入れるのは難しいといわれている。画像や動画の場合、ロゴマークなどによる可視性の透かしや、目に見えない鍵を入れて特殊な分析技術にかけると透かしを見つけられる非可視性のものなどが利用されている。これらは“画像内の1ピクセルを変えても、その内容が変わらない”という画像の特性(=冗長性が高い)が要因にある。
一方、文章の場合はそうではない。文字を一つ変えるだけでも、意味が変わってしまうことが多い(=冗長性が低い)ため、文章そのものに透かしを入れるのは難しいといわれてきた。このような背景から、日立では特定の単語を含む割合によって透かしを入れる技術に注目したという。
今回の技術による透かしにも課題はある。鍵を持っている人物のみが透かしを作成・検出できるが、もしこの鍵が漏えいしてしまうと不特定多数の人物が透かしを再現できるようになってしまう。しかし、多重電子透かし場合は、1つ目の透かしの鍵が漏えいしてしまっても、2つ目以降の透かしから生成元の判別ができる。
また、文章量が短い文章では十分な数のグループ分けができず、検出精度が下がる。現状では、300単語程度の文章ならば二重透かしを入れられるという。他にも、透かしの対象になる単語が増えてしまうことで、文章として成立しないものを生成するなど質の問題や、特定のグループの文章を意図的に増やすことで透かしを無効にすることが技術的に可能である点なども、現状の課題として挙げている。
永塚企画員は「この技術の原理的には、言語による精度の違いはほとんどなく、英語でも日本語などの言語の他、自然言語ではない言葉にも適用できる」と説明。楽譜などの音符にもこの技術を適用することで、AI生成かどうかを判断することも可能という。
「この技術を使うことで、ニュースやSNSの投稿がAI製のものなのかの判断が可能になる。他にも、教育現場であれば学生のレポートがAI製なのか分かるなど、AIの不正利用防止に役立てられる」(永塚企画員)
29日時点では、この技術はまだ製品化はしておらず、今後も研究を進めて事業化などを検討する方針。生成AIによるフェイクニュースの氾濫する事態を受け、世界各国で法整備が進む中であるため、日立としても「(この技術を)国際組織に働きかけないと効力を発揮できない」という認識だ。世界全体の社会的要請に合わせて、技術開発を進めたいという。
AIが書いたテキストに“電子透かし”を入れる技術 人に見えない形式で埋め込み 米国チームが開発
生成AIが“AI生成コンテンツ”を学習し続けるとどうなる?→「モデル崩壊」が起こる 英国チームが発表
LLMから“有害”を引き出すアーケードゲーム「ハックマン」 AIに卑劣な言葉を吐かせたら勝ち
ファミマの「透かし入り画像」投稿で物議 ストックフォトのプレビュー利用、Adobeとファミマに聞いた
どうなる「白くまくん」 日立が家庭用エアコンの製造から撤退でCopyright © ITmedia, Inc. All Rights Reserved.