Google、差分プライバシー適用の「VaultGemma」 個人情報の記憶・漏洩リスクを低減
米Googleは9月12日(現地時間)、「Differential Privacy」(差分プライバシー、DP)を適用したオープンなLLM「VaultGemma」を発表した。差分プライバシーの原則に則ってゼロからトレーニングされた、現在最も高性能なLLMとしている。
VaultGemmaは、10億パラメータを持つオープンモデルで、その設計にはGemmaモデルの中核をなす責任と安全性が組み込まれているという。AIが日常に浸透するにつれて、プライバシーに配慮することが重要になってきており、差分プライバシーはこの課題に対する数学的に堅固な解決策を提供するとしている。差分プライバシーのアプローチは、トレーニングデータに調整されたノイズを加えることで、モデルがトレーニングデータを記憶するのを防ぐというものだ。
従来のLLMとの大きな違いは、この差分プライバシーの全面的な適用にある。一般的なLLMは、Web規模の膨大なデータでトレーニングされるため、意図せず個人情報や機密データを記憶し、漏洩するリスクが指摘されてきた。VaultGemmaは、個々のトレーニングデータがモデルの最終的な振る舞いや出力に与える影響を厳しく制限し、特定の個人の情報がモデルによって「記憶」され、出力から漏洩するリスクを極めて低くするように設計されているという。
その結果、VaultGemma 1Bは、トレーニングデータの記憶を検出できないことが実証されており、個々のトレーニング例の保持を防ぐ差分プライバシーの有効性が強く裏付けられているとしている。また、差分プライバシーによるトレーニングは従来のLLMトレーニングとは異なる特性を持つため、Googleは新たなスケーリング法則を確立し、計算コスト、プライバシー予算、ユーティリティの間の複雑なトレードオフを正確にモデル化することで、VaultGemmaの開発を導いたという。
VaultGemmaはオープンモデルとして公開されており、そのモデルウェイトはHugging FaceとKaggleを通じて利用可能だ。
医療や金融など、トレーニングデータのプライバシーが非常に重要な分野でのアプリケーションや、プライバシーが懸念される状況でのコンテンツ作成やチャットボット、文書要約などにも利用できるとしている。
現状では、差分プライバシーでトレーニングされたモデルとそれ以外のトレーニングモデルとの間には実用性のギャップが存在するものの、このギャップを体系的に縮小し、安全で責任あるプライベートな次世代AIの構築をコミュニティ全体で推進することを目指すとしている。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「Claude Fable 5」をサブスクの標準機能に――AnthropicのエンジニアがXに投稿 7月8日以降の「早期復活目指す」
-
2
農水省の“クソダサ”ポスター話題 「AIよりよっぽど良い」の声も 担当者に狙いを聞いた
-
3
AIに「相手に電気ショックを与えろ」と命じ続けたらボタンを押すのか? 11のLLMで“ミルグラム実験” 抵抗できたのは……
-
4
3万円で「Yahoo!ニュース」にPR掲載 プレスリリースをAIで「ニュース風記事」に
-
5
NTT、独自のAIモデル「tsuzumi 2」発表 “国産AI開発競争”に「負けられない」と島田社長
-
6
人型ロボットが工場で稼働する様子を6日間生配信、作業成功率99.99%をうたう 中国メーカー
-
7
AIで“ゲームキャラの出産二次創作”を何千回と生成する人も……ChatGPTの会話57万件から見えたヘビーな利用実態
-
8
「Claude Fable 5」の性能が落ちた? 提供停止前後で比べた結果 米AI企業2社がそれぞれ報告
-
9
ソフトウェアエンジニアの仕事は「ループを書くこと」になる 内側ループと外側ループ(ハーネス)入門
-
10
ひろゆき氏「SIer衰退予測」、AI代替の「逆転現象」の理由 2026年に生き残るエンジニア“4つの役割”
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR