DeepSeekが目覚めた? サイバーエージェントの追加学習モデルに「天安門事件」を聞いたら様子が違った(2/2 ページ)
AI業界の話題をさらう大規模言語モデル「DeepSeek-R1」。「天安門事件」「尖閣諸島問題」といった話題に回答できない点が問題視されていたが……。
示された「オープンであることのリスクと可能性」
だからなんだという話だが、この結果には示唆がある。DeepSeekのようにモデルが公開されてさえいれば、モデル本体が抱える思想的なリミッターを解除あるいは軽減できる実例が示された点だ。DeepSeekの例でいえば、オリジナルに思想統制があっても、公開されたモデルをチューニングすればそれを低減できたわけだ。
検証通り、モデルによる言論には若干のバイアスもあったが「何も答えてもらえない」「途中までしか答えてもらえない」とは大きな違いだろう。なお、サイバーエージェントは「今回のモデル改善は日本語による思考・出力を安定させる目的で行っており、特定の質問に関するチューニングは行っていない」という。
この事実は、AIを巡るさまざまな議論において、論拠の一つになるかもしれない。ビッグテックに対して「中国の企業ですらオープンにしたのだから、表現や思想の自由を守るためにモデルを公開しろ」という圧力を強める論拠にも、逆に企業が「安全や倫理のため、モデルは秘めておこう」とする論拠にもなる。今後中国が、AIモデルの自由な公開を規制する口実にもなり得るだろう。
そもそもAIの回答に傾向があるのは、DeepSeekに限らない。チューニングでモデルの指向性をいじれるのは周知の事実だ。恐らくは今回のような結果も、サイバーエージェントのモデルに限らず得られる可能性があるだろう。
しかし、ただでさえ注目度が高く、しかも地政学リスクが露骨なDeepSeekでこの事実が示されたとなると、その影響度も変わるかもしれない(27日夜に起きた株式市場の騒乱が、その潜在的な可能性を示している)。DeepSeekが投じた一石が、今後どう広がるか、注意深く見ていく必要がありそうだ。
Copyright © ITmedia, Inc. All Rights Reserved.
関連記事
話題の中華LLM「DeepSeek R1」の日本語追加学習モデル サイバーエージェントが無料公開
サイバーエージェントは、大規模言語モデル(LLM)「DeepSeek-R1」を使った新たなAIモデルを公開した。
AI業界に激震、突如公開の中華AI「DeepSeek」“驚きポイント”まとめ
AI開発者やユーザーたちが驚く大規模言語モデル「DeepSeek-R1」。どんなポイントが業界に大きな衝撃を与えているのかか。
「DeepSeek」躍進受け、NVIDIAがコメント 自社チップの需要拡大を示唆 株価は17%急落
米NVIDIAは、中国のAIスタートアップ・DeepSeekの躍進は中国市場でのNVIDIA製チップの有用性を示しており、DeepSeekのサービスへの需要を満たすために将来的にさらに多くのチップが必要になるとの見解を示した。
話題の中華LLM「DeepSeek R1」は、天安門事件を説明できるか あれこれ質問した
AIユーザー・開発者たちの話題をさらった大規模言語モデル(LLM)「DeepSeek-R1」。開発元が中国企業ということもあり、答える内容の偏りなどを懸念する声も多い。筆者も実際に試したが、環境によっては確かに回答が得られない質問が存在した。
トランプ氏、DeepSeekを評価 中国AI企業の台頭で「米企業への警鐘となるべき」
トランプ米大統領は、中国のAIスタートアップ・DeepSeekの技術は米企業にとって警鐘となるべきだと述べ、中国企業がAIで、より高速な手法を考案したのは良いことだという考えを示した。