話題の中華LLM「DeepSeek R1」は、天安門事件を説明できるか あれこれ質問した(2/2 ページ)
ローカルなら回答が得られる場合も ただし……
一方、モデルをローカルで動かした際には、一連の質問に対する回答が得られるケースがあった。ただしモデルのサイズが大きくなると、回答が拒否される場合もあった。
R1そのものはサイズが大きすぎて筆者の環境では動かせないため、R1をベースにした蒸留(既存の大きなモデルを基に、近い性能を持ったより小さいモデルを開発する手法)モデルのうち、「DeepSeek-R1-Distill-Qwen-32B」を4bit量子化(精度を下げて軽量化)したモデルと、2bit量子化(さらに精度を下げて軽量化)したモデル、「DeepSeek-R1-Distill-Llama-8B」を利用。各モデルをローカルでLLMを動かすためのツール「LM Studio」で試したところ、いずれも途中で遮られることなく答えが得られた。
最もサイズが小さいDeepSeek-R1-Distill-Llama-8Bの場合、天安門事件や尖閣諸島を巡る問題、中国の歴史、習近平国家主席に関する質問でも回答が得られた。ただし日本語だと、回答に別の言語が混じったり、文章が破綻したりすることがあり、回答の精度がやや不安定だった。
DeepSeek-R1-Distill-Qwen-32Bの2bit量子化モデルだと、回答の精度が向上。天安門事件について「中国政府は軍隊を派遣し、鎮圧を行った」、習近平国家主席について「国際的には政治的圧力や人権問題での批判も受ける」とする回答が得られた。
しかし4bit量子化モデルにした途端「この質問に答えられない」との回答に。英語でも同様だった。どうやら、モデル自体にもある程度の“偏り”がある様子だ。小さいモデルだとコントロールが効かないものの、大きなモデルになると検知や表現能力の向上に伴って偏りが表出するのかもしれない。もちろん、今回試したものには蒸留モデルや、それをさらに量子化したものが含まれるので、オリジナルではそれぞれ回答が異なる可能性もあるが。
DeepSeek-R1シリーズは商用利用が可能だが、モデル自体に何らかの“思想統制”が働いているのであれば、ビジネスなどでの活用がはばかられる可能性はある。用途にもよるが「このサービスは、特定の政治的思想の影響を受けているんじゃない?」と突っ込まれる余地は生まれるだろう。
DeepSeek-R1に限った話ではないものの、利用に当たっては、ベースに使うLLMが誰によって作られたかなど、地政学リスクに関する判断が適宜必要になりそうだ。
生成AIの最新テクノロジーや活用トレンドを解説
生成AIでどのように業務を変革していくべきなのか──企業の生成AI活用について、ITmediaのIT&ビジネス系メディアが総力でお届けする「ITmedia AI Boost」を開催します。企業のリアルな事例や専門家の詳しい解説などを配信します。
- イベント「ITmedia AI Boost」
- 開催期間:2025年2月18日(火)~2月19日(水)
- 無料でご視聴いただけます
- こちらから無料登録してご視聴ください
- 主催:ITmedia AI+、 ITmedia ビジネスオンライン、 ITmedia エンタープライズ、 @IT
Copyright © ITmedia, Inc. All Rights Reserved.
この記事の著者
関連記事
こんなメディアも見られています
ITmedia AI+に関連する情報をお探しであれば、こちらのメディアもお役に立てるかもしれません。
SpecialPR
よく見られているカテゴリー
アクセスランキング
-
1
「ポンコツ」と呼ばれたM365 Copilotの逆転劇、GPT-5が転換点 活用の秘訣は“脱・プロンプト職人”
-
2
人間 vs. 人型ロボ、より多く作業をこなせるのは? 生配信で対決した結果…… 米企業
-
3
キオクシア社長「記録的な増収増益」 3カ月の売上収益1兆円、純利益は2990%増 好決算の背景は
-
4
「AIデータセンターの電力需要が急増」はホント? 発電大手Jパワー社長が明かした“報道との温度差”
-
5
伊藤忠商事や三菱ケミカルなど16社が参画 大手企業の「暗黙知」を活用する新プロジェクト
-
6
生成AIで3Dモデルを自動作成 専門スキル不要でテキストや画像から3D化
-
7
NEC社長が説く AI時代と新たな安全保障環境の到来で「ITサービスはこう変わる」
-
8
OpenAI、「ChatGPT」に個人向け資産管理機能 金融口座と連携
-
9
「最新のAI創薬ラボ」なのに会議室みたい!? 製薬大手がラブコール送る“異色のAI企業”による新拠点とは
-
10
Python 3.15に追加されるlazy importと内包表記でのアンパッキングについて調べてみた
SpecialPR
ITmedia AI+ SNS
インフォメーション
注目情報をチェック
ITmedia AI+をフォロー
あなたにおすすめの記事PR