自治体DX最前線

DeepSeekの破壊的な推論能力 自治体にとって“転換点”だと言えるワケ

» 2025年02月12日 07時00分 公開
[川口弘行ITmedia]

ITmedia デジタル戦略EXPO 2025冬

photo

ビジネスパーソンが“今”知りたいデジタル戦略の最前線を探求します。デジタル経営戦略やAI活用、業務効率化など、多岐にわたるビジネス課題を解決。

【注目の基調講演】生成AIを社員約1.8万人が利用、平均3.3時間を削減――パーソルHDの“AI推進大作戦”、その舞台裏

著者プロフィール:川口弘行(かわぐち・ひろゆき)

photo

川口弘行合同会社代表社員。芝浦工業大学大学院博士(後期)課程修了。博士(工学)。2009年高知県CIO補佐官に着任して以来、省庁、地方自治体のデジタル化に関わる。

2016年、佐賀県情報企画監として在任中に開発したファイル無害化システム「サニタイザー」が全国の自治体に採用され、任期満了後に事業化、約700団体で使用されている。

2023年、公共機関の調達事務を生成型AIで支援するサービス「プロキュアテック」を開始。公共機関の調達事務をデジタル、アナログの両輪でサポートしている。

現在は、全国のいくつかの自治体のCIO補佐官、アドバイザーとして活動中。総務省地域情報化アドバイザー。公式Webサイト:川口弘行合同会社、公式X:@kawaguchi_com


 こんにちは。全国の自治体のデジタル化を支援している川口弘行です。

 今回のテーマはローカルLLM(大規模言語モデル)です。

 3カ月ほど前になりますが、このコラムで、遠い未来の話のような書きぶりで、こんなことを書いていました。

 現在の生成AIはインターネット上のサービスであるため、ネットワークがつながっていない状態では使うことができません。

 そのため、自律して動作するロボットやセキュリティ上の理由によりネットワークに接続できないシステムで生成AIを使うためには、内部にAIモデルを組み込まなければなりません。

 性能や応答速度を維持したまま、小型のコンピュータで動作できるAIが普及すれば、さまざまな分野での活用が期待できます。

 ところが、これが現実のものになりました。

 2024年12月26日、中国のAI企業DeepSeekは、自社開発の大規模言語モデル「DeepSeek-V3」、そして2025年1月20日にはV3から派生した「DeepSeek-R1」を発表しました。

 このDeepSeekですが、中国企業が開発していることから、学習データの取り扱いや、出力結果の中立性、そして安全保障上の懸念が指摘されています。ただ、それはDeepSeek社が運営しているインターネット上のサービスの話であり、今回のテーマとは関係ありません。

 私が注目しているのは、ローカルLLMとしてのDeepSeekです。というのは、この言語モデルそのものがMITライセンス(商用を含めて利用制限なし。ただし著作権表示が必要。無保証)として公開されており、誰でもダウンロードして動かすことができるのです。

 さらに、サイバーエージェントがこのDeepSeek-R1に日本語を追加学習させたモデルを公開したことにより、日本語の自然言語処理においても高い性能が期待できるようになりました。

 ここまで条件がそろえば、実際に試してみるしかありません。

ローカルLLMとしてのDeepSeekの登場は、自治体にとって転換点となる可能性がある(ゲッティイメージズ)

DeepSeekの恐るべき推理能力

 早速、自分が普段使っているPC(MacBook Air、M2チップ、メモリ24GB)で動作させてみました。

 具体的な方法は省略しますが、PCの中で、ローカル環境でLLMを使えるAIツール「ollama」を使い、サイバーエージェントのDeepSeek-R1-Distill-Qwen-14B-Japaneseを動作させています。もう少し容量の大きな32B-Japaneseも試してみたのですが、私のPCでは動作はするものの、十分な応答速度が出せませんでした。

DeepSeek-R1に「思考」させる

 まず、生成AIに思考させるネタとして「100までの素数」を出させてみることにしました。

プロンプト

100までの素数を表示して

 結果は次のとおりです。単に結果を出すだけでなく、OpenAI社の「o1」と同じように、思考のプロセスも表示してくれます。

100までの素数 思考過程
100までの素数 結果

推理小説の犯人を推測させる 結果は……?

 次に、自治体の現場でありがちな「あらかじめ大量のデータを与えた上で『思考』させる」という場面を想定して、次のような検証をしてみました。

 「DeepSeek-R1に『まだらのひも』を読ませて、犯人を推測させる」

 『まだらのひも』はアーサー・コナン・ドイルの推理小説の短編です。シャーロック・ホームズのシリーズですね。日本語翻訳版が電子書籍サービス「青空文庫」に掲載されていますので、これをダウンロードして使います。

プロンプト

(ここに『まだらのひも』の全文をコピー)

上記の文章を読み、犯人を推測してください。

 結果は次のとおりです。まず思考の過程が記されています。

『まだらのひも』に対する思考の過程

 犯人を正しく推測できたのかは、実際に小説を読んでみてください。

『まだらのひも』の犯人についての結論

DeepSeekが自治体に及ぼす影響とは?

 DeepSeekは私の予想を超える結果を見せてくれました。推論の能力もさることながら、コンテキスト長が128Kあるため、理論上は約6万5000文字をプロンプトに含めることができます。ある程度意味のある長文(『まだらのひも』は約2万文字)をそのまま取り込むことができるという点が私にとっては大きなインパクトでした。

 自治体は日常業務で文書ファイルの読み書きを行っています。その延長で生成AIを活用するためには、外部文書ファイルの読み書き機能が重要です。一般的に外部のデータを読み込んで生成AIを利用する手法としてRAG(Retrieval-Augmented Generation、検索拡張生成)が用いられますが、必要な情報を適切に読み取れないなど、RAGの精度には、まだまだ課題があります。

 一方、RAGを使わずに長文をそのままプロンプトとして使用する方法(「ロングコンテキスト」と呼ばれます)は、生成AIに処理させる情報をすべて含めることができるため、RAGの精度を気にする必要がないという点で非常に有利です。

 しかもこれがインターネットから隔絶されたパソコンの中で動いていることを考えると、その技術の進歩に驚かされます。

 自治体で生成AI利活用を進める際に、必ず出てくるテーマが「秘匿性の高いデータを庁外に出してしまうことへの懸念」だったことを考えると、ローカルLLMの実現は自治体にとっての一つの転換点となるのかもしれません

 今後、自治体の業務においても、DeepSeekのようなローカルLLMの活用が進むことで、新たなサービスの提供が期待されます。本連載では引き続き、DeepSeekを自治体の中でどのように活用できるかについても紹介したいと思います。

Copyright © ITmedia, Inc. All Rights Reserved.

アイティメディアからのお知らせ

SaaS最新情報 by ITセレクトPR
あなたにおすすめの記事PR