ビジネスパーソンが“今”知りたいデジタル戦略の最前線を探求します。デジタル経営戦略やAI活用、業務効率化など、多岐にわたるビジネス課題を解決。
【注目の基調講演】生成AIを社員約1.8万人が利用、平均3.3時間を削減――パーソルHDの“AI推進大作戦”、その舞台裏
川口弘行合同会社代表社員。芝浦工業大学大学院博士(後期)課程修了。博士(工学)。2009年高知県CIO補佐官に着任して以来、省庁、地方自治体のデジタル化に関わる。
2016年、佐賀県情報企画監として在任中に開発したファイル無害化システム「サニタイザー」が全国の自治体に採用され、任期満了後に事業化、約700団体で使用されている。
2023年、公共機関の調達事務を生成型AIで支援するサービス「プロキュアテック」を開始。公共機関の調達事務をデジタル、アナログの両輪でサポートしている。
現在は、全国のいくつかの自治体のCIO補佐官、アドバイザーとして活動中。総務省地域情報化アドバイザー。公式Webサイト:川口弘行合同会社、公式X:@kawaguchi_com
こんにちは。全国の自治体のデジタル化を支援している川口弘行です。
今回のテーマはローカルLLM(大規模言語モデル)です。
3カ月ほど前になりますが、このコラムで、遠い未来の話のような書きぶりで、こんなことを書いていました。
現在の生成AIはインターネット上のサービスであるため、ネットワークがつながっていない状態では使うことができません。
そのため、自律して動作するロボットやセキュリティ上の理由によりネットワークに接続できないシステムで生成AIを使うためには、内部にAIモデルを組み込まなければなりません。
性能や応答速度を維持したまま、小型のコンピュータで動作できるAIが普及すれば、さまざまな分野での活用が期待できます。
ところが、これが現実のものになりました。
2024年12月26日、中国のAI企業DeepSeekは、自社開発の大規模言語モデル「DeepSeek-V3」、そして2025年1月20日にはV3から派生した「DeepSeek-R1」を発表しました。
このDeepSeekですが、中国企業が開発していることから、学習データの取り扱いや、出力結果の中立性、そして安全保障上の懸念が指摘されています。ただ、それはDeepSeek社が運営しているインターネット上のサービスの話であり、今回のテーマとは関係ありません。
私が注目しているのは、ローカルLLMとしてのDeepSeekです。というのは、この言語モデルそのものがMITライセンス(商用を含めて利用制限なし。ただし著作権表示が必要。無保証)として公開されており、誰でもダウンロードして動かすことができるのです。
さらに、サイバーエージェントがこのDeepSeek-R1に日本語を追加学習させたモデルを公開したことにより、日本語の自然言語処理においても高い性能が期待できるようになりました。
ここまで条件がそろえば、実際に試してみるしかありません。
早速、自分が普段使っているPC(MacBook Air、M2チップ、メモリ24GB)で動作させてみました。
具体的な方法は省略しますが、PCの中で、ローカル環境でLLMを使えるAIツール「ollama」を使い、サイバーエージェントのDeepSeek-R1-Distill-Qwen-14B-Japaneseを動作させています。もう少し容量の大きな32B-Japaneseも試してみたのですが、私のPCでは動作はするものの、十分な応答速度が出せませんでした。
まず、生成AIに思考させるネタとして「100までの素数」を出させてみることにしました。
【プロンプト】
100までの素数を表示して
結果は次のとおりです。単に結果を出すだけでなく、OpenAI社の「o1」と同じように、思考のプロセスも表示してくれます。
次に、自治体の現場でありがちな「あらかじめ大量のデータを与えた上で『思考』させる」という場面を想定して、次のような検証をしてみました。
「DeepSeek-R1に『まだらのひも』を読ませて、犯人を推測させる」
『まだらのひも』はアーサー・コナン・ドイルの推理小説の短編です。シャーロック・ホームズのシリーズですね。日本語翻訳版が電子書籍サービス「青空文庫」に掲載されていますので、これをダウンロードして使います。
【プロンプト】
(ここに『まだらのひも』の全文をコピー)
上記の文章を読み、犯人を推測してください。
結果は次のとおりです。まず思考の過程が記されています。
犯人を正しく推測できたのかは、実際に小説を読んでみてください。
DeepSeekは私の予想を超える結果を見せてくれました。推論の能力もさることながら、コンテキスト長が128Kあるため、理論上は約6万5000文字をプロンプトに含めることができます。ある程度意味のある長文(『まだらのひも』は約2万文字)をそのまま取り込むことができるという点が私にとっては大きなインパクトでした。
自治体は日常業務で文書ファイルの読み書きを行っています。その延長で生成AIを活用するためには、外部文書ファイルの読み書き機能が重要です。一般的に外部のデータを読み込んで生成AIを利用する手法としてRAG(Retrieval-Augmented Generation、検索拡張生成)が用いられますが、必要な情報を適切に読み取れないなど、RAGの精度には、まだまだ課題があります。
一方、RAGを使わずに長文をそのままプロンプトとして使用する方法(「ロングコンテキスト」と呼ばれます)は、生成AIに処理させる情報をすべて含めることができるため、RAGの精度を気にする必要がないという点で非常に有利です。
しかもこれがインターネットから隔絶されたパソコンの中で動いていることを考えると、その技術の進歩に驚かされます。
自治体で生成AI利活用を進める際に、必ず出てくるテーマが「秘匿性の高いデータを庁外に出してしまうことへの懸念」だったことを考えると、ローカルLLMの実現は自治体にとっての一つの転換点となるのかもしれません。
今後、自治体の業務においても、DeepSeekのようなローカルLLMの活用が進むことで、新たなサービスの提供が期待されます。本連載では引き続き、DeepSeekを自治体の中でどのように活用できるかについても紹介したいと思います。
動画生成AI「Sora」でプロモーション動画を制作してみた 自治体での活用法は?
ChatGPTを使って「文書機密レベル」を判別する方法 自治体の情報セキュリティについて考える
ChatGPTに重要な情報を送っても安全か? 自治体のネットワーク分離モデルから考える
自治体を苦しめてきた「オープンデータ公開」 負担軽減へ生成AIが秘める可能性とは?
自治体の「DX推進計画」が失敗するのはなぜ? 評価指標を生成AIで正しく設定する方法Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR注目記事ランキング