このような状況から、オープンデータはあまり評価される事業ではありませんでした。自治体にはデータが整備されていない、データを職員が手間をかけて整備しないと公開できる状態にならない、公開したデータがどのように活用されるのかが見えない中で、自治体の資源を投入することはできない――という悪条件がそろっているからです。
しかし、生成AIがこの状況を打開する可能性が見えてきました。
一つは「データ活用のハードルが下がってきた」という点です。
データ活用というと、大量のデータを可視化してグラフにしたり、地図上にマッピングしたり、分析ツールを使って統計処理を行ったりと、素人には手が出しにくい領域に思われがちです。民間では「データサイエンティスト」と呼ばれる専門家が活躍している事例もありますが、自治体職員たちには遠い存在と映ってしまい、さらにその距離が広がっているようにも感じられます。
しかし、生成AIを活用することで、まずデータファイルを読み込ませ、その後チャット形式で質問を重ねながらデータを分析するスタイルに変わりました。
これにより、専門知識がない職員であっても、さまざまなデータの組み合わせから新たな知見を引き出すことが可能になったのです。
私がよく行うデモンストレーションの一つに、地域別・世代別の人口統計データとAED設置場所のデータ(いずれもオープンデータ)をChatGPTに読み込ませて「新たにAEDを設置するべき場所を考えて」と指示を出すものがあります。
私からの指示に対して、ChatGPTはみずからデータ分析の計画を立てました。
AEDを設置すべき場所は、人口密度が高い地域、あるいは高齢者世帯が多い地域であるとして、まず人口統計データからそのような地域を抽出します。そしてそれらの地域とAED設置場所のデータを突き合わせて、AEDが設置されているかを確認し、もし設置されていないのならば、その地域こそ優先的にAEDを設置すべきだろう、という順番で回答を導き出しています(もちろん、その回答が妥当なのかは、改めて検証が必要です)。
つまり、EBPM(エビデンス・ベースト・ポリシー・メイキング:証拠に基づく政策立案)の成功体験を得やすく、自治体職員にとって習慣化しやすい環境が整ったといえます。ここから、あらゆる活動に対してデータを取得するという文化が根付かないと、オープンデータも整備されないのでしょう。
もう一つは「非定型データ活用の場面が広がってきた」という点です。
総務省のオープンデータの定義には「機械判読に適した形式のデータ」という記述があります。従来は、CSV、XML、Excelファイルなど、データ形式が定まっているもの(定型データ)がその対象でした。一方、テキストファイルやWord、PDFなどの文章を中心としたデータは機械判読に適しているといえず、利用しづらい形式とされてきました。
ところが、生成AIでは、これらの文書データをそのまま読み込ませて利用することが可能となりました。アンケートの自由回答から回答者の傾向を分析したり、これまでの議会の発言録を読み込ませたうえで、質問の経過を確認したり、議会答弁の案を生成することもできるようになったのです。
さらには、画像、音声、動画などのデータも生成AIでは扱えるようになり、これまで利用しづらかった形式のデータの多くが「機械判読に適した形式」に近付いたともいえます。その結果、庁内での活用場面が広がることも期待できます。
また、改めてオープンデータとして公開する際に、生成AIを使って定型データに整形する作業(厳密にいえば、この段階で「データ」ではなく「情報」になっているのかもしれませんが)も容易になります。
自治体が保有するデータを公共財として広く活用してもらう取り組みは、将来的に自治体だけでは支えきれなくなる地域社会において、自治体内外でその担い手を増やすことにつながります。生成AIの活用で、その突破口を開くことを期待しています。
次回は「自治体における情報セキュリティの考え方」について考えてみましょう。
ChatGPTに重要な情報を送っても安全か? 自治体のネットワーク分離モデルから考える
自治体の「DX推進計画」が失敗するのはなぜ? 評価指標を生成AIで正しく設定する方法
「弱者の戦略」がDX成功の鍵に 生成AIに「できない理由」を投げてみると……?
プロンプトの悩み不要 自治体で使うべき「ChatGPT Plus」の機能とは?
5分の作業が船移動で半日仕事に……沖縄・竹富町が挑むDX 離島の不利性どう解消?Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR注目記事ランキング