ITmedia NEWS > ネットの話題 >

「中央省庁のデータ表記を統一」河野大臣のツイートが話題 データ活用の促進や職員の負担軽減に

» 2020年11月30日 17時56分 公開
[樋口隆充ITmedia]

 「各省庁がネット上で公開するデータの表記方法を統一する」――。河野太郎行政・規制改革担当相が11月25日に自身の公式Twitterアカウントに投稿したツイートが注目を集めている。これまでは各省庁が内部の独自ルールに基づきデータを作成していたため、データの結合や検索などに支障があったという。データ活用の利便性向上や職員の負担軽減などに向け、国は表記方法の素案を公表し、12月1日まで外部からの意見を募る。

photo 河野大臣のツイート

 河野氏は政府統計ポータルサイト「e-Stat」で公開するデータの表記方法を中央省庁で統一する方針を明らかにした。これに対し、ユーザーからは「素晴らしい」「良施策!」などの声が多く挙がっている。

エラー時は職員がExcelに手入力

 表記統一の対象はExcelで作成したデータ。今後はCSVの表記統一に向けたルール作成にも着手するという。総務省統計局の担当者によると「各省庁でデータの表記方法が異なり、データ結合などの際に支障があった」という。

 例えば、Excel表内に単位など数値以外のものが文字列に入力されている場合、関数計算を行うとエラー表示となる。

photo 数値データ内に文字列が含まれる場合

 Excelで表を作成した際のセル結合も問題だった。セルを結合した場合、並べ替えやグラフ化ができない上、コピー&ペーストできない状態となっていた。スペースキーを入力するという中央省庁の長年の慣習によって、データ検索がしづらい状態にもなっていた。

photo セル結合の事例
photo スペース活用の事例

 こうした中、これまでは他省庁のデータを取り寄せても、データの比較や結合に支障が出ていたという。統計局の担当者は「防災対策の一環として、ある市の人口データと、国土地理院の標高データを組み合わせ、高齢者の標高別の分布図を作成する場合、現状のままではエラーが出てデータを作成できなかった」と話す。これまでエラーが出た場合は、職員が数値をExcelに直接手打ち入力していたという。

独自ルール誕生の背景には“見た目の美しさ”?

 これまで、データ表記が統一されていなかった背景には、統計データの管理方法を巡る国の方針の違いがあったという。統計を管理する統計機構には、統計データを1つの機関に一元的に集中させる「集中型」と、各行政機関に統計の機能を分散させる「分散型」がある。総務省の公式サイトによると、集中型を採用する国はオーストラリアやカナダなど。米国や日本は分散型を採用している。

 集中型は「統計の専門性を発揮しやすい」、分散型は「行政ニーズに的確・迅速に対応できる」などのメリットがある一方、「所管行政に関する知識と経験を統計調査の企画・実施に活用しにくい」(集中型)、「統計の相互比較性が軽視されやすい」(分散型)などのデメリットもある。

photo 統計機構の種類(出典:総務省公式ページ)

 また、統計データの“見た目の美しさ”も独自ルールが発達した背景にある。統計局の担当者は「統計データへのニーズが変化した」と説明。「以前は統計データを紙で印刷し、冊子として保管する慣習があったため、表の中に単位を入れたり、セル結合した方が見た目は美しくなるとされていた」と話す。しかし、PCで同時に大量のデータを処理する機会が増えたことで、従来のルールでは業務に支障を来すことになった。

 こうした背景を踏まえ、総務省では2019年度から中央省庁でのデータ表記の統一に向けて省内で検討を重ねていたという。担当者は「当初は21年4月に発表する予定だったが、河野大臣のサポートを受けたことで、取り組みを前倒しで進めることができた。この取り組みは民間企業へのメリットも多いため、積極的に活用して欲しい」と呼び掛けている。

 総務省などは外部の意見を踏まえ、年内に統一ルールをまとめる。早ければ21年1月以降に公開されるデータに新ルールが反映される。

Copyright © ITmedia, Inc. All Rights Reserved.