オープンデータの推奨データセットとは?ルールやフォーマットなども解説
目次
オープンデータの推奨データセットとは
オープンデータとは
オープンデータとは、公共機関や省庁、民間企業が持っているデータを無料で公開しているもののことです。
さらに、オープンデータには二次利用ができ、機械判読できる形式で公開されているという特徴があります。
したがって、誰でも人口データや公共施設、購買活動などのオープンデータを利用して地域の問題解決や個人のビジネスに活用することができます。
平成24年7月に「電子行政オープンデータ戦略」が策定されてから、オープンデータの活用は日本政府を挙げて推進されています。
特に地方公共団体に対し、2020年度までにオープンデータ取り組み率100%を目指して研修を実施するなど支援してきました。
令和5年1月30日時点で約74%の自治体がオープンデータに取り組んでいます。
推奨データセットとは
推奨データセットとは、各自治体に対して、政府として公開を推奨するデータと、そのデータの作成にあたって準拠すべきルールやフォーマット等を取りまとめたものです。
データ活用政策として重点をおく分野やニーズの高い分野から推奨されるデータセットが選ばれています。
実際に、2018年度に国が実施した地方公共団体アンケートでは、防災分野、基礎的な統計情報(人口等)、公共施設の位置やサービスに関する情報、観光に関する情報、子育てに関する情報、健康づくり・医療福祉に関する情報の順にニーズが高いという結果でした。
選ばれたデータセットは下記のとおりですが、この結果を反映したものになっています。
基本編と応用編から構成されています。
基本編:推奨データセットの中で、特にオープンデータに取り組み始める地方公共団体の参考となるようなデータを基本編として位置づけています。
応用編:推奨データセットの中で基本編以外のものを応用編としています。地方公共団体に限らず、民間企業が持つデータも対象です。
基本編 | 説明 |
1.AED設置箇所一覧 | – |
2.介護サービス事業所一覧 | – |
3.医療機関一覧 | 病院・診療所についての一覧 |
4.文化財一覧 | 国や自治体が指定した文化財についての一覧 |
5.観光施設一覧 | – |
6.イベント一覧 | 地方公共団体で開催されるイベントの一覧 |
7.公共無線LANアクセスポイント一覧 | – |
8.公衆トイレ一覧 | – |
9.消防水利施設一覧 | – |
10.指定緊急避難場所一覧 | – |
11.地域・年齢別人口 | 住民基本台帳の地域・年齢別人口の情報 |
12.公共施設一覧 | – |
13.子育て施設一覧 | 幼稚園、保育園、認定こども園、放課後児童クラブ、児童館の一覧 |
14.オープンデータ一覧 | オープンデータ化されているデータの一覧 |
応用編 | 説明 |
A-1.食品等営業許可届出一覧 | – |
A-2.学校給食献立情報 | – |
A-3.小中学校通学区域情報 | 小中学校通学区域(学区)の一覧 |
B-1.ボーリング柱状図等 | 地質、地盤に関する情報 |
B-2.都市計画基礎調査情報 | 建物や土地の利用方法についての情報 |
B-3.調達情報 | – |
B-4.バス情報フォーマット | 停留所、路線、時刻表などの静的情報と遅延、車両位置などの動的情報 |
B-5.支援制度情報 | 行政機関が提供する補助金や助成金の情報 |
参照元:推奨データセット|デジタル庁
データセットはあくまで推奨したものであり、必ずしも最初から推奨データセット通りに全てのデータを公開しなければならないわけではありません。
推奨データセットを参考にして、公開できるデータから取り組み始めることをすすめています。
推奨データセットの目的
推奨データセットの目的は、オープンデータの公開とその利活用を促進することです。
オープンデータを公開したいがどのデータを公開すればいいかわからない、という場合に参考になるため、手を付けやすくなるというメリットがあります。
また、各自治体がデータを公開する際、フォーマットを揃えやすくなり、データ分析の際に異なる自治体からのデータを横断的に使用できるようになります。
今まで、オープンデータを利用する際、データの形式がそろっていない事や必要なデータを探すのに時間がかかることが課題とされてきました。
推奨データセットを利用すればこの課題が解決できると期待されます。
推奨データセットのルールとフォーマット
推奨データセットでは、数字のフォーマットや日付など、基本的な共通ルールを決めています。
また、デジタル庁の前身である内閣官房情報通信技術総合戦略室は、推奨データセットの基本編と一部の応用編のデータセットについて、データ項目の定義(項目の内容やデータ形式、必須項目であるか否かなど)を定めています。
これらをファイルにまとめたものが、「データ項目定義書」として公開されています。
応用編の一部のデータセットに関しては「データ項目定義書」に含まれませんが、データ作成にあたって準拠すべきルールやフォーマットなどが文書で設定されています。
ただ、推奨データセットをオープンデータとして公開する際、フォーマットで示されている全項目が必須なわけではありません。
公開時にデータが存在していない場合には、その項目を空白で公開して、後ほど追加するという形で公開を進めてもよいとされています。
推奨データセットの課題
推奨データセットにはいくつかの課題がありました。
2021年に実施されたアンケート調査によれば、
データの提供側からは
- 推奨データセットの加工に手間がかかる。
- 推奨データセット(オープンデータ化すべき対象)の拡充
- 推奨データセットには推進の指示が無いため積極的には取り組みづらい
データを利活用している事業者等の課題意識としては、2022年度に実施中の調査によれば次のようなものがありました。
- データ自体やデータフォーマットの品質に関する問題(「データが古い」「フォーマットがばらばらだった」「データが正確でない」「データが加工しにくい」「情報の粒度が統一されていない」等)
- データの数、更新頻度、データ形式の利用しにくさの問題があり、オープンデータを利用継続しにくい
- 民間のものと互換性がない
これらを受けて、データの質と量を改善し、データ形式を変更して推奨データセットを大幅に見直すこととなりました。
自治体標準データセットとは
自治体標準データセット策定の経緯
推奨データセットの課題がでてきただけでなく、GIF(政府相互運用性フレームワーク)の一部としてデータセットを運用する方針となり、推奨データセットは大幅に形式を変更することとなりました。
見直しにあたり、改善点など意見をデジタル庁のアイデアボックスで広く募集して検討を重ね、2022 年 10 月 11 日に名称を改め自治体標準データセット(試験公開版)として公開されました。
自治体標準データセットの推奨データセットとの違い
自治体標準データセットとして推奨データセットが生まれ変わるにあたり、相違点や改善点があります。
その中からポイントとなるものを紹介します。
データセットの名称から「推奨」を削除
「推奨」という名称が任意のイメージを与えてしまい推進力を低下させるため、推奨を削除しました。
「自治体向け」という内容を端的に説明した名称に変更されました。
自治体のタイプごとに推奨するデータセットを設定
基礎と応用の分類を撤廃し、自治体のタイプごとに推奨するデータセットが設定されています。
オープンデータを提供する自治体や団体を、6種類(初めて取り組む基礎自治体・基礎自治体・一部事務組合等・都道府県・国・民間)に区分しています。
自治体ごとに、属する区分により、どのデータセットに取り組んだらよいかがより分かりやすくなっています。
データセットと6種類の区分は下記の通りです。
引用元:既存データセットの主な変更点 (Major Changes to Existing Data Set)|デジタル庁
政府相互運用性フレームワーク(GIF)との整合性
データセットは今後GIFの一部に位置づけられる予定です。
そのための項目が整備されています。
メタデータ
データ自体の情報、ラベルのようなものをメタデータ(カタログデータ)と呼んでいます。
データを探す人が目的のデータを見つけやすくするため、データにメタデータを付与することとなりました。
検索性を高めるだけでなく、正しく機械処理するために必要な、最終更新日や言語などデータの質の向上に役立てる狙いもあります。
支援制度(給付金)情報
給付金などの支援制度をデータ化し、利用者が何に属するかにあわせて検索できるようになります。
利用者の情報と紐づけておき、プッシュ型での案内も出来るようになる予定です。
また、各地方公共団体間での支援制度の比較も簡単にできるようになります。
支援制度の拡充や他の自治体を参考にした支援制度の構築などに活用できると考えられています。
データセットの追加
ニーズや利活用の向上しやすさを勘案して、9個のデータセットが追加になりました。
引用元:新しく追加されたデータセットについて (About newly added data set)|デジタル庁
災害対策だけでなく、駐車駐輪やごみの分別、子育てにかかわる項目が追加されています。
オープンデータ 推奨データセットの利活用例
オープンデータの推奨データセットを活用した例が多数あります。
その中から医療分野で活躍しているものを解説します。
医療施設や医療用設備の情報を提供するアプリ
AEDやオストメイト、病院自体の場所を地図上に表示して情報提供するアプリで、推奨データセットが活用されています。
日本全国のAEDの設置場所や設置施設の利用可能時間を確認できるアプリは、迅速な応急処置や安全なイベント主催に貢献しています。
また、オストメイト対応のトイレの設置場所を検索できるアプリは、リアルタイムのバリアフリーマップと連動しており、外出時の安心につながっています。
コロナ対応の病院を地図上で検索できるアプリや、訪日外国人向けの緊急時情報として上記のような情報を提供するアプリも有用です。
倒れている人を発見した時にSOS送信するアプリ
医療用設備の位置情報を提供するだけでなく、救命率をあげることに焦点を当てたアプリもあります。
救急現場で医療有資格者を集める手段がなく救命率が下がってしまうことから、周囲の医療有資格者やAED設置施設に救急時に自動連絡するアプリです。
病院検索サイトへのリンクや救急車を呼ぶべきかわからない時のコール機能も備えています。
AED設置場所の緯度経度、設置施設の電話番号など、オープンデータを活用し、包括的な情報をまとめたシステムです。
オープンデータ推奨データセットを理解して活用しよう
オープンデータ推奨データセットは、自治体標準データセットとなってさらに利用しやすくなります。
推奨されているデータセットの種類や形式を理解すると、地域の情報を連携させて活用することができます。
ぜひ、オープンデータ推奨データセットの活用法を学び、ビジネスに活かしてみませんか?
<医療系オープンデータ>
全国の医療機関(医科・歯科・薬局)マスタを無料または有料で提供いたします。ぜひお気軽にお問い合わせください。
>>詳しくはこちらをクリック!