ビッグデータとオープンデータの違いとは?
目次
巨大なデータ群を指すビッグデータと、二次利用が可能で公開されているオープンデータ。それぞれの違いを明確に説明できる方は少ないのではないでしょうか?
民間企業が扱うデータがビッグデータで、行政が扱うデータがオープンデータというイメージを持たれがちですが、厳密には異なります。基本的に、オープンデータはビッグデータの一種になります。主に国や市区町村が収集・公開しているデータなので、高い信頼性と豊富なサンプル数が特徴です。
本記事では、ビッグデータとオープンデータの違いについて解説します。身近にあるオープンデータの具体例も掲載していますので、ビジネスに生かしたいと考えている方は、ぜひ参考にしてみてください。
ビッグデータとオープンデータの違いとは
インターネットやスマートフォンの普及に合わせて、データ量は増大しました。コンピューターの性能も向上したことで、より多くのデータを高速で処理することが可能になっています。そこで、注目を集めるようになったのが、ビッグデータとオープンデータです。
ビッグデータはデータ量や種類に焦点が当たっているのに対し、オープンデータは国民が誰でも利用できるように公開されているという点に焦点が当たっています。それぞれの言葉の定義を理解した上で、違いについて詳しく見ていきましょう。
ビッグデータとは
ビッグデータとは、膨大な容量と種類を持ち、生成速度・頻度が高いデータ群を指します。ビッグデータは、インターネットが普及し、IT技術が進展したからこそ生まれました。
生活の身近なところでは、スマートフォンに記録された位置情報や行動履歴、インターネットを介した購買情報といった膨大なデータも、ビッグデータに該当します。
また、個人が所有するスマートフォンの普及により、収集されるデータの量は飛躍的に増加しました。オンライン会議やスマートフォンで自宅の家電が操作できるなど、インターネットを介して情報をやり取りする場面もさらに増えており、日々収集されるデータも刻々と変化しています。この先も、コンピュータやクラウドサーバーの処理能力の向上、人工知能などの技術革新により、ビッグデータのデータ量は急激に拡大していくと考えられています。
オープンデータとは
オープンデータとは、国や地方公共団体、事業者が保有する公共情報について、誰でも使えるように表されているデータものです。 国民誰もがインターネット等を通じて容易に利用できるように、オープンデータには以下のようなルールが定められています。
- データの二次利用が可能であること
- 機械判読に適したデータ形式であること
- データを無償で利用できること官民データ法第11条によって、国や地方公共団体は可能な限り多くの公共データをオープンデータとして公開することが望ましいとされています。一方で、以下に示すようなデータは公開することが適切ではありません。
- 人情報を含むもの
- 国や公共の安全、秩序の維持に支障を及ぼすおそれがあるもの
- 法人や個人の権利利益を害するおそれがあるもの等
オープンデータは、2012年に政府が発表した「電子行政オープンデータ戦略」によって、国と地方で取り組みが始まりました。現時点ではオープンデータのほとんどが、公共機関が公開しているものですが、民間企業が公開している地下鉄の遅延情報や電力需給データなどもオープンデータに含まれます。
ビッグデータとオープンデータの関係性
図1:ビッグデータとオープンデータの関係性
図で示したように、国や地方自治体、民間企業が所有するビッグデータが公開されていなければオープンデータではありません。同様に、誰でも二次利用できるように公開されていたとしても、そのデータ量が少なければ、ビッグデータとは呼ばれないです。
ただし、ビッグデータの定義として厳密なデータ量やデータの種類が決められているわけではないので、ビッグデータかどうかの判断は人によって様々でしょう。
総務省はビッグデータとオープンデータの考え方の一例として、ビッグデータを以下の4つに分類し、オープンデータをその一部に位置づけています。
- 政府(国や地方公共団体)が提供する「オープンデータ」
- 企業がノウハウをデジタル化・構造化したデータ
- 企業のM2Mから吐き出されるストリーミングデータ
- 個人の属性に係る「パーソナルデータ」
身近な医療オープンデータの例 7選
二次利用することを目的として作られたオープンデータは、企業や個人で活用するのに最適です。現在のオープンデータは、公共機関が公開しているものが多く、国民全体から収集した膨大なデータ量を持ち合わせているため、ビッグデータとも言えるでしょう。
ここでは、国民の健康情報が集計された、膨大なデータ量を誇る医療分野のオープンデータを紹介します。全て、厚生労働省のホームページで無料で入手することが可能です。
患者調査
医療機関を受診した患者データが集計されたオープンデータです。在宅医療や傷病分類別の推計患者数や性・年齢階級別、都道府県別の受療率などを把握できます。
病床機能報告
医療機関が担っている医療機能に関するオープンデータです。病床機能報告制度に基づいて医療機関から厚生労働省に報告された、病棟の設備や人員配置などが把握できます。
NDBオープンデータ
電子化されたレセプト情報や特定健診・特定保健指導情報が集計されたオープンデータです。数多くある医療オープンデータの中でも、最も規模と網羅性に長けています。
DPCデータ
DPC制度参加病院の中で、DPC方式で算定した患者情報が集計されたオープンデータです。入院患者の入院時から退院時の状態や使用された薬剤、点数などが把握できます。
医療施設調査
医療機関の分布や整備の実態が集計されたオープンデータです。病院・診療所・歯科診療所の病院数や病床数、処方の状況などが把握できます。
無医地区等調査
全国にある無医地区等の実態や医療確保状況の実態が集計されたオープンデータです。)都道府県別地区数や無医地区人口の年次推移が把握できます。
病院報告
全国の病院と療養病床を有する診療所の患者の利用状況が集計されたオープンデータです。1日の平均在院・新入院・退院患者数や病床利用率、平均在院日数などが把握できます。
まとめ
ビッグデータは、膨大な容量と種類を持ち、生成速度・頻度が高いデータのことです。一方のオープンデータは、公共情報が二次利用できるように公開されたデータを指します。
オープンデータは主に国や地方公共団体が提供しているため、国民から収集された膨大なデータすなわちビッグデータである場合がほとんどです。これからデータの活用を検討している方は、ぜひオープンデータを入手してみてください。
<医療系オープンデータ>
弊社では、医療系オープンデータとして
・医療機関マスタ(医科、歯科、薬局)
・DPCデータ
・病床機能報告データ
をご用意しております。【医療機関マスタ】
厚労省のオープンデータ「コード内容別医療機関一覧表」をもとに作成した医療機関マスタをご提供しています。ご興味のお持ちの方は、お気軽に下記フォームよりお問合せ下さい。
>>無料版の詳細はこちら!
無料版は医療機関(病院・クリニック等)、医薬・医療機器のメーカー・販売会社の方限定です。>>有料版の詳細はこちら
有料版は、二次医療圏や経営体情報、緯度経度など詳細情報を付与したデータです。カスタマイズも可能です。【DPCデータ提供サービス】
>>詳しくはこちら【病床機能報告データ提供サービス】
>>詳しくはこちら<無料オンラインセミナー開催中!>
弊社ではSalesforceやBIツール、MA、オープンデータなどの活用方法に関する無料オンラインセミナーを実施しています!
>>セミナー一覧はこちら