医療オープンデータの分析に役立つツールをご紹介
経済活性化、行政の高度化・効率化、透明性・信頼の向上などの観点から、オープンデータの公開は政府が推進する事業となっています。その中でも、医療分野に関するオープンデータを分析することは、医療政策の策定が可能となり、地域医療の課題解決へと繋がる大事な役割を担っています。
この記事では、以下のような悩みをお持ちの方に向けて、分かりやすく解説していきます。
- 医療オープンデータの分析手法は?
- 医療オープンデータの分析ができるツールは?
- 実際に医療オープンデータを分析する手順が知りたい
医療オープンデータの分析手法
医療オープンデータを分析するにはどのような方法があるのかご紹介していきます。データの種類や目的に応じて最適な方法は異なりますので、利用目的に合わせてお選びください。
記述統計
記述統計とは、集められたデータを数値やグラフなどの形で要約し、そのデータの傾向や特徴を分析する統計手法のことです。 次のような統計量を使ってデータを要約します。中央値:データの中央に位置する値を示す統計量。外れ値の影響を受けにくいという特徴があります。
平均値:データの平均を示す統計量。外れ値の影響を受けやすいという特徴があります。
標準偏差:データのばらつきの度合いを示す統計量。分散の平方根として求められます。
最頻値:データの中で最も頻繁に現れる値を示す統計量。
平均値:データの平均を示す統計量。外れ値の影響を受けやすいという特徴があります。
標準偏差:データのばらつきの度合いを示す統計量。分散の平方根として求められます。
最頻値:データの中で最も頻繁に現れる値を示す統計量。
データ可視化
オープンデータを可視化することで、データの傾向やパターンを把握しやすくなります。代表的な可視化ツールには、グラフ、地図、ダッシュボードなどがあります。時系列分析
オープンデータの時間変化を分析することで、トレンドや周期性を把握できます。代表的な手法には、移動平均、指数平滑法、ARIMAモデルなどがあります。分析ツール
医療オープンデータを分析する方法としてツールを用いる手法があります。分析ツールを使用することには、以下のようなメリットがあります。
- 高速かつ正確な分析が可能 手動で行うよりもはるかに高速かつ正確な分析が可能となります。オープンデータのような大量のデータを処理する場合、分析ツールを使用することで、数時間かかる手動の分析を数分で行うことができます。
- 洞察を得るための柔軟性が向上 データセットの様々な側面を探索し、多角的な観点から洞察を得ることができます。また、さまざまな視覚化ツールを使用することで、データの傾向やパターンを視覚的に理解しやすくなります。
- 標準化された分析が可能 一貫性のある方法でデータを分析できるため、複数の人が同じデータセットを分析する場合、結果が一致するようになります。
- 多様なデータソースを扱える オープンデータは、多様な形式で提供されることがあります。分析ツールを使用することで、さまざまなデータソースを扱うことができます。例えば、テキストデータ、画像データ、音声データ、センサーデータなど、様々な形式のデータを扱うことができます。
- オープンデータの再利用が容易になる オープンデータを分析するためのツールは、通常、オープンソースで提供されています。これにより、他の人が同じデータセットを使用して分析を行う際に、同じツールを使用することができます。また、分析結果を再利用する場合にも、再度同じ分析を行う必要がなくなります。
オススメの医療オープンデータ分析ツール
それでは、医療オープンデータをデータセットとする場合、どのような分析ツールがあるのかご紹介します。Tableau
大量のデータを分析するためのソフトウェアである「 BI(Business Intelligence)ツール 」を用いることでデータの可視化、集計、分析が容易となりました。そんなBIツールの中でも日本で2,000社以上の企業が使用しているのが、「Tableau」です。特徴を次に挙げます。
プログラミング | 不要(ドラッグ&ドロップ操作) |
ファイル形式 | xlsx,csv,MySQL, Googleスプレッドシート, etc |
可視化のパターン | ツリーマップ,パレート図,ダッシュボードetc |
データ分析をする上で真っ先に思い浮かぶのはExcelでしょう。ExcelとTableauはそもそもコンセプトに違いがあります。Excelは「表計算」に重きを置いているのに対して、Tableauでは「ビジュアル化」に特化しています。
- ビジュアル化のステップを短縮している 形式の異なるデータを関連付けて画面上にビジュアル化することが可能です。
- 直感的な操作が可能 プログラミングをすることなく、ドラッグ&ドロップをはじめとするマウス操作を行えます。
- 多種多様なデータ形式に対応 複数のデータソースを組み合わせて一元的にビジュアル化することが可能です。
- 米特許取得「連想技術」搭載 収集された膨大なデータは、独自の技術である連想技術によりデータの隠サイトを探し、見落としがちな視点での分析結果を提示してくれます。
- ダッシュボードを利用したデータ管理 関連する複数のデータを連想技術によって分析した結果を並べて表示することができます。分析した結果を張り付けたり、Excelに出力することも可能です。
- 事前準備が不要 Qlik Senseはクラウド環境のみでなく、オンプレ環境でも機能します。そのため、ネットワーク環境がなくても使用することができ、事前構築不要ですぐに使用することができます。
- オープンデータの分析に向いている分析手法として記述統計、データ可視化、時系列分析、分析ツールがある。
- Tableauはマウスを用いた直感的な操作が可能で、医療オープンデータに見られる様々なファイル形式に対応しているため、データ間の連携が可能です。
- Tableauは14日間のトライアル期間があるため、お試しが可能
- データ接続を行うと高速でデータを取り込み、列や行を選択し、画面上に可視化データが描画される
Tableauのメリットを解説します。
Qlik Sense
BIツールの一種である「Qlik Sense」は、「データ分析領域でのリーディングカンパニー」として有名なアメリカに本社を構える「Qlik社」が開発する製品です。Qlik Senseのメリットは次の通りです。
分析ツールを使った分析手順
実際にBIツールである「Tableau」を使って医療オープンデータの分析を行ってみたいと思います。
データの収集
まず、分析するためのデータを収集します。オープンデータは、政府や非営利団体、企業などから入手できます。今回は、厚生労働省が提供している「第7回NDBオープンデータ」から、初再診料_性年齢別算定回数 を使用します。 NDBオープンデータはこちらから取得できます。https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000177221_00011.html
データの整理
「Tableau」が収集可能なデータに加工します。Excelファイルで開いたら1,2行目の概要部分を削除します。Tableauの起動
Tableauは以下のサイトで登録すると使用できます。14日間の無料トライアルが付いています。https://www.tableau.com/ja-jp
データの選択・分析
新しいワークブックを開き、「データに接続」画面から加工したExcelファイルを選択します。分析結果の表示
列に診療行為、メジャーネームをドロップダウン、ドラッグし、行にはメジャーバリューを持ってきます。するとこのような棒グラフが出来上がりました。初診料は20代が最も算定回数が少なく、10歳〜14歳が最も多い結果となりました。20~24歳以降は算定回数が徐々に増えていっているのが視覚的に見て取れます。
棒グラフ以外にも線グラフ、円グラフ、折れ線グラフなど様々な可視化が可能となっています。
医療オープンデータの分析ツールに関するまとめ
この記事では、医療オープンデータの分析に向いている分析手法をご紹介し、その中でも大量の分析に向いている分析ツールを取り上げ、実際の分析方法を解説してきました。
最後に、この記事で解説した内容をまとめます。
これから医療オープンデータを使った分析に取り組みたいとお考えの担当者の方は、ぜひこの記事でご紹介したTableauやQlik Senseを取り入れてみてください。
<医療系オープンデータ>
全国の医療機関(医科・歯科・薬局)マスタを無料または有料で提供いたします。
ぜひお気軽にお問い合わせください。
>>医療機関マスタの詳細こちら!
>>医療機関マスタ提供に関するQ&Aはこちら