Tableauの外部データ活用!外部データを使って新たな視点で分析をしてみませんか?
目次
Tableauは分析の専門的な知識を持たない人でも簡単に取り扱うことができるBIツールです。
直感的な操作で膨大な量のデータを可視化分析することができます。Tableauではデータを分析する前にデータソースと呼ばれるデータを準備しておくことが必要です。
Tableauに取り込むことが可能なデータはエクセル、PDF等PC上にあるデータだけではなく、以下の画像のように多くのサーバー上のデータも取り込むことが可能です。これらの異なるデータソースを関連付けることができるため、可視化・分析の幅を今まで以上に広げることができます。
今回はTableauで取り込むことができる外部データとその方法についてご紹介したいと思います。
Tableauに取り込むことができる7つの外部データ例
①クラウドサーバー上のデータ
近年のクラウドサーバーやSaasの台頭により、多くの企業がデータをクラウド環境に持つようになりました。Tableauではそれらのデータを使った分析を簡単に行うことが出来ます。今回は一例として、Google Driveのデータを取り込む例をご紹介します。
Tableau DesktopからGoogleスプレッドシートに接続します。[データ検索]から[サーバーへ]の中から[Google Drive]を選択します。この後Googleのアカウントへのログイン画面が出てきますので、ログインを実行します。
以下のダイアログが立ち上がるので、利用するGoogleアカウントを選択します。
次に出てくるダイアログで、そのまま”次へ”を選択します。
最後に出てくるダイアログです。ここで”許可”を選択します。
以下の画面が出れば、TableauからGoogle Driveへの接続が完了してます。
無事にログインが出来ると以下のように自分のアカウントのドライブ上のGoogleスプレッドシートを選択することができるようになります。
②エクセルファイル
Tableauに取り込むデータとしてもっとも一般的なものはエクセルデータだと思います。普段データの収集や分析にエクセルを使用されている企業は多いと思いますが、Tableauは普段使用しているエクセルファイルも簡単に取り込み分析に使うことができます。Excelをデータソースとして非常に簡単ですので、Tableauと該当のデータとの接続環境の構築に時間がかかるような場合、先にデータをExcelにエクスオートしておいて、Tableauに取り込むことで、接続環境を構築する前に、サンプルのダッシュボードを作成できるというメリットもあります。
初めにTableauを開くと接続画面が開くので、「ファイル」から「Microsoft Excel」を選択するとどのエクセルを取り込みたいかを選択することができます。
エクセルファイルを選択するとシート名が表示されますので、取り込みたいシートを右上にドラッグアンドドロップするとデータの内容が表示されるようになります。
このようにデータを取り込んだ後、データソースからシートに移動して可視化したい項目を選択して「行」あるいは「列」にドラッグアンドドロップをして、表現したいグラフや表を選択することで直感的に分析を始めることができます。
Tableauには様々なデータを取り込むことが可能ですが、取り込み方法はここで紹介したエクセルの取り込み方法と基本的に同じで、「ファイル」から取り込むデータの種類を選択することで取り込み可能です。
次からエクセル以外で取り込むことができるデータファイルをご紹介したいと思います。
③テキストファイル
Tableauに取り込むことができるファイル2つ目に説明するものはテキストファイルです。
テキストファイルとは*.txt、*.csv、*.tab、*.tsvの形式されたファイルのことです。エクセルファイルではデータの容量に限界があるため、システムから出力するデータとしてcsv等のこれらの形式を使用している企業も多いと思いますが、Tableauはこれらのデータも簡単に取り込むことができます。
システムに蓄積された膨大なデータをTableauで可視化・分析することは新たな課題の発見につながると思います。
④JSONファイル
Tableauにはプログラミングに使用されるJSONファイルも取り込むことができます。エクセルと同じ要領でデータの種類としてJSONファイルを選択するとJSONファイルを解析したウィンドウが現れますのでそこからどの部分をデータとして取り込むかを選択して、取り込むことになります。
⑤Microsoft Access
Tableauにはアクセスで作成したデータも取り込むことが可能です。膨大なデータを加工する際にアクセスを使われている企業もあると思います。
TableauはAccessもエクセルと同様に取り込むことが可能です。エクセルでは扱うことができずAccessを使用して管理や加工をしていた膨大なデータをTableauで可視化・分析することで新たな発見があるかもしれません。
⑥PDFファイル
TableauはPDFファイルも取り込むことが可能です。エクセルと同じ要領でPDFを取り込むと全シートを読み込むのかそれともある特定のページのみを読み込むのかの確認をされますので自分が読み込みたいデータを選択することで必要なページのみ読み込むことが可能です。
PDFファイルから取り込みたいデータは基本的に表などの数値データだと思いますが、PDFにされているデータには読み込む必要のないテキストデータ等も含まれていると思います。データを読み込んで不要なテキスト等があった場合は非表示データとして表示されないようにすることも可能です。
過去のデータは印刷して製本されており、エクセルファイル等の電子データが消失して紙のデータとしてのみ残っている場合もあるかと思いますが、そのような場合に紙のデータをスキャンしてPDFファイルとして取り込みTableauに取り込めば過去のデータも分析に加えることが可能になります。
⑦空間ファイル
Tableauは地図などの空間ファイルも取り込むことが可能です。空間ファイルは国土地理院等オープンデータポータルで見つけることができます。
地理的な情報を使ってダッシュボードを作成するようなことはBIツールでしか、実現するのが難しいものです。空間ファイルを利用することで品質の高いダッシュボードを作成することができるようになります。
Tableauに外部データを取り込む際のポイントを紹介!
Tableauには様々なデータを取り込み可能であることがお分かりいただけたと思います。
ここからTableauで外部データを取り込む際に知っておくと便利な機能をご紹介します。
①データインタープリター
データを取り込んだ際、売上や売上本数等の表示項目名と1,000円と10本等の数値がうまく認識されないことがあるかもしれません。
エクセルデータでよくある例は、上段の表示項目を複数行で表現していたり、セルの結合をしている場合です。
このような場合に「データインタープリター」という機能を使用するとTableauが表示項目名と数値を判断して、分析しやすい形に自動でTableauがデータを整形してくれます。また、どのようにTableauが整形したかをcsv等で確認することが可能です。誤った形でデータが取り込まれていないか自分の目で確認し必要があれば元データを修正して正しく取り込まれるようにする等の対応をしていくことができます。
私自身業務でエクセルデータをTableauに取り込むことが多いですが、ほとんどの場合この「データインタープリター」を使用してデータを正しく整形することができました。
②ライブ接続と抽出
ライブ接続とはtableauで何かの処理をするたびに元データに接続する方法です。
対して抽出は接続した時点のデータを読み込んでローカルにファイルを生成する接続方法です。それぞれのメリットとデメリットは以下のようになります。
ライブ接続のメリット
・自分で更新やスケジューリングをすることがなく常に最新のデータを使用して可視化・分析をすることが可能
ライブ接続のデメリット
・常に最新データに接続されるためサーバーやPCの処理の負荷が高くなり更新に時間がかかる場合がある
・オフライン状態で作業をすることができない
抽出のメリット
・最新データを読み込みに行くことがないため、ライブ接続よりもサーバーやPCにかかる負荷が小さくなるため、操作のパフォーマンスが向上する。
・データソースにアクセスできない場合にオフラインで作業することができる。
抽出のデメリット
・データが自動更新されないため、自分でスケジュールを設定するか手動で更新する必要がある
・データを物理的に保持する必要があるため、ストレージ容量を必要とする
これらのメリットデメリットを踏まえると日次・月次・年次等で行うデータ分析にはライブ接続を使用して最新値を使う方法が適しており、何らかの理由でオフラインで作業をする必要がある場合や膨大なデータを取り扱う場合、不変データを取り扱う場合には抽出が向いていると言えます。
また、ライブ接続か抽出を利用するかの判断は、アーキテクチャにも依存します。ライブ接続を利用する場合、Tableau CloudやTableau Serverと物理データベースの距離が近い必要があり、一般期にはデータウェアハウスやデータマートが必要となります。
まとめ
Tableauは、分析の専門知識がなくても簡単にデータを可視化し、分析できるBIツールです。直感的な操作でさまざまなデータソースからデータを取り込み、分析に利用できます。
Tableauでは、ExcelやPDFなどPC内のファイルだけでなく、クラウドサーバー上のデータやSQLデータベースなど、多くの外部データソースにも対応しています。これにより、異なるデータを組み合わせて可視化し、分析の幅を広げることが可能です。
たとえば、Google Driveのスプレッドシートに接続する場合は、Tableauの接続画面から「サーバーへ」→「Google Drive」を選び、Googleアカウントにログインすることで簡単にデータを取り込めます。同様に、Excelファイルやテキストファイル(CSV、TSVなど)、JSONファイル、Microsoft Accessデータベース、PDFファイル、さらには地理的情報を含む空間ファイルも取り込むことができます。
データ取り込みの際のポイントとして、「データインタープリター」を使用すれば、データが正しく整形され、分析しやすい形に自動変換されます。また、データの更新方法には「ライブ接続」と「抽出」の2種類があります。ライブ接続は常に最新のデータを使用できますが、サーバー負荷が高くなる場合があります。抽出はデータをローカルに保存するため、処理負荷は軽減されますが、手動で更新が必要です。
用途や環境に応じて、適切な接続方法を選択することが重要です。さまざまなデータソースを取り込んで、Tableauを活用した効果的なデータ分析を行いましょう。
<Tableau>
弊社ではSalesforceをはじめとするさまざまな無料オンラインセミナーを実施しています!
>>セミナー一覧はこちら
また、弊社ではTableauの導入支援のサポートも行っています。こちらもぜひお気軽にお問い合わせください。
>>Tableauについての詳細はこちら