Tableauにおけるデータソースの設定方法とは 接続方法や編集方法を分かりやすく解説
目次
Tableauにおいて、データ分析の基盤の部分で重要となるのは、組織が持つデータです。データの集計、ビジュアライゼーション、データ分析を使ったビジネス課題の解決を正常に実行できるかどうかは、その基礎となるデータによって変わります。
この記事では、データ分析において重要となるTableauのデータソースの特徴や接続方法、設定方法などを解説していきます。
データソースを構築する前に
データソースを構築する前に、まずデータソースの目的を明確にする必要があります。様々な要望に応えることができるような汎用的なデータを作成することもありますし、ある特殊の分析を行うためのデータを作成する必要がある場合もあります。一般的には以下のような項目を考慮する必要があると言われています。
データソースの場所とそのアクセス
必要なデータの種類、データに対する必要なセキュリティーの有無、データの場所やアクセス方法、Tableau Cloud上に公開してよいデータなのか、対象データの制約事項などを確認します。
データソースの構造や正確さ
対象データが構造化/正規化されているか、フローを利用してデータを加工する必要があるか、不要なデータ/不足しているデータが無いかなどを確認します。
データモデルおよびデータの結合
複数のデータを結合する方法、データが分散されているかなどを確認します。
データソースのセキュリティーとスケーラビリティ
データソースの接続方法、データソースの認証方法、パフォーマンスと最新度などを確認します。
データ ソースへの接続について
Tableauデータソースとは、Tableauと利用するデータをリンクするものです。接続方法としてはライブ接続や抽出や埋め込みがあります。これらはビジネスで必要とされるデータの鮮度や、パフォーマンスによって決定されます。
*参考画像 : Tableau Desktopにおける接続方法の設定画面
データの接続先の種類としてはファイルやTableauのコネクターによって用意されたWeb上のデータなどにアクセスすることができます。Tableauでは単に存在する単一するデータを利用するだけではなく、それらを組み合わせたり、加工するなどして、データソースを作成することも可能です。
*参考画像 : データの接続先一覧。
データの組み合わせについて
データを単一のテーブルから取得している場合は、対象となるデータに接続してデータソースを作成し、データソースを構築することができます。ただし、データが複数のテーブルやデータベースに分散している場合は、データを組み合わせる必要があります。Tableauは異なるデータ種類のデータを組み合わせることもできるため、高価なETLツールを購入する必要なく、手軽にデータの加工が行えることも特徴の一つです。
*参考画像 : Sample – Superstoreのデータを使ったリレーションの作成方法
データの結合方法について
リレーションシップの機能を利用することで、Tableauでデータを組み合わせることが可能になります。複数のテーブルを結合したり、ユニオンしたりすることができます。データソースをブレンドすることも可能です。Tableauでデータを組み合わせる方法について一つずつ確認していきます。データ結合に関しては、意図しない結果になってしまうこともありますので注意が必要です。結合後に数値の確認をすることや、特定の結合方法は利用しないなど運用のルールを決めておくことも大切です。
テーブル同士の結合
結合する条件と結合するタイプに基づいて2つのテーブルをマージし、一つのデータを作成します。
結合タイプによっては、テーブルのデータが失われる可能性がありますので注意が必要になります。テーブルに格納されているデータの粒度が異なるような場合は、データが重複して作成されてしまう場合もあります。
データブレンド
データを結合せずに、複数の個別のデータソースを利用します。この場合、データは個別の状態のままになります。データブレンドを利用すると。Tableauはデータソースを個別に扱ったままクエリを生成して、データを返します。データブレンドに関しては、Creatorライセンスを持ったユーザーしか利用できないことと、データソースが各Creatorで自由に設定できてしまうため、意図しない利用をされてしまい、ダッシュボードによって数字の結果が変わってくるなど、問題が発生する可能性があるため、注意が必要です。
データ同士のユニオン
複数のデータテーブルに対しレコードを追加する形でマージして、データテーブルを新規作成します。同じ意味の列は同じ列名に事前に調整しておく必要があります。列名が違う場合、ユニオンされたデータには一意の列名分の列が生成されることになります。
データの更新
フローを Tableau Cloud で実行するか、Tableau Prep Conductor を使用して Tableau Server で実行するようにスケジュールを設定することで、メニューを通じてデータソースを更新することができるようになります。
また、フローを特定の時間に実行したり定期的に実行したりするために、スケジュール タスクを作成できます。スケジュール タスクは、事前に設定されたスケジュールに従って実行されます。スケジュールはシステム管理者によって作成、管理されます。
スケジュールでは、単一のフローを実行するだけではなく、複数のフローを実行される順番を決めて実行することができます。この機能は、データ更新を運用するにあたり、非常に有益になります。例えば以下のような場合です。
・データソースを更新するフローに要する時間が長く、フローをいくつかに分割して実行する必要がある場合。
・一般的なデータソースから、ある特定の分析に必要となるデータを切り出して別のデータソースを更新する必要があるような、データソース間に関係性がある場合。
データソースを更新するフローの管理についても、運用を想定した機能が揃っています。フローが実行されたログは、「ジョブ」と呼ばれるメニューで詳細を確認することができます。また、フローが実行された後メールを関係者に送付できる機能もあります。(もし実行がエラーになった場合も、メールが送信されます。)
最後に
今回は、データ分析を始める前になくてはならないTableauデータソースについての解説をしました。
現在、組織が持っているデータは膨大で、あらゆる種類のものがあります。データソースを準備する際は、目的や優先順位を考えて、取り組む必要があります。
データソースには様々な設定や機能がありますが、どれも組織内でのデータソースの運用には有益なものになります。組織が持っているデータを正しく、安定した状態で、Tableau内で管理することが、データの活用にかかせない前提条件となります。是非この機会にデータソースに対する理解を深めていただき、データ分析の活用につなげていただけますと幸いです。
<Tableau>
弊社ではSalesforceをはじめとするさまざまな無料オンラインセミナーを実施しています!
>>セミナー一覧はこちら
また、弊社ではTableauの導入支援のサポートも行っています。こちらもぜひお気軽にお問い合わせください。
>>Tableauについての詳細はこちら