TableauとBig Queryで行うデータ分析の事例をご紹介
目次
Tableauをある程度使えるようになったあなた。こんな壁にぶつかっていませんか?
- 「もっと大きいデータを扱いたいけど、重くなるしな…」
- 「元データを加工して中間テーブルからTableauで可視化したい!」
- 「Tableau Prepが重たくて動かない!!」
そんなあなたや会社にはGoogle BigQueryをお勧めします。
この記事では、BigQueryの活用方法まで解説します。
また、BigQueryにとりあえずデータは格納しているものの、どうやって分析したらいいのかわからないという方もぜひご一読下さい。
せっかく蓄積しているデータが使えないということは、多種多様な食材をそのまま放置しているようなものです。調理して食べられる形、つまり、可視化や分析で新しい発見をできる状態にすれば値千金の情報が出てきます。
では、BigQuery×Tableauという強力なデータ分析基盤の構築、活用をご紹介します。
BigQueryに接続する方法
【BigQueryを初めて使う人へ】BigQueryとは
まず、BigQueryとは、Googleが提供するクラウド型データベースです。Google Cloud上で使用ができます。Cloud上でSQLを実行してデータ加工、クリーニングすることも可能です。
簡単に言えば、容量が数ペタバイトのUSBがネット上にあり、安全に、自由にアクセスできる。そしてUSB単体でデータ処理がある程度できてしまう。そのようなものです。しかし、データ容量が大きい場合にはそれに応じて金額がかかってきますのでご注意ください。詳細は後述します。
BigQueryには下記URLからログイン、プロジェクトを作成してください。
https://console.cloud.google.com/bigquery
データの追加の仕方は状況により様々なのでここでは省きます。
ログイン
では早速、TableauとBigQuery上のデータを繋げていきます。
すると、別ブラウザが立ち上がります。
認証が行われるので手順に沿って進みます。途中許可を求められるので「許可」ボタンをクリックしてください。これで認証完了です。
そして任意のデータを選択して下さい。
これでTableauとBigQueryの接続が完了しました。
TableauとBigQueryを使うメリット
容量の大きなデータを高速で使用できる
BigQueryは数テラバイトのデータも容易に処理できます。
これからの時代、いたるところでデータの取得が可能になっていきます。それに対応して当然、データ量(行数も列数も)増えていきます。そうなると、Excel程度では太刀打ちできない物になります。今後の見通しも踏まえ、BigQueryを使用するのはおすすめです。
もちろん他にも、Amazon Web Servises(AWS)のように様々な種類のデータウェアハウス(DWH)は存在します。その中でもBigQueryはトップクラスの人気を持つDWHです。
データ接続前に集計が可能
これはかなり大きなメリットです。
多少のSQLの知識は必要ですが、大体ググりながら対応できる範囲でかなりのことができます。
例えば、中間テーブルを作ってから、Tableauに接続することができます。
例)
別テーブルと結合する
集計/フィルタリングを先にして、データ量を軽くする
これをTableau単体で行うのと、BQ側で行うのでは速さ、効率に雲泥の差が出ます。
料金が安い
Googleが提供するBigQueryは、料金体系により、用途に合った使い方ができます。
※東京(asia-northeast1)の料金
上記の表が示すのはつまり
「10GBまでのデータの保存であれば、利用料は無料になりますよ。データの処理に関しても、1TB/月以内ならば利用料は無料になりますよ~!」ということです。
また、保存データが10GBを超えたとしても、1GBあたり2円という格安な料金になっています。
データ処理に関しても、通常のデータ処理程度であれば、1TB/月を超えることはないのではないかと思います。
もし、1TBを超えてしまったとしても、1TBあたり500円という格安な料金になっています。
TableauとBigQueryを使う注意点
従量課金制
いいこと尽くしのTableau×BigQueryですが、注意しなければならない点があります。
BigQueryは、『データを処理した(動かした)分だけ課金』されます。
つまり、TableauとBigQueryを接続して分析する際、毎度BigQueryに処理を指示していれば大量の請求書が来ることになります。
ではどうすればいいのか。
ご安心ください。とっても簡単です。
接続した後、接続方法を「抽出」に変更するだけです。
抽出でVizを作成したのちに、更新を押してデータを最新化させる方法が最もデータ量を省くことができます。
また、どうしてもライブで使いたい場合は、自動更新を停止させることも大きな効果があります。
自動更新は、Tableau上部のメニューバーをワンクリックで停止させることができます。
自動更新を停止させることで無駄な処理をさせることができます。
特に、Tableau操作ではトライ&エラーの連続だと思います。その一つずつはBigQueryにクエリ(指示)を出して処理をさせていることになっています。なので、大規模なデータを扱うと、ディメンションを一つドロップするだけで1分かかることもあります。
そこで、自動更新をを停止することで処理が格段に減ります。
自動更新をするまで、ビューが変わることはありませんので、ある程度ディメンション、メジャー、表示形式を決めてから操作することをおすすめします。
さらに、自動更新を停止するとTableau自体の更新スピードも上がり、作業の効率化にもなります。
まとめ
いかがでしたでしょうか。
Tableauは単体でもかなり強力なツールです。しかし、データの前処理など苦手分野があります。
その苦手部分をBigQueryで補うことで、より強固で効率のいい分析環境を構築することができます。SQLを使うとさらに柔軟な分析ができるようになります。
<Tableau>
弊社ではSalesforceをはじめとするさまざまな無料オンラインセミナーを実施しています!
>>セミナー一覧はこちら
また、弊社ではTableauの導入支援のサポートも行っています。こちらもぜひお気軽にお問い合わせください。
>>Tableauについての詳細はこちら