Excel 向けの Tableau アドイン (Tableau Add-In in Excel)

Nanaeです。

意外と知られていないんですが、Tableauにはとっても便利なExcelへのアドインツールがあるんです。Excel内で1クリックするだけで、データが取り込まれてTableau Desktopが開けるというものです。ちなみにこのアドインは無料です!


まずはこのアドインをインストールしてみてください☆
注意点としては、OSがWindowsである必要があります。
----------------------------------
こちらからダウンロードできます。Excelへのアドイン方法なども出ています。
Excel でデータを再整形するための Tableau アドインのインストールとトラブルシューティング
http://kb.tableau.com/articles/knowledgebase/addin-reshaping-data-excel?lang=ja-jp

Excel用のアドインツールが出たときの公式blogです。
Reshaping Data Made Easy(英語)
http://www.tableau.com/ja-jp/about/blog/2012/03/reshaping-data-made-easy-16353
----------------------------------

使い方は、Excelにある[Tableau]タブから「Open in Tableau」を選択するだけ!
これは時間と手間の短縮になるので、一回使うと手放せません!!!


もう1つこのアドインを使ってできることをご紹介します。
[Tableau]タブの一番左「Reshape data」をぜひ使ってみてください!Tableauで分析しやすい形に整形して、Excelに出力してくれます。さらにそのシートで「Open in Tableau」を使って開くと便利ですね~。

「複数回答アンケートデータの可視化(http://tableaujpn.blogspot.jp/2015/10/how-to-deal-with-multiple-response.html)」のaタイプのデータも、さらに簡単に可視化することができます。

aタイプのデータをExcelで開いて、[Tableau]タブの「Reshape data」を押します。

出てきたReshape Dataというウィンドウが出てきます。この中で、最初の数値である左上のセル(B2)を選択してOKを押します。

すると、複数列に分かれていた各選択肢が1つの列にまとめた形で整形されました!

なお、複数回答されている場合は、その回答数分だけ行が作られます。

ここで「Open in Tableau」からTableauに飛ぶと、このデータが取り込まれて自動的にTableauが立ち上がります。

そして、「複数回答アンケートデータの可視化(http://tableaujpn.blogspot.jp/2015/10/how-to-deal-with-multiple-response.html)」で作成したのと同じ棒グラフを作ってみます。
今回のデータの持ち方に変換されていれば、下の画像にあるとおり、生成されたCol2とCol3というフィールドを行と列にドラッグアンドドロップするだけでアンケートの回答数がグラフ化できています!簡単さをぜひ比較してみてください:)



ここで例に挙げたデータの持ち方に限らず「Reshape data」はアンケートデータのときに使える場面が多いと思います。
TableauにExcelデータを入れようという際は、このアドインを思い出していただけたらと思います。本当に便利です☆ぜひすぐインストールを!!!

Nanae

複数回答アンケートデータの可視化 (How to deal with multiple response survey data)

Nanaeです。こんにちは。

アンケートデータをTableauで可視化したい方は多くいらっしゃると思います。しかし、複数回答OKのデータを扱うとき、データの持ち方によっては、難しく感じているかもしれません。

そこで今回は、複数回答データとしてよくある2つのデータの持ち方から、各選択肢の回答数をグラフに表す方法をお伝えします。

例として、今回は以下のデータを使います。
あるイベントに来場した人に、「今回のイベントを何で知りましたか?」と質問し、"インターネット広告"、"弊社ウェブサイト"、"Twitter"、"その他"から選んでもらった結果のデータです。ここでは分かりやすくするために6件だけのデータで進めます。

こういった場合、データの持ち方としてよくあるのは、次の2つです。
a. 回答ごとにカラムが用意されていて、回答があれば1などのフラグを立てているタイプ
b. カンマ(,)や空白( )で区切って、1つの列に全ての回答が文字として入っているタイプ
 a
  b

どちらが簡単かと言うと、aのタイプです。できれば、aのタイプでデータを持っておいた方がいいですが、bのタイプでも表現可能です。

★aタイプ
ドラッグアンドドロップだけで表せます!1つの軸を使って各選択肢の回答数を出したいので、メジャーネームとメジャーバリューを使います。
メジャーネームとメジャーバリューについての説明はこちら。
http://tableaujpn.blogspot.jp/2015/10/mystery-of-measure-name-measure-value.html

この棒グラフを作るとき、メジャーネームとメジャーバリューをフィルターや行列等に入れていって作ってもいいですが、各選択肢のフィールドを左側の軸にドラッグアンドドロップしていっても作れます。こちらの方が簡単です!やり方は以下。

Step1
「Twitter」フィールドを行に移動。


Step2
「インターネット広告」を左側の軸にドラッグして、2本の緑の線(定規)が出てきたらドロップ。 
すると、メジャーネームとメジャーバリューを1つ1つ設定しなくても、ちゃんと出てきました。

Step3
同様に、「その他」、「弊社ウェブサイト」も左側の軸にドラッグアンドドロップ。

Step4
メジャーネームを色に入れて色を変えたり、表示の順番を変えたり、わかりやすくなるように調整。

★bタイプ
「今回のイベントを何で知りましたか?」という1つのフィールドの中に、全ての回答が入っているので、各選択肢の回答数が数えられません。選択肢ごとに分けなくては数えられないので、選択肢ごとにフィールドを作成し、そのフィールドの出現数を数えます。

選択肢ごとに作成する計算式はこちら。
Twitterの場合、「今回のイベントを何で知りましたか?」の回答の中に、Twitterという文字が含まれているものだけをCONTAINS関数を使って抜き出しています。

これをカウントすることでTwitterと答えた人数がわかります。
同様に、各選択肢に対してこのフィールドを作成します。

あとはメジャーネームとメジャーバリューを使って棒グラフを作るだけ!

やり方さえわかれば、問題なく作成できると思います:)
早速トライしてみてください!

aタイプのダウンロードはこちら。


bタイプのダウンロードはこちら。




メジャーネームとメジャーバリューの神秘(Mystery of Measure Name & Measure Value)


みなさんこんにちは!Kaoriです。
今日はみなさんにメジャーネームとメジャーバリューの神秘をご紹介したいと思います。

メジャーネームとメジャーバリュー、Vizを作っているうちに突如出現して戸惑ったことはありませんか?
突然出てきて誰こいつ?的な感じかと思いますが、フレンドリーになっておくとなかなか役に立つやつなので、ぜひこの機会に覚えてやっていただければと思います。

さて、このメジャーネームとメジャーバリュー、最初のうちは気づいたら出てきているという感じかと思いますが、よくあるシチュエーションとしては、二つ以上の数字(メジャー)を入れているときに表示形式をテキストテーブルにしたときなんかによく出てきます。


突如自分の入れていない項目がピルになって勝手にお邪魔しているので、驚かれた方も多いと思いますが、特にクロス集計のVizを作るときにはこの特性を知っておくとかなり役立ちます。

まずそもそも、この二つが何者かというと・・・

メジャーネーム:データウィンドウでメジャーとして定義されている項目すべての「項目名」
メジャーバリュー:データウィンドウでメジャーとして定義されている項目すべての「値」

です。

Tableauでデータに接続したときに、このメジャーネームとメジャーバリューは必ずデータウィンドウ内のディメンション、メジャーのそれぞれの一番下に表示されています。



いつも自分から勝手に出てきてくれるメジャーネームとメジャーバリューですが、今回はせっかくなのでこちらから迎えに行ってみようと思います。

まずはメジャーバリューをテキストに放り込んでみます。

ドン!

数字がぐちゃぐちゃになっています。
なんだこりゃ?!という感じなのですが、これはよく見ると、メジャーバリューの箱に入っているすべての値が上に重なって表示されている状態なんですね。


Tableauでは列を分けるためには何かしら列を分けるためのピルをいれなくてはなりませんが、ここではまだメジャーの項目名(つまりメジャーネーム)を列に入れていないので、全部上に乗っかって表示されているというわけなのです。

ではここでメジャーネームの登場です。


こうすると、メジャーネームでメジャーバリューが列の下に配置され、どれがどの数字だかわかるようになりました。

ここで、メジャーネームがフィルターにも入っていることに注目してみてください。


これはつまり、どのメジャーを使用するか、フィルターで定義することができるということなんですね。
フィルターの中を覗くとこんな感じになっています。


ここで必要な数字だけにチェックを入れると・・・


このように必要なメジャーだけを表示することができます。


メジャーバリューの箱の中でピルを外すとフィルターの操作と同様のことができます。
また、このメジャーバリューの箱の中の順番が表示順に影響しますので並びを変えたいときはこの箱の中にあるピルの順番を変えてみてください。


さて、このメジャーネームとメジャーバリュー、クロス集計のときに非常によく使う項目ですが、この特性を理解していただけるとグラフにも活用できます。

①メジャーバリューを列に配置して棒グラフにして、メジャーネームを色に配置することで異なるメジャーの積み上げ棒グラフを表示できます!


②線グラフに応用してあげると、二重軸のグラフに似たものを作ることができます。
これはメジャーを二つ以上でも入れることができるので、二重軸では設定できる数字が少ない時に便利です。
ただし、二重軸と違って同じ軸に全部の値が入るので、あまりにも桁の違う値を混ぜて表示するときれいに表示できなかったり、あくまで同一マークを色で分けているだけなので棒グラフと線グラフにしたりすることはできないので注意です。
でも二重軸と組み合わせることもできるので、かなりいろいろできますよ!



③メジャーネームをクイックフィルターとして表示してあげると、パラメーターを使わなくても数値をくるくる切り替えるグラフを作ることもできます!パラメーター使うより簡単ですよね。
ただし、あくまでメジャーにある値はすべて出てしまうので、たとえば売上と利益だけで変更したい、とかでしたら使わないメジャーは非表示にする必要があります。他のシートでは売上・利益以外の使う、というときはパラメーターを使ってくださいね。



というわけで、メジャーネームとメジャーバリュー、いかがでしたでしょうか?
なかなかいろいろな可能性を秘めているやつらなので、ぜひ恐れずに使ってやってください!


Kaori

緯度経度情報をブレンドしてマッピング(How to blend geographic data)

こんにちは、Nanaeです。

Tableauは、世界中の人口15000人以上の市区町村の緯度・経度情報を
製品内に含んでいるので、マッピングがとても簡単にできます。

ただ、都道府県や市区町村以外をプロットしたいとき、
例えば住所から地図にプロットしたいとき、どのような手順が必要でしょうか!?
"ブレンド"を使って実現する方法を、簡単にまとめます。
世界各地にあるTableauのオフィスをプロットする例でご紹介します。

↑このように、すでに世界中に沢山オフィスがあるんです:)

地図に表したいデータはこちら。オフィス名や住所が入っています。
このようなデータを持っていることが多いと思います。

これとブレンドするデータはこちら。各住所の緯度・経度が入っています。
住所に対する緯度・経度のデータを用意する必要があります。

STEP1
まずは、上記2つのデータを接続します。

STEP2
2つ目のデータにある"緯度""経度"という名前のカラムに対して、
Tableauに緯度と経度だと認識させるために、地理的役割から緯度と経度をそれぞれ割り当てます。

STEP3
1つ目のデータの"住所"を詳細にドラッグします。
(緯度・経度が入っている2つ目のデータの"住所"を使わないように注意!)
詳細:住所

2つのデータにある"住所"というカラム名が同じなので、
2つのデータに共通のフィールド名"住所"を使えば、自動的に2つのデータがくっつきます。

STEP4
住所に対して用意した2つ目のデータから、"緯度""経度"をダブルクリックして、行列に配置します。
列:平均(経度)
行:平均(緯度)
ここで緯度と経度をドラッグ&ドロップで移動させると、集計方法が合計になることもあるので、
その際は、平均として集計するように変えてください。

基本的にはこれだけです。とっても簡単ですよね!

STEP5
最後に少し加工します。

Step5-1
"地域"で色分けして、さらに地域と同系列の色で""を色分けします。
以前の投稿にある「複数ディメンションで色づけ」のテクニックを使います!
まず、"地域"を色にドラッグ。
そのあと、""を詳細にドラッグしてから、""の左側の空白部分を変更して色で表現させるようにマークを変更します。詳しくは、上記リンクから確認してくださいね。
色:地域、国

STEP5-2
今、チャートのタイプが自動になのでプロットの形は円ですが、好きな形に変えてみます。
自分で用意した、マッピングっぽい形状を使ってプロットさせました。

STEP5-3
オフィスの名前を表示させます。
ラベル:オフィス
完成です!
アメリカに限らず、世界展開していることがよくわかります。
東京以外にも日本のオフィスができる日も近いかも!?

ここでは住所に対して、緯度・経度の情報を用意しましたが、これはgoogle mapで調べました。
また、郵便番号とその緯度・経度のデータなど、緯度・経度情報は、web検索すると無料でいろいろとダウンロードできます。調べてぜひ使ってみてください

ダウンロードはこちら↓

[YouTube]Tableau 9.0 の新機能 - LOD表現(3)


Tableau Desktop 9.0のLOD表現(3)についてお伝えしているご紹介ビデオです。
ぜひご覧ください。

[YouTube]Tableau 9.0 の新機能 - LOD表現(2)


Tableau Desktop 9.0のLOD表現(2)についてお伝えしているご紹介ビデオです。
ぜひご覧ください。

集計と非集計を理解する(Understanding Aggregate and Non-Aggregate)

こんにちは!Kaoriです。
先週は新しいイベント二つ開始してドタバタしていたためすっかりブログの記事を書き損ねていました。。
ので、今週はできれば2個書きたいな~と思ってます。

さて、ずっとかわいい系Vizの記事が続いていたのですが、今回はちょっと真面目に(いや、今までのも真面目ですけど!!)集計と非集計の基本についてまとめてみたいと思います。




集計と非集計ときいて、???という方もあ~それね、という方もいらっしゃると思うのですが、これを理解できると今までより多くの分析ができるようになると思いますので、早速解説していきたいと思います。

それぞれの意味はズバリ以下の通りです。

集計:集計されているもの
非集計:集計されていないもの

・・・・・・・・。

そのままじゃん!というツッコミが来そうなんですがだってそのままなんだもん・・・
これだと意味が分からないと思いますので具体例で見ていきましょう。
たとえばこんな感じのデータがあったとします。



このデータをTableauで取り込みます。

Tableauでデータを読み込んでメジャー(=売上・利益など集計対象の数字項目)を表示すると、デフォルトでは集計された数字が表示されます。


これはデータを分析するときの一番最初のアプローチはなんらかのディメンション(=日付や商品、顧客などに相当する分析の切り口)ごとにメジャーを集計し、その比較でもってスタートするからです。
たとえばここでは受注日の月で利益を集計して比較しています。


9月は利益があったけれど、10月は赤字になってしまっているというのが一目見て分かりますね。

ここで注目していただきたいのは利益は合計だということです。


利益を囲んでいる合計( )に注目してみてください。
何気なく合計になっていますが、これがこの利益が集計されているという証拠です。
集計と言われると合計された値が真っ先に浮かびますが、集計とは個々の数字を見ずに、集計対象のディメンションごとにまとめた数字たちを集合体として扱うということです。したがって集計の方法は選ぶことができます。
利益のピルを右クリックしてメジャーのところにカーソルを合わせると、集計する方法を選ぶことができます。



数字を集合体として扱うということは、こんな感じのイメージです。
緑になっている数字が使われていると思ってください。



では集計していない状態というのはどういう状態でしょう?

Tableauでは右クリックドラッグしてメジャーを配置すると、集計していない状態を選ぶことができます。


ピルに注目するとわかりますが、合計( )で囲まれていません。

ビューも変わっていますよね。
この○はデータのレコードの一つ一つがプロットされているということなんです。


これまた緑の数字が使われていると思ってください。
集計せずにばらばらに分解して見ることができるんです。

こうして非集計で見てみることによりなにがわかるか・・・円がプロットされているグラフの奇抜さに用途を忘れてしまいそうですが、たくさんのメリットがあります。

たとえば集計で見ていたら単に9月は利益が黒字で10月は利益が赤字だった、としか言えないかもしれませんが、非集計で見てもらうことにより10月は特別大きな赤字があった日が1日あり、この日のせいで全体が赤字になっていると言えます。けれどやはり大きく利益の出ている日がないことも見て取れます。



このようにプロットするだけでなく、フィルタしてみるとどうでしょう。
利益の合計値でフィルタすると合計した時にマイナスになる10月が丸ごとフィルタされます。


非集計の利益でフィルタするとそれぞれの月にあったマイナスの利益のレコードだけがフィルタされます。したがって、10月も表示されていて、マイナス値以外の利益が集計されて表示されています。


計算式を使って色を塗ってみてもおもしろいです。
集計である「SUM[利益]<0」という計算式で色塗りをすると、合計値がマイナスである10月がTrueになります。

非集計である「[利益]<0」で色塗りをするとレコード単位で利益がマイナスの値が色分けされますので、各月の中でも一部がTrue、一部がFalseとなります。応用して比率を見たりすることもできます。

集計と非集計で私が一番好きな例は冒頭のグラフでもご紹介したこれです。
単純に利益の集計で見たグラフが上、非集計でプロットしたグラフが下です。
集計した時には中途半端な利益で目立たない電話機が、実は取引単位で見るとかなりよい成績を持っているレコードがあるんです。その代わり、大きく赤字になっている取引もあります。
電話機はこれらの問題があった取引を改善したら、大きく利益を稼いでくれるポテンシャルを持った製品だということがこれを見るとわかるんですね。


集計と非集計、いかがでしたでしょうか?
これを時に応じて使い分けることで分析にぐっと幅が出てくると思いますので、ぜひチャレンジしてみてください。


【おまけ】
簡単に集計を外す方法として、
 分析>メジャーの集計
をクリックしてチェックを外す(デフォルトではチェックがついている)方法があります。
これをするとこのシート内では常に集計がかからなくなりますが、上の例のように集計と非集計を並べることができなくなりますので、シート内に混在させたい場合はチェックは入れたままで、右クリックドラッグを使うようにしてください。



Kaori