集計と非集計を理解する(Understanding Aggregate and Non-Aggregate)

2015/09/24 20:23 Shingo 3 Comments

こんにちは!Kaoriです。
先週は新しいイベント二つ開始してドタバタしていたためすっかりブログの記事を書き損ねていました。。
ので、今週はできれば2個書きたいな~と思ってます。

さて、ずっとかわいい系Vizの記事が続いていたのですが、今回はちょっと真面目に(いや、今までのも真面目ですけど!!)集計と非集計の基本についてまとめてみたいと思います。




集計と非集計ときいて、???という方もあ~それね、という方もいらっしゃると思うのですが、これを理解できると今までより多くの分析ができるようになると思いますので、早速解説していきたいと思います。

それぞれの意味はズバリ以下の通りです。

集計:集計されているもの
非集計:集計されていないもの

・・・・・・・・。

そのままじゃん!というツッコミが来そうなんですがだってそのままなんだもん・・・
これだと意味が分からないと思いますので具体例で見ていきましょう。
たとえばこんな感じのデータがあったとします。



このデータをTableauで取り込みます。

Tableauでデータを読み込んでメジャー(=売上・利益など集計対象の数字項目)を表示すると、デフォルトでは集計された数字が表示されます。


これはデータを分析するときの一番最初のアプローチはなんらかのディメンション(=日付や商品、顧客などに相当する分析の切り口)ごとにメジャーを集計し、その比較でもってスタートするからです。
たとえばここでは受注日の月で利益を集計して比較しています。


9月は利益があったけれど、10月は赤字になってしまっているというのが一目見て分かりますね。

ここで注目していただきたいのは利益は合計だということです。


利益を囲んでいる合計( )に注目してみてください。
何気なく合計になっていますが、これがこの利益が集計されているという証拠です。
集計と言われると合計された値が真っ先に浮かびますが、集計とは個々の数字を見ずに、集計対象のディメンションごとにまとめた数字たちを集合体として扱うということです。したがって集計の方法は選ぶことができます。
利益のピルを右クリックしてメジャーのところにカーソルを合わせると、集計する方法を選ぶことができます。



数字を集合体として扱うということは、こんな感じのイメージです。
緑になっている数字が使われていると思ってください。



では集計していない状態というのはどういう状態でしょう?

Tableauでは右クリックドラッグしてメジャーを配置すると、集計していない状態を選ぶことができます。


ピルに注目するとわかりますが、合計( )で囲まれていません。

ビューも変わっていますよね。
この○はデータのレコードの一つ一つがプロットされているということなんです。


これまた緑の数字が使われていると思ってください。
集計せずにばらばらに分解して見ることができるんです。

こうして非集計で見てみることによりなにがわかるか・・・円がプロットされているグラフの奇抜さに用途を忘れてしまいそうですが、たくさんのメリットがあります。

たとえば集計で見ていたら単に9月は利益が黒字で10月は利益が赤字だった、としか言えないかもしれませんが、非集計で見てもらうことにより10月は特別大きな赤字があった日が1日あり、この日のせいで全体が赤字になっていると言えます。けれどやはり大きく利益の出ている日がないことも見て取れます。



このようにプロットするだけでなく、フィルタしてみるとどうでしょう。
利益の合計値でフィルタすると合計した時にマイナスになる10月が丸ごとフィルタされます。


非集計の利益でフィルタするとそれぞれの月にあったマイナスの利益のレコードだけがフィルタされます。したがって、10月も表示されていて、マイナス値以外の利益が集計されて表示されています。


計算式を使って色を塗ってみてもおもしろいです。
集計である「SUM[利益]<0」という計算式で色塗りをすると、合計値がマイナスである10月がTrueになります。

非集計である「[利益]<0」で色塗りをするとレコード単位で利益がマイナスの値が色分けされますので、各月の中でも一部がTrue、一部がFalseとなります。応用して比率を見たりすることもできます。

集計と非集計で私が一番好きな例は冒頭のグラフでもご紹介したこれです。
単純に利益の集計で見たグラフが上、非集計でプロットしたグラフが下です。
集計した時には中途半端な利益で目立たない電話機が、実は取引単位で見るとかなりよい成績を持っているレコードがあるんです。その代わり、大きく赤字になっている取引もあります。
電話機はこれらの問題があった取引を改善したら、大きく利益を稼いでくれるポテンシャルを持った製品だということがこれを見るとわかるんですね。


集計と非集計、いかがでしたでしょうか?
これを時に応じて使い分けることで分析にぐっと幅が出てくると思いますので、ぜひチャレンジしてみてください。


【おまけ】
簡単に集計を外す方法として、
 分析>メジャーの集計
をクリックしてチェックを外す(デフォルトではチェックがついている)方法があります。
これをするとこのシート内では常に集計がかからなくなりますが、上の例のように集計と非集計を並べることができなくなりますので、シート内に混在させたい場合はチェックは入れたままで、右クリックドラッグを使うようにしてください。



Kaori

3 件のコメント:

  1. >シート内に混在させたい場合はチェックは入れたままで、右クリックドラッグを使うようにしてください。

    とありますが、こちらはMacのTableauでも可能でしょうか?
    Tableau Desktop9.1をMacで使用しているのですが、どうもうまくいかず…

    よろしくお願いいたします。

    返信削除
  2. こんにちは!お返事が大変遅くなってしまって申し訳ありません。Macで右クリックドラッグをする場合はOptionキーを押しながら項目をドラッグするとWindowsの右クリックドラッグと同じ挙動になります。補足ですが右クリックドラッグではなく単なる右クリックの場合はControlキーを押しながらクリックすることでWindowsの右クリックと同じになります。こちらのページで細かく解説されているので、よければ参考にしてくださいね。
    http://onlinehelp.tableau.com/current/pro/online/mac/ja-jp/shortcut.html

    - Kaori

    返信削除
  3. こんにちは!集計された数値を再度非集計と一緒に集計したいけど、MAXへの引数(集計関数)はすでに集計であり、さらに集計することはできません。っとこのエラーメッセジーがあります。ほかの解決方法をありますでしょうか。

    返信削除