傾向線③:スモールマルチプル×統計値
Nanaeです。傾向線シリーズの最終回です。
第一弾では、Tableauの傾向線はどれくらいインパクトがあるのか、第二弾では、傾向線を出すだけでなく見るべき指標も確認しましょう、とお伝えしました。ラストの第三弾では、第一弾と第二弾でやったことを組み合わせて、Tableauならではの見方をご紹介します。
まずは気になる2つのメジャーを発見し、そのメジャー間の関係を様々なディメンションごとで切り分けるスモールマルチプルを作ります。ここまでは第一弾の内容です。
そして各散布図のR-2乗値を把握します。R-2乗値は、R連携してもいいですが、ここでは計算式を書いてみます。

SQUARE((1 / (Size()-1))*Window_Sum(((Sum([売上]) - Window_Avg(Sum([売上])))/Window_Stdev(Sum([売上]))) *(Sum([数量]) - Window_Avg(Sum([数量])))/Window_Stdev(Sum([数量]))))
これを色に入れます。これで一気に各散布図のR-2乗値が把握できるようになります。違いをわかりやすくするためにステップドカラーにしてみました。
これでマウスオーバーしなくても一度に、分布、傾向線の向き、R-2乗値の大きさがわかりますね!
青色である通常配送の家具と家電は、R-2乗が大きいのでこの傾向線のあてはまりがよく、マウスオーバーしてp値を見ると0.0001未満ですのでたまたま出てきた線でもなさそうです。
紫色である3つの散布図も、R-2乗がある程度大きく、p値は0.0001未満ですので、青と一緒に検討してもよいかもしれません。
青と紫の5つの傾向線を比較すると、通常配送の家具は少ない数量でも売上が大きめかもしれないなどと読み取れます。
R-2乗の行列を組み合わせてもわかりやすいと思います。
以上、計3回の傾向線特集でした。
Tableauは2変数間の関係を見るとき、さまざまなディメンションで切り分けてみていくことが得意です。さらにR-2乗値やp値も同時に見てみてください。そしてそれらを組み合わせて活用する方法の1つをご紹介しました。
Nanae
このコメントは投稿者によって削除されました。
返信削除