TableauでRをつかってみよう!(実践編)
Nanaeです。R連携の第二回目。TableauとRを連携させる手順は前回お伝えしました。
http://tableaujpn.blogspot.jp/2016/08/tableaur.html
今回は、じゃあ実際にTableauでどう使うのか?とか、TableauからRを使うときに浮かびやすそうな疑問点についてお伝えします。
まず接続できるデータソースが気になりますね。Tableauが取得してきたデータに対してRが計算しますので、Tableauが接続できればなんでもOKです。制限はありません。
次に、どうやってTableauからRに指示を出すのか、です。Rを使うときはスクリプトを書く必要があるので、TableauでRを使うときも計算フィールドの中にRのスクリプトを書く必要があります。そのとき、Tableau側で処理するのではなくてRに計算させるとTableauにわからせるために、下記4つのどれかの関数の中にRのコードを書くことになります。ちなみにRを使ったフィールドは表計算が行われます。
・SCRIPT_REAL ():実数
・SCRIPT_STR():文字列
・SCRIPT_INT():整数
・SCRIPT_BOOL():ブール
これらの関数を使うときには、ルールがあります。
・関数の中に"..."を書き、その中にRのコードを書く。
・R内で使いたいメジャー部分は、.arg1, .arg2,...といったように.argに数字をつけた形で書く。
・"..."後に、カンマをつけて、.arg+数字にあたるメジャーを指定する。
・"..."後に指定するメジャーは、集計されている必要がある。
あとは、Rの関数を調べながら、Rstudioなんかで確認しながら、書いていくだけです。
使っているうちに、こんなエラーに遭遇することもあるかと思います。
これは、Rから持ってこようと思ったデータの型が、Tableauでは受け取れないときに出ます。データ型も意識して使ってください。
RからTableauに渡せるデータの型:小数、整数、ブーリアン、文字列
TableauからRに渡せるデータの型:小数、整数、ブーリアン、文字列、日付、日付時刻
では1つ、相関係数を出す例を示します。
傾向線はアナリティクスペインからすぐ出るし、マウスオーバーすれば、式やR^2値もP値もすぐ出ます。
でもR^2じゃなくて、感覚的に多くの人がわかりやすい相関係数Rを出したい場合もあるでしょう。そこでここでは、相関係数Rを、R連携で計算させてみます。
計算フィールドにRのスクリプトを書きます。
小数で返される相関係数を持ってきたいので、SCRIPT_REAL()を使います。その中に"..."を書き、Rで相関係数を出せるcor()を使って、2つのメジャーを指定します。
いったんこのフィールドを作っておけば、ディメンションとして顧客名を使えば顧客名単位での相関係数が出ますし、製品名を使えば製品名単位での相関係数が出るので、簡単に異なる観点で結果を出すことができますね。そういった場合、複数のディメンションをパラメータとして持たせておくと、閲覧者にやさしいですね。
その他、Rだからこそ、さまざまな分析が簡単にできます。以下、R連携のアウトプット例です。連携方法さえわかればあとはRの問題なので、いろいろ調べてTableauで表現してみてください!
異常値
回帰
予測
クラスタリング
ネットワーク図
センチメント分析
Reuben Kearney(https://reubenkearney.com/2015/06/07/updated-sentiment-analysis-with-sentiment/)から引用。細かく実現方法が記載されています。
Nanae
0 コメント: