Tableau Prep Conductor を使って見よう!

みなさん、こんにちは bashii です。

Tableau 2019.1 の発表にて、Prep Conductorが発表になりました。さて、”Prep Conductor"とはいったいどのようなものなのでしょうか?

(以下資料はβ版の画面を利用しています。実際の2019.1の画面とは異なる可能性があります。当資料はTableau社の正式なレビューを受けていません。最新技術情報の共有を目的とした一技術文書としての公開となります。)

◇ Prep Conductor とは何ですか?

Tableau はTableau Prepというデータ準備のツールを提供しており、PC上で複雑なデータ前処理をフロー化してバッチ実行するプロダクトを提供しています。前処理した結果は、CSV、Tableau の抽出、またはTableau Serverにデータソースとしてパブリッシュし、Tableau Desktopから可視化、分析をすることができます。可視化をする際に複雑な前準備を完了した状態の結果に対してアクセスすることで、大元のデータソースへのアクセス処理を回避し、分析処理のパフォーマンス向上が望めます。

一言でいえば、「Prep Conductor 」はいままでPC上で実行していたPrepフローをサーバー側で一括管理、スケジュール実行する機能です。

例えば…

① 当日の売り上げを夜間に締めて、マスターデータや他のデータと結合して前処理し、分析用のデータソースを作成、パブリッシュしておく (Prep Conductorでバッチのスケジュール実行)

② 翌日の朝、ユーザーに①で前処理しておいたデータソースを提供し自由に分析してもらう (Tableau Desktop または Tableau Server の Web-Edit を利用する)といった運用を考えるとイメージが付きやすいでしょうか。



なお、Prep ConductorはTableau Server / Tableau Online のコンポーネントとして含まれます。(別途ライセンスを有効化することで利用可能となります。)ですので、Prep Conductor用の製品を別途インストールする必要はありません。


◇ Prep Builderとは何ですか?

今までのTableau Prep(デスクトップ製品) は Prep Conductorが登場したことで、Prep Builderに名称変更になります。ちょっとややこしいですが、デスクトップ環境で稼働する製品をPrep Builder、サーバーで稼働する製品をPrep Conductorと呼び方を分けることになりました。

◇ Prep Conductorの利用ケース例

Prep Conductor の利用構成として以下のようなケースが考えられます。

① フローの作成
Prep BuilderからCloud上のデータソースを入力とした前準備を行い、出来上がった結果をTableau Serverに共有のデータソースとしてパブリッシュするフローを作成。

② フローのパブリッシュ
Prep Builder から Prep Conductor (実際はTableau ServerまたはTableau Online)にフロー自体をパブリッシュする。

③ フローのスケジュール実行
Prep Conductor上で定期的にフローがスケジュール実行され、パブリッシュされたデータソースの内容が更新される。

④ データの可視化分析
ユーザーは定期的に更新される、パブリッシュされたデータソースを利用して日々の分析を行う。



◇ それでは実際に触ってみましょう

今回は、クラウド上のデータソース(Google Cloud SQL)に売上データが毎日入ってくる想定で、一日の終わりにこれを集計し、分析用のデータソースを作るフローを定期実行し、Tableau Serverにパブリッシュして分析に利用するというシナリオを考えます。

① まずはPC上のPrep Builderでフローを作成し、Tableau Server にパブリッシュします。



パブリッシュが完了するとPrep Conductor(Tableau Server上)にパブリッシュされたフローがブラウザの画面に表示されます。



Scheduleから"Every night End of the Day" のスケジュールを作成します。(午前2:00に実行するためのスケジュールを作成します。)



FlowのCreate new task で先ほど作成したSchedule(実行タイミング)でTaskを作成します。



タスクがスケジュールされたことを確認します。



ブラウザから即時実行することもできますので、動くかどうか一回確認してみます。



成功しました。



Run History でフローが実行された履歴、所用時間を確認します。




後はこのフローが定期的に実行されるのを待ちます。

ここで、Tableau Desktopに戻ってデータの分析をしてみましょう。

Tableau DesktopからTableau Serverに接続し、フローによってパブリッシュされたデー
タソースに接続します。



次に可視化を行います。この時点では2019/04/02までのデータが入っています。



この間にもトランザクションデータベースにはその日のトランザクションが更新されています。営業時間が終わり、夜中のフローが流れ、実行履歴が追加されます。ここでは疑似的にGoogle Cloud SQLのMySQLに2019/04/03 のデータを追加してみます。



夜中にTableau Server上のバッチが実行されます。



次の日の朝に、データ分析ユーザーはTableau Desktop 上でデータソースの更新を行います。



すると、夜間に更新された前日の更新を含むデータソースが参照できるようになります。以下のエリアチャートで、2019/04/03 の日付のデータが入ってきていることが分かります。



また、Server Status -> Flow Performance History より、パブリッシュされたフロー全体を見て、いつ何時にどのフローが成功、失敗したか、また処理時間にどれだけ所要したかを一覧で見ることができます。



また、ユーザーごとにフローを実行できるか、編集できるかなど異なるパーミッション設定を行えることも特徴です。




◇ Prep Conductorを使うメリット

最後に、Prep Conductorを使うメリットについて、まとめます。

① フローをサーバー側でスケジュール実行
フロー実行のためにクライアントPCを常時起動しておく必要がない

② スケーラビリティ
サーバーまたはクラウドのリソースをフロー実行時に有効活用できる
(多くの場合、クライアントPCよりリソースが潤沢)

③ フローの一括管理
個々に作成していたフロー成果物を一括管理できる

④ セキュリティ
フローの実行、ビュー、ダウンロード可否などのをユーザーごとに設定できる

⑤ フロー実行のモニタリング
フローの実行の履歴、実行時間をモニターし集中管理できる


以上、Tableau Prep Conductor を使ってみた報告でした!! 参考になれば幸いです。

Tableau Prepを利用したデータ前処理の有用性

皆さまこんにちは。Tableau Prepがリリースされてもう少しで一年が経ちます。
そこでTableau Prepについてもテクニカルな情報を配信していこうと思います。

今回の記事では、Tableau Prepによるデータ前処理の有効性についてお話いたします。

Harvard Business Review 誌が行った調査によると、調査対象者はデータ前処理であるクリーニングとデータ形式の変換に作業時間の 80% を費やしており、分析に費やす時間は 20% に留まるとのことです。

ビジネスの目標を管理するには、データ品質が重要です。業務で直面するデータはクレンジングが必要であり、これに加えて実際に分析画面として利用され、メンテナンスされ続ける業務サイクルが必要となります。
この現実は必然的で避けられるものではありません。

データの大半がすぐに分析に利用できないのは、データが分析に適した形式になっていない為、あるいは多種多様なデータソースに分散しているためです。
そこで データ準備ツール Tableau Prep では、データ準備に特化したビジュアルインターフェイスにより、結合やユニオン、ピボット、集計などの、一般的でありながら複雑な作業をシンプルに行えるようにしました。
Tableau Prep を使えば、データ定義や表記ゆれの確認が視覚的に確認でき、直感的な操作でデータ前処理を行うことができます。

例えば、以下のように分析画面側で実装されがちなピボットも、列から行、行から列といったようにデータ前処理でシンプルに変換する事ができます。



また、データ前処理において重要な事はクリーニングとデータ形式の変換にだけではありません。

分析画面をとして利用する為のデータビジュアライゼーションの過程では集計処理は必ず発生します。加えて計算処理も発生します。
こうした処理がデータをビジュアライゼーションとしてユーザーに提供されるまでに数十秒と係るケースもあります。
優れたビジュアライゼーションであってもユーザーへ提供時間を要する事でフラストレーションが溜まり「使いに行くツール」と評価されてしまっては非常に残念です。

そこで、レスポンス改善の為のデータ前処理についてお話します。
Tableau Desktopでは強力なLODという考え方が搭載されています。しかし場合によっては、このデータ生成を前処理で実装する事でビジュアライゼーションのパフォーマンスを各段に改善する事が可能です。

Point 1:  DesktopでのLODを利用したサンプル

ユーザーをグループごとに分類し、その行動や定着率を分析する手段として「コホート分析」があります。この分析手法を利用した例として、長く取引のある顧客は、売上への貢献度も高いか?を判定してみます。次のVizでは、年毎の売上を比較しています。ここで初回購入の年で顧客をグループ化し「コホート分析」を行おうとした場合、このVizでは顧客ごとにデータが表示されていないので、顧客の最小オーダー日付が、最初の購入日として表現する事ができません。そこでLOD 表現を使って顧客ごとの最小オーダー日付を固定する必要があります。

Tableau Desktopでは、まず計算フィールドを追加しLOD表現を行い「初回購入年」を表現します。
集計とオーダー日と売上で表現されていますが、顧客を切り口としたLOD表現を色に設定する事で初回購入年毎の集計を表現できます。



しかし、Desktop上で指定された行列での集計以外に、LOD表現として計算式を実行する必要があり別の切り口での集計が発生する為にレスポンスに影響がないとは言い切れません。

そこで、計算式を用いた集計自体をデータ前処理として生成する方法を検討します。

Point 2:  LODPrepで作成したサンプル



LODの計算式では「顧客」毎の「初回購入年」を算出しているので、Prepのフローでは「顧客」毎の「最も小さい購入年」のデータを集計します。



これにより集計された「顧客ごとの初回購入年」データを元のRawデータに対して付加する必要があります。 JOINを用いて結合します。




こうして生成したデータをTableau Desktopが高速に読み取る事ができるHyper形式のファイルとして出力し、Tableau Desktopで読み込み、購入年毎の売上を集計しVizを生成します。新しく「顧客ごとの初回購入年」として生成した列を色に設定する事により、Viz上では色情報を計算する事なく表現でき、Vizは高速に表示できます。



Point 3: レスポンス改善効果

今回はLOD表現を前処理で生成しましたが、他にもデータの集約と結合などが前処理で利用されるケースがあるかと思います。特に予算と実績など粒度の異なるデータは、Tableau Desktopではブレンディングを用いる事でデータソースを実装できますが、前処理で実装する手段も考えられます。

実際にデータブレンディングを用いた際にVizを表示する為に数分かかっていたが、Prepでデータ前処理を行う事でViz表示が数秒に改善されユーザーへの負担を軽減したというケースもあります。
また、各Desktop側で同じようなデータソースに対する処理が分散している場合、前処理として1つに統合する事で相乗的にパフォーマンス向上を発揮する事ができます。

分析は、データの発生元から業務で実際に活用する場まで繋がることにより効果的に活かされるものです。発生するデータの前処理としてのTableau Prep利用をご検討いただく事により、Vizを通して最適な分析への一助になり得るかもしれません。

以上、データ前処理の有用性についてご紹介しました。

セットアクションとは?


皆様こんにちは。Keikoです。だいぶご無沙汰してしまいました…。
バージョン2018.3で新たに追加された機能の1つ、セットアクション。もう皆様お試しいただきましたでしょうか。

このセットアクション、非常にパワフルな、Tableauのインタラクティビティを更に深化させる機能なのですが…。機能の説明としては、「セットの中身を、シート上での操作に応じて動的に変更する」。ただそれだけです。
…うん、それで?となる方、多いかもしれません。実は、動的なセットを作っただけではあまり意味がありません。それを色カードや計算フィールドと組み合わせてどう使うか、ここが大きなポイントになります。

セットアクションの例の前に、そもそもの「セットとは?」のご説明を。

"セットは、いくつかの条件に基づいてデータのサブセットを定義するカスタム フィールドです。"

とあります。何かしらの条件(例:家具カテゴリの製品を買っている)に該当するデータレコードを、1つのサブセットとしてまとめておく機能です。
   (条件に該当してセットに含まれるデータ = IN
   条件に該当せずセットに含まれないデータ = OUT

セットを使用するメリットは幾つか考えられるのですが、今回注目したいのは、
   セットのINだけでなく、OUTも確認できる
という点です。

条件に該当するデータのみを分析対象とするのであれば、フィルター機能を使っても同じですよね。もちろんセットをフィルターシェルフに配置してINのみに絞り込むことも可能ですが、行シェルフに配置したり色カードに配置したりすることで、INのデータとOUTのデータにどのような違いがあるのかを、視覚的に確認することが可能になります。


ここまでは、通常のセット機能のお話。では、バージョン2018.3で追加されたセットアクション機能で、何がどう変わったか。
冒頭にも書きましたが、「セットの中身を、シート上での操作に応じて動的に変更する」ことが出来るようになりました。

例えば「家具カテゴリの製品を買っている」というセットの設定を「事務用品カテゴリの製品を買っている」に変更しようと思ったら、これまでは「セットの編集」メニューから変更するしかありませんでした。

でもセットアクションを設定すれば、Vizの中身を選択すること(例えば下の図では棒グラフの棒をクリックすること)によって、自由に設定変更することが出来ます。

閲覧している人が、分析している人が、「パターンAの場合はこうなのか、じゃあパターンBの場合はどうだろう?Cの場合は?」と、頭に浮かんできた疑問に即座に回答することが出来ますよね!!


セットとは何か、セットアクション機能で何が出来るようになったのか、イメージいただけましたでしょうか。

セットアクションの詳細な設定方法はオンラインヘルプをご参照いただくとして、本日はこのセットアクションの活用例を3つご紹介します。

1.    選択した都道府県の売上合計は?利益総額に占める割合は?
非常にシンプルに、セットアクションを設定したセットを、色カードに配置するだけ、で出来ます。地図上で選択(=セットアクションのトリガー)された都道府県がセットのIN、選択されていない都道府県がセットのOUTになります。


2.選択した各地域と、未選択地域の売上合計の推移は?選択した地域を基準としたとき、各地域の売上は何%差がある?
この例は、セットアクションを設定したセット + 計算フィールドの組み合わせで出来ています。計算フィールドに [セット名] を入れるだけで、そのセットに含まれるか含まれないか(IN/OUT)の判定が可能なところが便利です。


3. 1つのメンバーだけドリルダウンして詳細を見たい!
上記2つが分析寄りの使用例なのに対して、これはレポーティング目的、閲覧者の方が日々の意思決定をデータドリブンに行う際に活用できる例かもしれません。
セットアクションを設定したセット + 計算フィールドという組み合わせは同じで、今回は2段階のドリルダウンをしたいので、2つのセット(とセットアクション)を使用しています。


セットアクションの活用イメージ、掴んでいただけましたでしょうか。「ABの場合はCをする」といったロジカルな処理を動的に行う場合、これまではパラメーターやLOD表現を駆使して事前に作りこんでおく必要がありました。でもセットアクションを使えば簡単ですね!皆様も是非触ってみて、ご自身の分析の、ダッシュボードのどこに適用できるか考えてみてください。

こちらのTableau公式ブログ(英語)に、より詳細な、より高度な活用例もございますので、併せてご参照ください。
- 8ways to bring powerful new comparisons to viz audiences with Tableau setactions
- 8analytic concepts to express with Tableau set actions

誰のためのデザイン?(D.A.ノーマン)を読んでみた

大変ご無沙汰しています!!Kaori改めKTです。
久しぶりの投稿でTableauのTipsじゃないのかい!!って感じなのですが今日はイギリスのTableau テクノロジーエヴァンジェリストでThe Big Book of Dashboardsを書いたAndy Cotgreaveがおすすめしてくれた"The Design of Everyday Things"という本がありまして、「誰のためのデザイン?」という邦訳版があるので読んでみたKey Take Awayと感想を書き綴りたいと思います。
この本はハードカバー452ページという、なかなかに読み応えのある本なのですが、読み終わったときにTableauを使う上での考え方はもちろん、日常生活の考え方まで、ごっそり変わった大変素晴らしい本でしたので、備忘録と自分の理解を深める意味も込めてまとめを残しておこうと思います。

今回紹介する本はこちらです。

(邦訳)
誰のためのデザイン? 増補・改訂版 ―認知科学者のデザイン原論   D. A. ノーマン

(原作)
The Design of Everyday Things: Revised and Expanded Edition   Don Norman


全7章の構成になっていて、ざっくり1章ずつ書いていきたいと思います。



第1章 毎日使う道具の精神病理学

目の前にあるものの使い方がわからなかったり、誤った操作をしてしまうということはよくあると思いますが、そういったものすべてはデザインが悪いのであり、使い方がわからない人間のせいではない、という極限まで人間中心を貫いたデザインを考えよという章です。
美しいデザイン≠良いデザイン
美しいデザインが必ずしもいいデザインとは限らない。良いデザインとは、説明しなくても理解できるような発見可能性と理解から成り立っています。
もちろん、何も説明されなくても理解できるデザインでありながら見た目にも美しいデザインというものは理想ですが、あまりにも美しさ「のみ」を追求するあまり、つなぎ目を消してしまって出口がわからなくなるドアの例なんかも挙げられています。
そこにインタラクションできるという気付きをデザインから与えてあげることが良いデザインにとっては非常に重要です。
そういったわかりやすいデザインを大前提としながら、美しくも見えるデザインを考えていきたいものですね。
でもわかりやすいデザインって、余計な説明がなくてもわかるデザインなので、結果的にごちゃごちゃしなくて美しかったりもしますね。


第2章 日常場面における行為の心理学

では良いデザインを考えるためになにを理解すればいいか?ということで、人間中心デザインなのだから人間のことを理解しましょうという章です。
人間が物事をどのように行い、どのように認知を行うかということで自分のやりたいこと(ゴール)と外界の間を七段階理論に分け、考える方法を解説します。
また、人間の認知の方法を三つの処理レベル「本能的」「行動的」「内省的」に分け、行為の七段階理論と結びつけます。
この三つの処理レベルは以下のようになものです。
「本能レベル」
無意識に認識される最も原始的な反応。良いか悪いか、安全か危険か、基本的にすべての人が同じように考えるような直感的な反応。この本能レベルで嫌われると使ってもらえなくなるので、まずデザインする人はこの本能レベルをクリアすることを考えなくてはなりません。どんなに便利なものも、使ってもらわなければ意味がないので。
「行動レベル」
これは学習されたスキルの原点です。話したり、動いたり、実際に行動を起こすレベルのこと。自分の意志で動いているように見えますが、行動レベルは実は潜在意識的。
なにかをしようと思った時、やっている行為そのものは意識していない(たとえば、言葉は発するまで何を言おうと思っていたかはっきりとわかっていたわけではなかったり、手を動かすとき右手を動かしたいと思っているだけでどの筋肉をどう動かすなどと認識しているわけではないこと)ですよね。
「内省レベル」
これは意識的な認知の原点です。本能や行動レベルは分析を伴わないため即座に反応する迅速なものですが、内省レベルは深くゆっくりとしていて、たいていの場合あとからゆっくり起こるものです。私たちは内省的なレベルでの意識処理には気づくことができます。

認知は意識的なものでしかないとイメージしてしまいそうですが、上記の通りそんなことはありません。むしろ潜在意識的なものの方が多いです。
そして認知は情動と切り離して考えられがちですが、これら三つの処理レベルはすべて連動して動き、楽しい苦しいという情動が認知に影響を与えたり、認知した結果が嬉しいつまらないなどといった情動をもたらすので、切り離して考えることはできません。したがって、すべてに対してデザインは考えなければなりません。
冒頭で話したTableauのエヴァンジェリスト、Andyは本能レベルと行動レベルに向けてビジュアルベストプラクティスを通してデザインする方法を語りました。
本能レベルと行動レベルの方が、比較的すべての人に対して共通した考えでデザインすることができるからですね。
もちろん、実際のダッシュボードデザインにおいては相手にもたらす内省レベルのインパクトについても十分考えなければならないでしょう。これは「使い手は誰か」という考え方がまさにそれで、渡した相手がどういう理解をして意識していくのか考えて、自分の伝えたいことと相手の理解がなるべく一致するようなデザインにしていくべきですね。そこにはもちろん、本能と行動が深くかかわっていて、ビジュアルベストプラクティスで上手に制御されたデザインが内省的な意識、理解を導くのではないかなと考えています。

それから、この章にはもう一つおもしろい節があって、「語り手としての人間」という節です。人間は元来物事を原因を探し、「説明」や「物語」を作り上げるようにできています。だからこそ「物語」は人の理解をスムーズにすることができるんですね。Tableauがストーリーテリングを重視するのと繋がります。


第3章 頭の中の知識と外界にある知識

私たちはすべてのことを記憶しているわけではないのに様々なことを日々判断して生活することができますよね。知識には自分自身の記憶と外界の知識(自然な対応づけや制約)があり、私たちは外界の知識と自身の記憶を結びつけて判断するためにそういったことができる、という章です。
外界の知識というのはなんだか難しい言葉ですが、たとえば忘れないようにメモを書いて机の目立つところに貼っておくとか、会議の予定が決まったらカレンダーアプリで時間と場所と概要を登録するとかいったことです。人間はずっと昔から全部を記憶していたわけではなく、生きるために必要な様々な情報を外に置いておき、必要に応じて使ってきました。
なぜそういうことをしてきたかというと、すべてを記憶するには世界の情報はあまりにも膨大だからですね。
記憶には短期記憶と長期記憶があり、短期記憶はすぐ引き出せるし回転も速くて便利なのですが、覚えておける量も少なくインタラプションに弱いので、話しかけられたりすると途切れて忘れてしまうことがあります。2階に忘れ物をして取りに戻ったのに2階の部屋に入ると何を忘れたのか忘れる私ですが、これは階段を上るっていう行動のインタラプションのせいだなということがわかりました(笑)
長期記憶は長い期間、量の多い情報を記憶しておくことができますが、すべてを正確に覚えているわけではなく、思い出すたびに断片が再構成されます。記憶がどのように解釈されたか次第で、その記憶を引き出すのに時間がかかったり、できなかったりします。
この短期記憶と長期記憶が頭の中の知識であり、これと外界の知識をうまく掛け合わせながら人間は効率よく生きています。この知識のそれぞれの特徴を把握し、いいところを使えるデザインにすることでより使いやすいデザインになっていくわけですね。
言葉で発する、字を書く、絵を描く、これらすべて外にアウトプットすることが外界の知識であり、なぜアウトプットすることで理解がたやすくなるのかわかると思います。
Tableauを使う話に置き換えると、ドラッグアンドドロップした瞬間にデータに基づいたなにかが表示される、あれは外界の知識ですね。すでに表示されているものを解釈するのは自分の頭の中で全部考えるより簡単です。
頭の中の知識に全部頼ろうとすることは得策ではありません。使えるものは使う、外界の知識を簡単に作ることができて、簡単に利用することができるのなら、使えばいいのです。


第4章 何をするかを知る ― 制約、発見可能性、フィードバック

目の前にあるものをどう使うのか、どうやって解釈するのかについての章です。
制約とは大きさが同じの丸い穴と四角い棒と丸い棒があったら、丸い棒を穴に刺すでしょう。四角い棒が丸い穴に入らないのがわかるからです。このようにデザイン的に制約をつけておくことで人の行動を促すことができます。
発見可能性とはそのようにするもの、という指示が見つけられるかどうかということ。先ほどの例が微妙にサイズの違う丸い棒二つだったらどうでしょうか? おそらく二本とも刺してみて、より穴にぴったりな方を選ぶことになるでしょう。もっとわかりやすくするためになにか工夫しなければならないです(例えば、穴と棒に同じ名前を付けておくとか)
フィードバックはなにかアクションをしたとき、反応が返ってくるか、自分の操作が正しかったのかどうかわかるように、反応を返すことです。エレベーターのボタンを押して、光らないと何度も連打してしまう。フィードバックがないので、自分の操作が伝わっていないのではないかと思ってしまうからです。
制約ですべてを伝えきれればよいですが個々人の慣習などによってその制約は解釈が変わる可能性があります。なるべくターゲットにしている使い手が発見可能なデザインであり、触った後に反応する(フィードバックを返す)ことが重要です。
Tableauのダッシュボードだと、もしパフォーマンスが悪くてフィルターをいじってもいつまでも動かなかったら動いているのか心配になりますよね。
なるべく触ったらすぐフィードバックを返せるようなデザインを心がけておくことが大切です。


第5章 ヒューマンエラー? いや、デザインが悪い
第6章 デザイン思考

この2章はとても面白い章なのですが、Tableauの使い方の観点ではあまり関係なかったので割愛します。なにかが起こった時、それが起こったのは人のせいではなく、改善するためにとれるアクションをデザインで解決しようというアプローチや、デザイン思考とはなにかということが書かれているので興味がある方はぜひ本を読んでみてくださいね。


第7章 ビジネス世界におけるデザイン

ここまで、理想のデザインとは何かについて書かれてきましたが、商品としての製品を作るときのデザインの制限(最高のデザインをいろんな枷があって作ることができないとき。時間的なものや量産の問題、競争圧力など)が実世界にはあるよ、というビジネスにおいてのデザインについて書かれています。
主に新製品を開発する観点からの解説ですが、Tableauというひとつの製品を取り扱う私にとってもすごく参考になりました。
ひとつは急進的なイノベーションと斬新的なイノベーションの話。既存のものから進化してゆっくりとした変化をしていく斬新的なイノベーション。これは今ある人の生活を良くし、イメージが付きやすいの受け入れられやすいです。
急進的イノベーションは今までなかったものを出し、人の生活を劇的に変化させるものです。受け入れられる可能性は斬新的イノベーションよりはるかに低く、消えてしまうものもありますが、受け入れられれば、人々の生活をパラダイムシフトさせることができます。
Tableauが斬新的か、急進的イノベーションか、判断はみなさんにお任せしますが、どちらの変化も人には必要です。

それから、チェスで強い人間や強いコンピュータではなく、コンピュータをうまく使いこなす人間が勝てるという節も印象的です。まさにAIや機械学習、様々なオートメーションが台頭してくる中、どちらか一方が最高レベルというより、これらのテクノロジーをどれだけ有効に活用できるかがその人の能力を決めることになり、その人やコンピュータ自身は単体で最強である必要はなく、「テクノロジーの有効活用」つまり「外界の知識をどれだけ有効に使えるか」ということそのものが強い力として今後台頭してくることになるということですね。
まさにTableauを使いこなすみなさんが、日々世界を変えていることそのものだなと思いました。


かなり長くなってしまいましたが、じっくり読んだので備忘録がてらまとめてみました。最近私の話を聞いた人はこの本に相当影響受けてるなというのがバレると思いますが(笑)本当に自分の考え方からごっそり整理され、腑に落ちたり、AHAモーメントの連続の良い本でしたので、もしこの記事を読んで興味を持っていただきましたら読んでみてくださいね。

それでは!
(次はもうちょっと間をあけずに書きたいな、な)
KTより

ジッターチャートの作り方(重なりのあるマークをずらして表示)


Nanaeです。こんにちは。
今回はジッターチャートをご紹介します。ジッターチャートは、円のグラフや箱ひげ図の応用版です。(これ↓)

あるメジャーの分布や外れ値をみたいとき、箱ひげ図を使うことは多いと思います。


箱ひげ図を使った場合、全体としてマークが多い部分や外れ値はわかりますが、マークが多いと箱ひげ以上の情報が把握しづらく、どれくらい重なっているのかわかりません。また、上の方や下の方のマークにどんな項目があるか知りたくても重なりすぎているとマウスオーバーできず確認が難しいです。このあたりの不都合を解消するのがジッターチャートです。

ジッターチャートとは、近くにマークが集中して重なり合っていても、マークをランダムにずらして、ひとつひとつのマークを認識しやすくしたチャートです。ジッターとは「微小な不規則な動き」という意味で、マークをわずかにずらして表現することからジッターチャートと呼ばれているようです。
上図の箱ひげ図の円を各年の中で左右にランダムに配置をずらすため、各年で横方向に軸を作って、縦長の散布図を年数分作るような処理をします。
横軸となる計算フィールドには、ランダムで揺れを作るために、各マークに番号を振り(index関数)、それを13(←数字は13でなくてももちろん良い)で割った余りを出します。
 

これを列に入れ、列のヘッダーを非表示にし、幅を狭め、書式設定で見た目を調整すれば完成です。


ツールヒントと併せて活用すると、ひとつひとつのマークを確認しやすいですね。


さらに、パラメータで項目を選択できるようにして、選択した項目のマークだけを目立たせるようにしても見やすいです。このVizでは、パラメータと一致した項目のサイズを変え、一致した項目のみラベルを中央に出しています。詳しくは、Tableau Publicからダウンロードしてご確認ください。


Nanae


たった3クリック!積み上げ棒グラフをあるセグメントでソートする


Nanaeです。
 
積み上げ棒グラフを作ったとき、ある色セグメント(ある項目)で並び替えたいこともあると思います。ふつう計算式で対応すると思いますが、アドホックに分析しているときはグラフ上で操作した方が早いし簡単です。
 
では、このグラフを、オレンジのファーストクラスで地域の棒を並び替えてみます。
 
 
1クリック目:オレンジの棒のどこかを押す


2クリック目:ツールヒントの中で、並び替えをしたいファーストクラスを押す


 

3クリック目:降順マークを押す

 
完成!

 
九州は、全体の売上に対して、ファーストクラスの売上が少ないことに気づきます。でもそれを確認するなら、割合を表す100%積み上げ棒グラフにした方がわかりやすいです。合計に対する割合で表現しながらある色セグメントで並び替えたいとき、計算式で対応すると少し複雑になりますので、今回お伝えした方法のメリットが活きてくると思います。

以上、10.3の新機能、ツールヒント内の選択機能を使ったアドホック分析の実用シーンのご紹介でした。

Nanae 

 

ハイライト表でNULLにも色を塗る

Nanaeです。大変お久しぶりです。

今回は、ハイライト表を作ったとき、データが存在しないセルにも色を塗るTipsです。

白くなっているところはデータがないから色が塗られないわけなので、色を塗りたいところのデータをビュー上で生成します。 そのとき、表計算を行うことで、表全体のすべてのセルに数字を持たせることができます。他の関数でもよいですが、index()を使ってみます。


このフィールドをどこかのシェルフ(列とか詳細とかツールヒントとかフィルターとか…)に入れます。すると、白かった部分も黄色に色が塗られます。

では、Index()のフィールドをツールヒントに入れてみます。空白のセルにも、ツールヒントで確認するとindex()に数字が入ったことがわかり、これによって色が塗られました。


ツールヒントではなく、フィルターに入れて特別→全ての値にした方がきれいですね。


これで完成です!


See you!
Nanae