じんたんのブログ

シカゴでの研究留学生活、その関連情報を記載していきます。

Tableau使ってみた!!

最近米国の死亡統計等を扱うことが多く、時間的変化、人種格差、性差などを調べています。ただ、地域差というものも非常に重要で、どうしても黒人の多い地域(南部)はStroke beltと言われているように、心血管死亡が他の地域と比べて多くなっています。

 

そこで、State毎、County毎の年齢調整死亡率を地図上の濃淡で表せたらインパクトがあるので、Stataを使用して試みましたが、地図がなかなかダウンロードできない上に、データが変わるとまたCodeを調整したり、軸の単位の変更をしたりと結構めんどくさいものでした。そこで、簡単にデータを可視化できるソフトがないかと調べていたところ、友人が紹介してくれたのが、Tableauです。

 

TableauはData visualizationで着目されており、R、Pythonなどとは異なり、Click and Dragで専門的なCodeを必要としないことが特徴です。複雑な統計解析などはできないのですが、R・Python・Stata等でデータを可視化するよりも短時間で可視化できるというメリットがあります。

 

また、通常購入だと一年で10万円近くしますが、学生・大学教員の方は一年毎の更新が必要ですがAcademic versionをタダで契約できます。

www.tableau.com

 

Academic版は大学の学生・教員出ることの証明を提出する必要がありますが、驚くことに書類提出後1時間でプロダクトキー含めて送っていただきました。

ダウンロードは非常に簡単で、Excel fileのインポートも非常にスムーズでした。

Geographical mapを作成したかったので、まずは米国の死亡統計を使用して、年齢調整死亡率を描画してみました。

ここで多少手間取ったのは、アラスカとハワイが下記の図のように初めからなってはおらず、アラスカとハワイが入っていることで、カナダ、メキシコや太平洋が広範に入り込んでしまいます。そこは、

How to show Hawaii and Alaska near Continental US in Tableau - YouTube

youtubeビデオが非常に参考になりました。下記の地図を作成するのに、Tableau使用初日であったにもかかわらず、1時間ちょっとで終了しました。

f:id:Jinkei:20210122122038j:plain

米国の心血管疾患の年齢調整死亡率の地理的格差

そこで、調子に乗って、日本の地図データも作成してみたいなと思い、Tableauを調べてみると、郵便番号7桁を使用した、詳細な地図の描写ができることが判明しました。

Tableau 2018.2 新機能紹介:7桁郵便番号がジオコーディング出来るようになりました #tableau | Developers.IO

 

そこで、郵便局のホームページから石川県の郵便番号をダウンロードし、いざ同じ方法で描画しようとするのですが、なぜかアメリカにplotが何点かされるだけで、日本の地図は全く描画されません。下記の通り、郵便番号という変数に郵便番号を割り当て、整数を文字列に変更したり色々しましたが、全くだめです。

f:id:Jinkei:20210122121653p:plain

郵便番号の設定

 

途方にくれていた時に、偶然マップ上で右クリックをすると、場所を選択するところがあり、米国でTableauをダウンロードしたため、対象国が米国になっていることが判明しました。そこで、日本を選択し直し、いざ気を取り直してやってみると、、、、

f:id:Jinkei:20210122123301p:plain

国の選択

やった!!!できました!!郵便番号で指定された町がdotとして地図上にプロットされました!!

f:id:Jinkei:20210122123620p:plain

石川県のプロット

日本地図を使用するのに、2時間以上の時間を要したので、本日はこれで終了としましたが、慣れればあっという間に地図の作成が可能だと思います。これはR・Python等にはない速さだと思います。データクリーニング等はTableau prepというのがあるらしいのですが、自分の場合は、Stataによるデータクリーニングに慣れているので、あまり使用しないかもしれません。ただ、食わず嫌いは嫌なので、一度使用して見ようと思います。

 

今回のパール:

場所の選択を忘れると、地図が描画できないので、注意しましょう!!