じんたんのブログ

シカゴでの研究留学生活、その関連情報を記載していきます。

統計

Tableau使ってみた!!

最近米国の死亡統計等を扱うことが多く、時間的変化、人種格差、性差などを調べています。ただ、地域差というものも非常に重要で、どうしても黒人の多い地域(南部)はStroke beltと言われているように、心血管死亡が他の地域と比べて多くなっています。 そ…

Stataのframeを使いこなす

以前にも記載しましたが、StataとRの大きな違いとして、データテーブルをStataでは複数表示が出来ないのに対して、Rでは複数同時に表示できるので、作業がしやすいという大きな違いがあります。 したがって、Stataを最近でも主に使用していますが、あるデー…

Multiple Comparison Procedures

www.amazon.com 本日も上記書籍の勉強+まとめ。 今回はp137 - 144のMultiple Comparison(多重比較)に関してまとめます。 有意水準(Significant level)を5%に設定して検定を行うことが多いと思いますが、これは5%の確率で本当はないのに有意差があると判断…

JAMA Guide to Statistics and Methods

www.amazon.com 本当に本書に出会って良かったなーと思う今日この頃です。 本書の特徴としては 1、臨床医が臨床論文を読む際に必要な統計手法が広く浅く網羅されている。 2、一つのChapterが6ページ前後に非常に簡潔にまとまっている。 3、英語が非常に平…

Multiple Imputationについて

jamaevidence.mhmedical.com 本日はp153 - 159の「Multiple Imputation: A Flexible Tool for handling Missing Data」について学習したので内容をmemo. 本章ではMissing dataのimputation方法の中でもMultiple imputationに焦点を当てて記載されている。 「…

欠損値に関して

jamaevidence.mhmedical.com 上記本のMissing data(p89 - 95)に関して本日は読んだのでMemo。 欠損値の原因: 1、患者の未受診 2、フォローアップの未受診、連絡困難。 3、情報源のデータ欠損 4、データが使用制限、アクセス困難(行っていない検査デ…

Composite endpoint (複合エンドポイント)に関して

www.amazon.com 今日はComposite endpoinntに関して読む時間があったので、内容を要約。 Composite endpoint(複合エンドポイント)の定義: 二つ以上のOutcomeを一つのOutcomeとして使用すること。 よく知られているものとしては 1、ASCVD: Athrosclerotic…

Survival analysisの解釈時の注意点

www.amazon.com 時間がある時に復習もかねて上記本を1 chapterずつ読んでいるのですが、Survival analysis、特にKaplan Meier CurveやCox proportional hazard modelの解釈に関して、理解が抜け落ちていた部分があったのでメモ。 1. これは有名な話ですが、K…

"R" と "Stata"

統計ソフトをどれを選ぶかというのは実はその後を左右する非常に大きな問題になります。 ノースウェスタン予防医学講座は疫学、統計等から構成されていますが、統計ソフトの主流はSAS、続いてRです。なので、解析で質問等に行くと、RかSASが使えるかをまず聞…

統計ソフト

統計ソフトは色々あります。 R: タダなもので有名なのがRです。非常に汎用性が高く、Flexibleな解析が可能なのが特徴で、Rstudioを使用することで、R単独で使用するよりもはるかに簡単に使用できるようになっています。ただし、Codingを身に付けるのに時間…