じんたんのブログ

シカゴでの研究留学生活、その関連情報を記載していきます。

Proportionality assumptionの評価に関して

 Cox proportional hazard modelは生存解析で頻用される解析手法ですが、この手法を使用して良い前提条件をどのように評価するかということに関しては、Publishされた論文内でも1-2行程度で表記が済まされているケースも多く、実際評価していないであろう論文もよく見かけます。

 そこで、今回は数式なしで重要な点のみ簡単にまとめようと思います。

 

評価方法自体は大きく分けて3つあります。

  1. Graphical assessmen(log-log plot)  
  2. Goodness of Fit test
  3. Time-dependent variables

 

 1. Graphical Assessment (log-log plot)

カプランマイヤー 曲線のY軸に対してlogを2回とると、Proportionality assumptionが満たされていれば、2つのグラフの差が時間に関係なく常に一定となることになることを視覚的に評価します。

Proportionality assumptionが満たされなければ、2つの直線は

①交わる ②どんどん時間経過と共に開大する

のどちらかが認められます。

本評価方法の欠点としては、グラフの判断がどうしても主観的になるため、客観的な評価が難しいということになります。

また、連続変数は2値変数に変換しなければならないので、どの値で2値変数に変換するかで、結果が大きく変わってしまうこともあります。

 

Stataではstphplotを使用して、以下の方法で評価可能です。

stphplot, by(2値変数) adjust(variable1 variable2 . . . . )

 

例:

f:id:Jinkei:20191224053842p:plain

log-log plot 1

f:id:Jinkei:20191224053930p:plain

log-log plot 2

f:id:Jinkei:20191224055029p:plain

log-log plot 3

Plot1はGenderによるlog-log plotですが、時間に関係なく、2つのグラフはほぼ完全に一致(差が常に一定)しています。したがって、このグラフからはproportionality assumptionを満たしていると考えられます。

Plot 2はplot1と比較すると、時間により2つのグラフの間隔が一定ではない、つまりPropotionality assumptionが満たされていないことが予想されます。ただし、ほとんどの部分では間隔が一定であり、violationは小さいと判断されます。

Plot3は一見するとPlot1と全く同様に見えてきますが、よくみてみると2つのグラフが交差していることがわかります。恐らくはProportionality assumptionが満たされていないことが予想されます。

 

2. Goodness of Fit test

Shoenfeld residualsを使用した方法で、Proportionality assumptionが保たれていれば、Schoenfeld residualsは時間に無関係となることを使用する方法です。

StataではScaled Shoenfeld residualsという少し異なった手法を使用していますが、大筋は変わりありません。

本邦はグラフによる評価とは異なり、p値を用いて評価できる点で主観が入りづらいことが挙げられます。しかし、p値はSample sizeが大きくなると小さくなるため、軽度のViolationでも統計学的に有意になってしまうという欠点があります。逆にSample sizeが小さければ、大きなViolationでも見逃してしまうことがあります。

Stcoxで評価したいvariable (var)を含んだモデルと作成し、そのごstphtestでp値を評価できます。

stcox var1 var2 var3 . . . . . . 
stphtest, detail

 

 

例:

f:id:Jinkei:20191224055336p:plain

stphtest

doacとage1でp値が有意であることがわかり、proportionality assumptionが満たされていないことがわかります。これは上記グラフの結果と一致しています。

 

3. Time-dependent variables

時間依存性変数として評価することで、これが統計学的に有意であれば、時間によって効果が変わる=Proportionality assumpitonを満たさないことになります。

 

欠点としては、モデルに含める変数を変えると、結果が大きく異なる可能性がある点に注意が必要です。また、上記の通り、p値はSample sizeに大きく影響を受けることも忘れてはいけません。

 

Stataではstcoxによりモデルを作成し、Optionでtvc(time-varying covariates)を設定することで、評価したいvariableを全て一気に評価可能です。

stcox var1 var2 var3 . . . . , nohr nolog noshow tvc(var1 var2 var3. . . . . )

stcoxの後ろのvarと、tvc内のvarは一致させれば、時間依存性の有無で結果がどう変わるのかを全てのVariableで比較できます。

 

例:

下記のtvcの結果を見ると、age1とdoacで共にp値が有意に低いことがわかります。したがって、proportionality assumptionが満たされていないと判断されます。今回の結果は、Graphical assessmentとGoodness of Fit testと一致しています。

f:id:Jinkei:20191224054616p:plain

Time-varying covariates

 

まとめ

一つの手法でのみ評価するのではなく、3つとも評価を行い総合的に判断する必要性があります。ただし、極端にviolationを認めない限りは、Proportionalityが保たれていると考えるのが良いようです。

今回の解析ではage1とdoacが2, 3で共に有意であることが判明し、一方、gender1については全ての解析結果でproportionality assumptionが満たされていることがわかります。

また、age1はグラフが何度か交差しているので、Graphicalにもproportionality assumptionが満たされていないと考えられ、3つの解析で全て満たされていないのでviolationと判断できます。一方、doacはgraphicalにはほぼproportionality assumptionが満たされており、判断が難しいと言わざるを得ません。

 

 

参考文献:

David G. Kleinbaum, Mitchel Klein. Survival Analysis: A Self-Learning Text, Third Edition