XLSTAT によるCox 比例ハザードモデル:生存時間に影響を与える要因を分析する
- Cox 比例ハザードモデルとは?
- Cox 比例ハザードモデルを実行するためのデータセット
- Cox 比例ハザードモデルの実行手順
- Cox 比例ハザードモデルの結果の解釈
- まとめ
- 参考文献
- XLSTAT の無料トライアル
Cox 比例ハザードモデルとは?
Cox 比例ハザードモデル(Cox 回帰)とは、生存時間分析において、ある事象(例えば、死亡や病気の再発など)が発生するまでの時間に影響を与える要因(説明変数)を解析するための統計手法です。具体的には、各説明変数がハザード比(ある時点での事象発生のリスクの比)に与える影響を推定します。
Cox 比例ハザードモデルの具体例
- 患者の生存時間に影響を与える要因を特定する(例:年齢、性別、治療法など)。
- ある治療法が他の治療法よりも生存率を向上させるかどうかを評価する。
Cox 比例ハザードモデルを実行するためのデータセット
XLSTAT でCox 比例ハザードモデルを実行するためには、以下のデータが必要です。
- 生存時間データ:イベントが発生するまでの時間を記録したデータ
- イベントデータ:観察期間中のイベント発生有無について記録したデータ
- 説明変数:生存時間に影響を与える可能性のある要因(量的変数、質的変数)のデータ
今回は、卵巣がんの治療に関する臨床試験データを使用します。
このデータには、患者26名の生存時間、治療法、年齢、ECOG パフォーマンスステータス*、残存疾患の有無が含まれています。今回はこのデータに対してCox 比例ハザードモデルを実行し、上記説明変数のうち、どの変数が患者の生存時間に影響を与えるているのかを確認してみます。
* ECOGパフォーマンスステータス(ECOG PS)
がん患者の全身状態を評価するための指標。患者が日常生活をどの程度制限なく送れているか、身体的な活動能力はどの程度か、といった点を0から4までの5段階で評価しています。
参照:国立がん研究センター がん情報サービス
https://ganjoho.jp/public/qa_links/dictionary/dic01/modal/Performance_Status.html
サンプルデータのダウンロードはこちらから
Cox-proportional-hazards-model.xlsmCox 比例ハザードモデルの実行手順
-
XLSTAT を起動し、[Life Sciences] > [生存期間分析] > [Cox比例ハザード・モデル] を選択します。
-
ダイアログボックスが表示されるので、下記項目を指定します。
- 時間データ:「生存日数」の列を選択します。
- 状態インジケータ:「状態」の列を選択します。
- 量的変数:「年齢」と「ECOG PS」の列を選択します。
- 質的変数:「治療群」と「残存疾患の有無」の列を選択します。
-
[出力] タブに切り替え、下記赤枠内の項目にチェックを入れます
-
[OK] をクリックすると計算が始まり、結果が別シート(Coxモデル)に出力されます。
Cox 比例ハザードモデルの結果の解釈
記述統計
各変数の記述統計量(平均、標準偏差など)が表示されます。
適合度検定
モデルの適合度を示す尤度比検定、スコア検定、ワルド検定の結果が表示されます。p 値が0.05 未満であれば、説明変数が生存時間に有意な影響を与えていると判断できます。
回帰係数
各説明変数の回帰係数、ハザード比、カイ二乗検定の確率が表示されます。回帰係数が正の場合、その説明変数の値が高いほどハザード(死亡リスク)が高いことを示しています。反対に回帰係数が負の場合、その変数の値が高い患者の予後が良好であることを示します。
- 数値(回帰係数):
説明変数が1増加したときのハザードの変化を表します。
- Pr > Chi2(カイ二乗検定の確率):
説明変数が有意な影響を与えているかどうかを示す確率です。0.05 未満であれば、有意な影響があると判断できます。
- ハザード比:
回帰係数の指数関数であり、説明変数が1増加したときのハザードの比を表します。ハザード比が1より大きければリスクが増加し、1より小さければリスクが減少します。
今回の結果では年齢のみが生存時間に有意な影響を与えていることが示されました。年齢のハザード比が1.13 であることから、年齢が1歳増加するごとにリスクが1.13倍増加することがわかります。
比例ハザード性の検定
Cox 比例ハザードモデルでは、各説明変数がハザード(ある時点でのイベント発生リスク)に与える影響が、時間を通じて一定であることを仮定しています。例えば、今回のデータで治療群別に生存時間曲線を描くと以下のようになり、2群間の生存時間曲線が同じような下がり方をしていることがわかります。
一方で以下のように2つの生存時間曲線がどこかの時点でクロスしている場合は、比例ハザード性が満たされていないという判断になり、Cox 比例ハザードモデルの結果の信頼性が低下してしまいます。
そのため、Cox 比例ハザードモデルを実行する際には、比例ハザード性の検定結果を必ず確認します。比例ハザード性の検定では、p 値が0.05 よりも大きければ、比例ハザード性が満たされていると判断します。
今回のデータでは、すべての説明変数においてp 値が0.05 を上回っているため、比例ハザード性の仮定が満たされていると判断できます。
予測
各データのリスクの予測値が表示されます。予測値は以下の計算式で求められます。
Xi は各観測値の変数値、βi は Cox モデルから推定された係数です。予測値が0 よりも大きい場合は、リスクは平均よりも高く、0 よりも小さい場合は、リスクは平均よりも低いという解釈になります。
生存分布関数
最後に累積生存率の曲線グラフが表示されます。
グラフの見方については下記ページをご参照ください。
XLSTAT によるカプランマイヤー曲線:新薬が患者の生存期間に与える影響を評価する
上記の結果から今回のデータで生存時間に有意な影響を与える変数は年齢のみであり、年齢が1歳増えると、リスクが1.13(ハザード比)倍増加するということがわかりました。
まとめ
Cox 比例ハザードモデルは、生存時間データを用いて、特定の事象が発生するまでの時間に影響を与える要因を分析する統計手法です。XLSTAT を使用することで、エクセル上で簡単にCox 比例ハザードモデルを実行でき、リスク要因の特定や、より適切な治療計画の立案につなげることができる可能性があります。
参考文献
-
Cox proportional hazards model in Excel tutorial
https://help.xlstat.com/6610-cox-proportional-hazards-model-excel-tutorial -
Cox Regression (Cox Proportional Hazards Survival Regression)
https://datatab.net/tutorial/cox-regression -
いちばんやさしい、医療統計. 比例ハザード性とは?検証方法と成立しない場合の対処法もわかりやすく紹介!
https://best-biostatistics.com/surviv/hirei-hazard.html#index_id1
XLSTAT の無料トライアル
トライアルでは、最上位グレード XLSTAT Premium に加え、3D Plot と LatentClass のオプションもご利用いただけます。本記事で紹介したCox 比例ハザードモデルはLife Sciences と Premium のライセンスでご利用いただけます。
無料トライアルを申し込む*トライアルは登録完了日に開始され、有効期間は14日間です。トライアルを更新または延長することはできません。