XLSTAT によるカプランマイヤー曲線:新薬が患者の生存期間に与える影響を評価する

目次

カプランマイヤー曲線とは?

カプランマイヤー曲線は、時間経過に伴うイベント(例えば、死亡、病気の再発、製品の故障など)の発生率を分析するために広く用いられる生存時間分析の手法です。具体的には時間の経過とともに累積生存率(生存分布関数)がどのように変化するのかをグラフで視覚的に表現します。グラフの横軸は時間、縦軸は累積生存率を示します。

例えば、新薬の効果を検証するために、薬の投与を開始した日を起点として、死亡または病気の再発などが発生した日をイベント発生日として記録し、カプランマイヤー曲線を描くことで、新薬が患者の生存期間に与える影響を分析することができます。

また、新薬だけでなく、従来の薬を投与したグループのカプランマイヤー曲線と比較することで、新薬が従来の薬と比べてどれだけ患者の生存期間に影響を与えるのかを判断するのにも役立ちます。

カプランマイヤー曲線で用いられる用語

累積生存率(生存分布関数)

累積生存率とは、ある時点まで特定の出来事が起こらずに生存している確率のことで、各時点での生存率を掛け合わせることで計算されます。例えば、ある人が交通事故に遭う確率を1日あたり10%とすると、今日から3日目が終わるまで交通事故に遭わない確率は、「90%×90%×90%=73%」となります。時間の経過とともにイベントが発生する可能性は高まるため、累積生存率は低下していきます。

3日間の累積生存率
=1日目の生存率×2日目の生存率×3日目の生存率
=(1-1日目の死亡リスク)×(1-2日目の死亡リスク)×(1-2日目の死亡リスク)


打ち切り

打ち切りとは、研究の観察期間中に、対象者に関心のあるイベントが発生しなかった、あるいは発生したかどうかが不明な場合を指します。例えば、被験者からの辞退やコンタクトが取れなくなったなどの理由で研究から脱落した場合が当てはまります。また、期間中に脱落していなくても、研究終了時にイベントが発生しなかった場合は打ち切りデータとして扱います。カプランマイヤー曲線では、各イベント発生時点における生存率を計算する際に、打ち切りになった人数を分母から除外することで、打ち切りデータを考慮します。こうすることで生存率をより正確に見積もることが可能になっています。


生存期間中央値

生存期間中央値とは、累積生存率が50%になる時間を示します。グループ間の生存時間を比較する際に重要な指標となります。


特定時点の累積生存率

横軸の特定の時点から垂直に線を引いて曲線との交点を求め、縦軸の値を読み取ることで、その時点の生存確率を推定できます。生存期間中央値と同じくグループ間の生存時間を比較する際に用いられます。

カプランマイヤー曲線を実行するためのデータセット

今回は、ある疾患の患者42人を新薬(21人)と標準治療(21人)のグループに分け、疾患の再発までの時間を記録したデータを使用します。

カプランマイヤー曲線を実行するためには、2種類のデータが必要になります。

  • 時間
    疾患の再発があった被験者の場合は、そのイベントが発生した時間を記録します。期間中に疾患の再発がなかった、または途中で脱落した被験者の場合は、被験者が観察された最後の時間を記録します。
  • イベント
    イベント発生の有無を2値データ(0/1)で記録します。今回の場合は、疾患の再発があったときは「1」を、期間中に疾患の再発がなかった、または途中で脱落したときは「0」と入力します。

今回は上記2種類のデータに加えて、グループの情報(「新薬」または「標準治療」)が記録されたデータセットを使い、新薬と標準治療の生存曲線を比較し、2群の生存率に違いがあるのかを確認します。

サンプルデータのダウンロードはこちらから

Kaplan-Meier-Survival-Analysis.xlsm

カプランマイヤー曲線の操作手順

  1. XLSTAT を起動し、[Life Sciences] > [生存期間分析] > [Kaplan-Meier解析] を選択します。

  2. ダイアログボックスが表示されるので、下記項目を指定します。

    • 時間データ:時間が入力された列を列名も含めて選択
    • 状態インジケータ:イベントデータが入力された列を列名も含めて選択
  3. [データ・オプション] タブに切り替えた後、[グループごと分析] と [比較] の項目にチェックを入れ、グループの列を選択します。

  4. [チャート] タブに切り替え、すべての項目にチェックを入れます。また、打ち切りデータのマークは「+」を選択します。

  5. [OK] をクリックすると計算が始まり、結果が別シート(Kaplan-Meier解析)に出力されます。

カプランマイヤー曲線の結果の解釈

記述統計(イベント)

最初の表には、各グループのデータの要約が表示されます。

  • 観察合計:
    各グループの被験者数
  • 故障合計:
    期間中に疾患の再発があった被験者数
  • 打ち切り合計:
    期間中に疾患の再発がなかった、または途中で脱落した被験者数
  • タイム・ステップ:
    イベント(再発・打ち切り)が発生した時間の数

Kaplan-Meier表

グループごとに生存分布関数などのいくつかの重要な指標を含むカプランマイヤー曲線の結果が表示されます。

①.Time
イベントまたは打ち切りの起こった時間が小さい順にリストアップされます。

②.リスク
各時間の開始時点での追跡者数

③.故障
各時間でイベント(疾病の再発)が発生した人数

④.打ち切り
各時間での打ち切り人数

⑤.故障比率
各時間でのイベント発生率。「③故障÷②打ち切り」 で計算されます。

⑥.生存率
各時間での生存率。「1-⑤ 故障比率」で計算されます。

⑦.生存分布関数 (SDF)
各時間での累積生存率。例えば、7か月後の累積生存率は、(1か月目にイベントが発生しない確率)×( 2か月目にイベントが発生しない確率)・・・(7か月目にイベントが発生しない確率)=1×1×1×1×1×0.857×0.941≒0.807


平均生存時間、四分位の推定、カプランマイヤー曲線図

各グループごとに平均生存時間と四分位の推定値が表示されます。分位数が50%の推定値が生存時間中央値を示しており、グループ間の生存時間を比較する際の指標となります。

カプランマイヤー曲線図ではイベントが発生している時点で階段が下がっており、打ち切りのあった時点で「+」のマークが表示されます。

また、「1-生存分布関数(SDF) 」のグラフは、累積生存率グラフの縦軸を逆転させたもので、生存率ではなく故障率(累積故障確率)を示しています。1から各時間での累積生存率を引いて計算できます。


生存分布関数の等質性検定と多重比較

生存分布関数の等質性検定では、2つ以上のグループ間の生存時間に統計的な差があるかどうかを確認できます。ログランク検定(log-rank)の結果を確認すると、p 値は0.0001未満なので、2群の生存率は異なるという解釈ができます。

今回は2群の比較ですが、3群以上の生存曲線を比較したい場合は、多重比較の結果を確認することで、どのグループ間で有意差があるのかを判断できます。

最後に新薬と標準治療グループの生存曲線を比較します。両社の曲線が平行であれば、グループ間の生存状況は類似していることを示し、曲線が交差したり離れたりする場合は、グループ間に生存率の差があることを示します。今回の場合は、両者の曲線は離れています。生存期間中央値も、標準治療グループが8か月であるのに対し、新薬グループが23か月とはるかに高いことがわかります。

これらの結果から新薬は標準治療薬と比較して、病気の再発までの時間に影響を与えるという判断ができます。

まとめ

カプランマイヤー曲線は、時間経過に伴うイベント発生率を分析する生存時間分析の手法であり、累積生存率をグラフで視覚的に表現できます。新薬投与群と従来薬投与群など、複数のグループ間でカプランマイヤー曲線を比較することで、生存期間に差があるかを判断できます。XLSTAT を利用すれば、エクセル上で簡単にカプランマイヤー曲線を作成でき、生存時間中央値や特定時点での生存率などの重要な指標を算出できます。また、ログランク検定や多重比較の結果も得られ、統計学的な裏付けに基づいた分析が可能です。

参考文献

  • 新谷歩: 今日から使える医療統計 第2版, 医学書院, 2025.

  • 新谷歩: みんなの医療統計 12日間で基礎理論とEZRを完全マスター!, 講談社, 2016.

XLSTAT の無料トライアル

トライアルでは、最上位グレード XLSTAT Premium に加え、3D Plot と LatentClass のオプションもご利用いただけます。本記事で紹介したカプランマイヤー曲線はLife Sciences と Premium のライセンスでご利用いただけます。

無料トライアルを申し込む

*トライアルは登録完了日に開始され、有効期間は14日間です。トライアルを更新または延長することはできません。

© 2024 USACO Corporation. All rights reserved.
ユサ株式会社
関連サイト