生存分析とは
生存分析(Survival Analysis)とは、ある事象(イベント)が発生するまでの時間を分析する統計手法です。もともと医学分野で患者の生存期間を分析するために開発されましたが、現在では顧客の離脱、機械の故障、従業員の離職など幅広い分野で活用されています。
打ち切りデータの扱い
生存分析の特徴は、打ち切り(Censoring)データを適切に扱える点です。観察期間中にイベントが発生しなかったデータ(右打ち切り)や、途中で追跡できなくなったデータも、通常の統計手法では除外しがちですが、生存分析ではこれらの情報を有効に活用します。
代表的な手法
カプランマイヤー法は生存関数を非パラメトリックに推定する手法で、生存曲線のグラフ化に広く使用されます。ログランク検定は2群以上の生存曲線を比較する手法です。コックス比例ハザードモデルは複数の共変量が生存時間に与える影響を回帰分析的に評価します。
ビジネスへの応用
サブスクリプションサービスのチャーン(解約)分析、製品の寿命予測(信頼性工学)、顧客のライフタイムバリュー推定、A/Bテストにおける長期的効果の分析など、時間を伴うイベントの分析にはすべて生存分析の手法が有効です。