生存分析

Kaplan-Meier & Log-Rank 检验

输入事件发生时间数据以计算生存概率。您还可以比较两个组。

组1数据

实用示例

点击示例将数据加载到计算器中。

基础生存数据

单组

对治疗后患者生存时间的简单单组分析。

组1时间: 6, 7, 10, 15, 19, 25

组1状态: 1, 1, 0, 1, 0, 1

产品失效时间

单组

分析机械部件失效前的时间,部分样本在研究结束时仍在运行(删失)。

组1时间: 115, 152, 189, 210, 245, 290, 310, 310

组1状态: 1, 1, 1, 0, 1, 1, 0, 0

两种药物比较

两组

临床试验比较新药(组1)与标准药物(组2)患者的生存时间。

组1时间: 10, 12, 15, 20, 22, 28, 30

组1状态: 1, 1, 0, 1, 1, 0, 1

组2时间: 8, 9, 11, 14, 16, 21, 25

组2状态: 1, 1, 1, 1, 0, 1, 0

缓解期持续时间

两组

比较两种癌症治疗方案的缓解期持续时间。组1为新疗法,组2为对照组。

组1时间: 9, 13, 13, 18, 23, 28, 31, 34, 45, 48, 57

组1状态: 1, 1, 0, 1, 1, 1, 0, 0, 1, 1, 0

组2时间: 7, 10, 15, 19, 22, 26, 30, 35, 39, 42, 48

组2状态: 1, 1, 1, 1, 0, 1, 1, 0, 1, 1, 1

其他标题
理解生存分析:全面指南
深入了解事件发生时间分析、Kaplan-Meier估计和log-rank检验,理解生存数据的解释与比较。

什么是生存分析?

  • 事件发生时间数据
  • 删失的概念
  • 生存函数
生存分析是统计学的一个分支,用于分析一个或多个事件发生所需的预期时间,如生物体的死亡或机械系统的故障。这类分析又称为事件发生时间分析。生存数据的一个关键特征是经常存在‘删失’,即在研究结束时部分对象尚未发生感兴趣的事件。
生存分析的核心概念
要正确理解生存分析,需熟悉三个核心概念:事件发生时间、删失和生存函数。

生存数据示例

  • 从癌症诊断到死亡的时间。
  • 从机器安装到首次故障的时间。
  • 用户在取消订阅前持续使用服务的时间。

Kaplan-Meier估计

  • 计算生存概率
  • 构建生存曲线
  • 解释中位生存时间
Kaplan-Meier估计(又称乘积极限估计)是一种非参数统计方法,用于根据事件发生时间数据估计生存函数。它是医学研究中最常用的生存分析方法之一。Kaplan-Meier曲线是该估计的图形表示,显示随时间变化的生存概率。
工作原理
计算过程包括一系列步骤。在每个事件发生时,通过将前一时刻的生存概率与该时刻的条件生存概率相乘来重新计算生存概率。删失对象在删失前被视为‘风险中’,但不计入事件数。

Kaplan-Meier分析的主要输出

  • 在每个事件时间点下降的阶梯状生存曲线。
  • 显示不同时间点生存概率的表格。
  • 中位生存时间,即生存概率为50%时对应的时间。

计算器使用分步指南

  • 输入单组数据
  • 比较两组
  • 结果解读
本计算器简化了生存分析的过程。请按照以下步骤获取结果。
单组分析
  1. 输入时间:在‘事件发生时间’栏输入每个对象的事件发生时间,用逗号分隔。
  2. 输入状态:在‘事件状态’栏输入对应的状态,1表示事件发生,0表示删失。确保条目数与时间一致。
  3. 计算:点击‘计算’按钮查看生存表和中位生存时间。
两组比较
  1. 启用比较:切换‘比较两个组’开关。
  2. 输入两组数据:分别填写组1和组2的时间与状态。
  3. 计算:结果将显示每组的Kaplan-Meier分析及log-rank检验。

输入格式规则

  • 时间:5,8,10,12。状态:1,1,0,1。
  • 请勿有多余的逗号。
  • 时间与状态的数量必须一致。

Log-Rank检验

  • 比较生存曲线
  • 原假设
  • 卡方统计量
log-rank检验是一种用于比较两个或多个组生存分布的假设检验。它是一种非参数检验,适用于右偏和删失数据。原假设为各组生存分布无差异。
计算方法
该检验通过计算每个事件时间点各组的实际和期望事件数(在原假设成立下),并汇总得到卡方统计量。较高的卡方值(及较低的P值)表明生存曲线间存在显著差异。

P值解读

  • p < 0.05:差异有统计学意义,拒绝原假设。
  • p ≥ 0.05:差异无统计学意义,不能拒绝原假设。

实际应用与局限性

  • 临床试验与医学
  • 工程与可靠性
  • 假设与局限性
生存分析是许多领域的有力工具。
应用场景
  • 医学:比较新治疗与安慰剂的疗效。
  • 工程:确定机械部件的预期寿命(可靠性分析)。
  • 商业:分析客户流失或员工离职。
重要局限
log-rank检验的主要假设是两组的风险比在整个随访期间保持恒定,即风险比为常数。如果生存曲线交叉,该假设可能被违反,此时应考虑其他检验方法。此外,分析假设删失是非信息性的,即删失原因与结局无关。

需注意的情形

  • 当生存曲线交叉,违反比例风险假设时。
  • 存在未纳入分析的重要混杂变量时。