生存曲线是统计与生物学领域中常见的一种曲线,用来表示一个群体或个体在某种事件或疾病下存活的时间分布情况。Python中可使用生存分析库lifelines来画生存曲线。
# 导入必要的库 import pandas as pd import numpy as np import matplotlib.pyplot as plt from lifelines import KaplanMeierFitter # 创建数据集 df = pd.DataFrame({'time': [5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15], 'event': [0, 0, 1, 0, 1, 1, 1, 1, 1, 0, 1]}) # 创建KaplanMeierFitter对象 kmf = KaplanMeierFitter() # 对数据进行拟合 kmf.fit(df['time'], event_observed=df['event']) # 画图 kmf.plot() # 为生存曲线添加标签、标题等 plt.xlabel('Time (days)') plt.ylabel('Survival probability') plt.title('Survival curve') plt.show()
代码中,我们首先导入必要的库,包括pandas、numpy、matplotlib和lifelines。然后,我们创建一个数据集,其中包含了每个单位所受到的事件和时间。接着,我们创建了一个KaplanMeierFitter对象,对数据进行拟合。最后,我们使用.plot()方法画生存曲线,并对曲线添加标签、标题等。
使用lifelines库可以方便地创建和画出生存曲线,用户可以根据具体需求调整曲线样式、添加标签等。通过分析生存曲线,我们可以了解到群体或个体在某种事件或疾病下的存活情况,从而指导我们的研究和实践。