孔媛媛教授:如何实现肝病预后的精准预测?_中欧体育app全站_zoty中欧体育官网

中欧体育app全站.孔媛媛教授:如何实现肝病预后的精准预测?

发布时间:2024-03-03 01:05:12 来源:zoty中欧体育官网 作者:zoty中欧体育 中欧体育app全站

  我国慢性乙型肝炎(CHB)患病率高,并发症重。抗病毒治疗可以降低乙型肝炎相关并发症的发生率和病死率,但即使经过有效的治疗仍有部分患者出现疾病进展,包括门静脉高压相关并发症和肝癌,甚至导致死亡

  3月25日,在第二届中国肝病创新论坛上,首都医科大学附属北京友谊医院临床流行病学与循证医学中心主任孔媛媛教授从统计学角度深入阐述了实现肝病预后精准预测的可行性分析,《国际肝病》特将报告内容整理如下,以飨读者。

  临床预测模型又称临床预测规则,是指利用医学征兆、症状或其他临床发现预测特定疾病或结局发生的概率,包括诊断模型和预后模型,而CHB临床终点事件预测模型属于预后类模型。目前国内外已有较多预测CHB患者临床终点事件的风险预测模型,但被临床广泛应用的模型较为少见。很多预测模型在开发过程中存在一定的方法学缺陷,导致模型的精确性和外推性不高,多数预测模型长期处于“多数被建立,少数被验证,极少被应用”的情况[3-4]。

  从预测模型的完整生命周期来看,建立模型和验证模型是不可分割的。通常情况下,临床预测模型开发基本可以分为九个步骤[5],包括确定研究问题、选择研究设计、筛选和处理预测变量、模型开发和评估、模型内部验证和外部验证以及模型结果的展示和报告等。

  1、确定研究问题:确定预测模型的研究问题要从临床实践出发,从而确保构建出的模型能够真正为临床科学决策提供帮助。

  目前国内外关于CHB患者的预后模型主要以肝细胞癌(HCC)为结局,多数HCC预测模型在未经治或混合人群中开展[6-7]。在研究对象是否接受抗病毒治疗方面:GAG-HCC、NGM-HCC及REACH-B模型是基于未进行抗病毒治疗的CHB患者,mREACH-B、PAGE-B、mPAGE-B、CAMD、REAL-B等模型是基于经治患者人群,CU-HCC、LSM-HCC及RWS-HCC模型则同时包含了接受抗病毒治疗和未抗病毒治疗的混合CHB患者人群。各模型构建人群的关键特征,例如是否接受抗病毒治疗与肝硬化状态,差异性较大。因而,在模型应用时需要充分考虑到目标人群的基本关键特征。

  需要注意的是,现有HCC预测模型缺乏系统性验证,近期开发的模型未行广泛验证,HCC预测模型头对头比较的效果如何尚不清楚,而指南或推荐也没有明确指出哪个模型更优,这给临床选择带来了困扰。为此,北京友谊医院(BFH)队列研究对现有CHB患者HCC预测模型(2019年10月之前发表的14个模型)进行了外部验证,该队列研究涵盖了临床常用的诊断指标(图1)。

  预测模型的外部验证涉及到的统计分析指标包括五类:①描述性统计,这是基础;②区分度(Discrimination),不可或缺的指标;③校准度(Calibration),例如Calibration plot和Brier score,不可或缺的指标;④临床效果(Performance),例如灵敏度、特异性、阳性预测值、阴性预测值;⑤预测稳健性(Robustness),例如亚组分析(人种、是否治疗或肝硬化、基线ALT水平升高或正常等),灵敏度分析(完整数据集、填补数据集)。

  关于区分度,待验证模型需提供预测变量的赋值方法,计算外部验证队列患者个体的风险评分(相对风险)和总体的AUROC。研究显示[8],在BFH外部验证队列中,REAL-B区分度最高,3年区分度为0.76(0.69,0.83),5年区分度为 0.75(0.70,0.81);其次为CAMD,3年区分度为0.75(0.67,0.83),5年区分度为0.72(0.66,0.78),详见图2。

  关于校准度,待验证模型需提供完整信息,包括预测变量的赋值方法及评分对应的风险概率、或完整含权重(回归系数)和基础生存率的完整公式。计算外部验证队列患者个体的风险概率(绝对风险)。数据显示,REAL-B和CAMD在BFH外部验证队列中校准度较好。3年Brier得分分别为0.066和0.031;mPAGE-B可能高估HCC风险(图3)。

  关于临床效果,待验证模型需提供预测变量的赋值方法和风险分层界值,计算外部验证队列总体的灵敏度、特异性、阳性预测值和阴性预测值。例如报告风险评分计算方法及风险评分的截断值,可进行临床效果的计算,大部分HCC预测模型灵敏度较高(约为90%),特异性较低(约为30%),图4。

  我国正逐步进入CHB全面抗病毒治疗时代。近年来,随着多部诊疗指南共识权威发布,符合抗病毒治疗指征的患者比例逐渐增大(图5)。但CHB长期抗病毒治疗后各关键预测指标显著变化,长期抗病毒治疗后,CHB预测模型适用性如何呢?采用长期抗病毒治疗后预测变量的检测值,未抗病毒治疗人群中开发的HCC预测模型,预测效果变化趋势如何?主要基于变量基线检测值开发的HCC预测模型,预测效果变化趋势如何?

  为此,北京友谊医院队列继续进行模型动态评估研究,评估了17种HCC预测模型(除前文提及的14种模型,新增aMAP、CAGE-B和SAGE-B模型)在CHB患者抗病毒治疗2.5~5年后对其后3年HCC风险预测的效果。目前研究正在进行中。

  现有数据显示,17种HCC预测模型基于治疗后2.5~5年的模型变量的检测值,预测后续3年内HCC风险的效能较低;模型中含有肝硬化变量的HCC风险预测效能相对较高,基线或治疗过程中肝硬化状态持续仍是治疗后重要的HCC预测指标。

  孔媛媛教授表示,后续研究还将深入挖掘长期抗病毒治疗后,模型预测效能下降原因;探索基于现有模型调整预测效能的方法,例如预测指标界值调整,预测指标权重校正,引入新的预测指标。

  孔媛媛教授强调,“outcome-based”统计学与“data-driven”数据科学优势融合,结果导向和数据驱动的完美结合,可助力解决更复杂的临床需求。

  随着精准医学和大数据时代的到来,如何实现对乙型肝炎临床终点事件,尤其是抗病毒治疗后终点事件的精准预测成为亟待解决的科学问题。最新研究观点提示,新型结局指标,如多结局终点可更精准地评估多类临床事件的治疗效果,甚至实现个体化精准预测,后续可尝试用于肝硬化患者预后评价(图6和图7)。

  总的来说,无论是建立模型还是验证模型,评估模型基本上分为三个维度的评估:诊断或预测效能评价、模型统计学评价和卫生经济学评价(图8)。而重分类改善指标(NRI)和综合判别改善指数(IDI)的应用定量地解决了两个模型诊断效能比较的问题,可以定量评价一个指标比另外一个指标诊断效能改善情况。NRI为某界值下一个指标比另一个指标诊断准确率提高多少;IDI考虑了不同界值下指标的整体情况,可以代表指标(模型)的整体改善情况。在卫生经济学评价中两个指标的应用价值更高,NRI和IDI可以更加方便地计算成本效益,是传统指标不具备的功能,预计将会广泛用于卫生经济学研究中。

  我们相信,随着预测模型构建的方法学规范化,临床终点评价标准的精细化,以及人工智能技术在临床研究的深入应用,一定会有助于加速实现慢性乙型肝炎临床终点事件精准预测的目标。

产品说明书