超出你想象!高分预后模型构建别人R代码跑一天今天零_中欧体育app全站_zoty中欧体育官网

中欧体育app全站.超出你想象!高分预后模型构建别人R代码跑一天今天零

发布时间:2024-03-03 01:06:08 来源:zoty中欧体育官网 作者:zoty中欧体育 中欧体育app全站

  临床预测模型(Clinical Prediction Models),是指利用多因素模型估算患有某病的概率或者将来某结局发生的概率。临床预测模型包括诊断模型(Diagnosticmodels)和预后模型(Prognostic models)。

  诊断模型关注的是基于研究对象的临床症状和特征,诊断当前患有某种疾病的概率,多见于横断面研究。

  预后模型关注的是在当下的疾病状态下,未来某段时间内疾病复发、死亡,伤残以及出现并发症等结局的概率,多见于队列研究。

  常见的方法就是将队列分成2部分(通常按2:1的比例分组),然后使用第一部分的数据建立模型,用第二部分的数据来验证模型。这种方法的得到的结果往往会比较好,因为2个队列的人群很相似。

  时间验证和将整个队列根据时间顺序进行分组在本质上没有什么不同。但是时间验证是对模型的前瞻性评估,它独立于建模的数据和建模的过程,所以有时可以看作是外部验证。因此,时间验证是介于内部验证和外部验证之间的一种方法。

  本文一共有4个图2个表1个附图。作者首先构建免疫评分(IRSS)模型(图1),然后进行GO/KEGG富集分析(图2)以证明与免疫相关,并提供TCGA-ESCA的临床基线),分析模型的准确性(图3),最后通过TCGA-HNSC来验证模型的可靠性(图4),还通过GEO的胃癌数据进一步验证模型的可靠性(附图1)。

  【表达差异(挑)】 → 【差异分析】 → 【筛选分子】 → 选择【TCGA-ESCA】→ 选择【临床-status】并分组为Normal和Tumor → 【确认】

  【表达差异(挑)】 → 【火山图】 → 上传“DEG.csv” → 【确认】→ 下载结果即为图1A

  回到仙桃学术,【基础绘图】 → 【韦恩图】 → 上传“DEG and Immport.xlsx” → 【确认】→ 下载结果即为图1B

  回到仙桃学术,【基础绘图】 → 【韦恩图】 → 上传“Lasso data.xlsx” → 【确认】→ 【Excel表格下载】

  【临床意义(靠)】 → 【预后分析】 → 【[云]Lasso系数筛选】 → 将上一步韦恩图的交集基因粘贴到分子list → 【确认】,即可得到图1C

  这里记得【保存结果】方便绘制图1D,下载【RiskScore.xlsx】,方便后面绘制图1E

  【临床意义(靠)】 → 【预后分析】 → 【Lasso变量轨迹图】 → 选择刚刚得到的lasso结果 → 【确认】 → 即为图1D

  【临床意义(靠)】 → 【预后分析】 → 【风险因子图】 → 上传前面下载的“RiskScore.xslx” → 【确认】 → 即为图1E

  【功能聚类(圈)】 → 【GOKEGG】 → 【GOKEGG富集分析】 → 粘贴刚刚复制的基因名 → 选择【全部GO条目】 → 【确认】 → 保存结果为“GO”

  【功能聚类(圈)】 → 【GOKEGG】 → 【GOKEGG可视化】 → 选择【GO】 → 【确认】 → 即为图2A

  【基础绘图】 → 【生存曲线-二分类/数值/单组】 → 上传“KM.txt” → 分组选择【0-50 vs 50-100】→ 【确认】即为图3A,可【保存结果】或【下载图片】

  【基础绘图】 → 【时间依赖ROC】 → 上传“KM.txt” →选择预测年限【2年】【3年】【5年】 → 【确认】即为图3B,可【保存结果】或【下载图片】

  【临床意义(靠)】 → 【预后分析】 → 【预后列线图】 → 选择【TCGA-ESCA】→ 选择需要画入列线图的指标 → 选择预测年限【2年】【3年】【5年】 → 【确认】

  【临床意义(靠)】 → 【预后分析】 → 【预后DCA图】 → 上传“IRSS for DCA.xlsx” → 【确认】即为IRSS的DCA图。

  【临床意义(靠)】 → 【预后分析】 → 【单|多因素cox回归】 → 选择【TCGA-ESCA】→ 选择需要的指标 → 选择【OS】 → 【确认】即为表1

  图4是利用TCGA-HNSC来验证前面TCGA-ESCA的模型构建的准确性,因此,用类似图1-3的方法,将疾病换为TCGA-HNSC,即可画出图4。

  经过单因素cox、多因素cox和lasso回归分析,从诸多基因中筛选出6个基因建立了免疫风险的预后模型(IRSS)

  通过食管癌建立的IRSS模型,在头颈癌和胃癌等外部数据集来验证模型的准确性,将模型扩展到上消化道肿瘤

  文章基于免疫特征研究肝细胞癌 (HCC) 的分子分类及其预后价值。基因集富集分析 (GSEA)用于计算两个数据库(TCGA和RIKEN_JP)中 HCC的免疫途径评分。根据免疫特征将样本分了免疫高(Immunity_H)、免疫中(Immunity_M)和免疫低(Immunity_L)3个分类,并验证分类的可靠性和可预测性。

  通过挖掘GEO数据库中的头颈癌的单细胞测序数据,分析部分上皮间质转化(pEMT)相关的基因对患者预后的影响并构建预后模型,并通过TCGA数据库和自己临床样本来验证模型的准确性。

产品说明书