MSIsensor-ct:基于NGS数据监测血浆ctDNA中MSI状态的新算法

发布日期:2021-01-26

  2020年,NCCN指南明确将MSI作为结直肠癌的预后因子。就在本月初,求臻医学生信团队与美国圣路易斯华盛顿大学医学院合作开发了MSIsensor-ct,该算法在bMSI检测上取得了新的突破,在ctDNA的检测限0.05%以上展现出了100%的准确性。

  MSI是一个在不同癌种中基因不稳定的敏感提示器,包括了28%的子宫内膜癌、15%结直肠癌、22%胃癌。除此之外,免疫检查点抑制剂也可让MSI患者从中收益,在2017年和2018年,美国FDA批准了派姆单抗(pembrolizumab)和纳武单抗(nivolumab)作为无进展实体结直肠癌患者MSI的治疗药物。

  虽然目前已经有了一些基于NGS技术的MSI识别软件,但是由于肿瘤组织质量差、实体瘤取样难的现状,ctDNA成为了肿瘤检测的新发展方向。除此之外,panel基线的建立、大队列分析获取阈值、cfDNA的纯度低于0.4%,面对这些问题,求臻医学和华盛顿大学联合开发了MSIsensor-ct。

  MSIsensor使用标准卡方检测每个微卫星位点的p值来评估肿瘤分布的稳定性,p<0.05为不稳定,反之为稳定。接下来保留了满足三个条件的位点:测序深度>=20x,存在于>=10%的样本中,不稳定分布的比例>=20%。不同样本的同一个微卫星位点的等位基因频率分布和稳定性归为了一个集合。每一个集合被分为了训练组和验证组。随后使用了5种机器学习方法(SVM、XGBoost、AdaBoost、GBDT、AB),用不同的AUC限制值来探索每个集合的分布模式,其中XGBoost表现效果最好。最终我们在25861个MSI的集合中,选择了XGBoost方法的1476个作为分类器,用来评估临床数据的位点稳定性,除此之外研究表明,MSI的状态也被用MSIscore(20%)来量化。

  不同于其他的MSI识别软件需要构建一个baseline的过程,MSIsensor-ct只需要一个panel里面含盖了1476个分类其中的至少10个微卫星位点,即可使得AUC达到0.96。并且,MSIsensor-ct的检测ctDNA含量在0.05%时只要达到3000x或者在ctDNA含量在0.2%时达到1000x即可。该研究成果让液体活检筛查MSI有望成为肿瘤患者常规panel的检查工具,扩大了检测人群范围。