研究论文

     

使用机器学习模型预测结直肠癌肝转移的分类器生物标志物

这项研究从GEO 数据库获取数据,对比六种机器学习算法构建预测模型,筛选出结直肠腺癌肝转移的最佳分类器模型,并对其特征基因进行功能分析和药物靶点预测。

模型筛选及特征基因功能分析结果:研究筛选出基于CatBoost算法的最优模型,其准确率达 99% ,AUC为1,由33个特征基因组成。功能分析显示,这些特征基因与脂质代谢过程紧密相关,如 “类固醇代谢过程”“脂蛋白颗粒受体结合”,还显著富集于“补体和凝血级联反应”通路 。

潜在生物标志物及药物靶点预测结果:研究推测APOB、APOC3、FGA、F2、F9和NKX2-3等可能是结直肠腺癌肝转移的潜在生物标志物。在药物靶点预测中,发现F2和F9是甲萘醌的潜在靶点。不过,这些结果还需进一步实验验证。