Radiomics approach for preoperative iden

目录
1:
2:
3:
4:
5:
6:
1:
食管癌:食管癌是常见的消化道肿瘤,全世界每年约有30万人死于食管癌 。其发病率和死亡率各国差异很大 。我国是世界上食管癌高发地区之一,每年平均病死约15万人 。男多于女,发病年龄多在40岁以上 。同时,不同分期的术后存活率相差很大 。初期术后五年存活率为80%,而晚期术后五年存活率仅为5-8% 。同时不同分期的食管癌的治疗方案也不同,因此对食管癌分期进行准确的预测至关重要 。相对于传统手术对肿瘤进行分期,使用影想进行分期时廉价的、无痛的,今天介绍一种使用发射组学与机器学习结合的方式对食管癌术前分期的方法 。
2:
数据来源:广东省人民医院以及广东省医学科学院在2008到2016年就诊的食管癌患者,一共有211例患者参与到这项研究中,其中有57例患者被排除,也就是这57位患者不满足试验要求 。其中27人的临床资料不完整,其中有2人病理诊断为非食管癌,3人不能确定等级,还有25人术前没有进行Ct扫描 。
下表是临床病理信息的统计表 。
P-value值是推断统计中的一项重要内容,是用于判断原始假设是否正确的重要证据 。其中计算p值的方式,当数值是连续的时候,比如:年龄、肿瘤体积我们用Mann- U test,当数值是离散的我们使用Chi- test进行计算p-值 。当p值小于0.05我们认为该属性具有统计学意义 。R-socre是建立所选特征的线性组合的预测函数 。
3:
3.1:预处理

Radiomics approach for preoperative iden

文章插图
由于不同型号的机器拍出来的CT影像其中影像的强度是不同的,即使是相同的机器在不同时间由于湿度、温度的影响,影像的质量也会不同,所以我们在提取特征之前需要消除这些影响 。我们对感兴趣区域(ROI)进行归一化处理,将图像的灰度值归一化到(μ–3σ, μ+3σ) 这个范围内 。其中μ代表:灰度的平均值 。σ代表灰度的标准差 。第二步,我们将图像的像素的每一个比特值量化到灰度范围内 。
Range我们选择8,16,32,64 。I是原始roi的强度,那个符号是rio像素点的集合 。
3.2:特征提取
A图是原始的Ct图像,B图是手工分割之后的CT图像,C是提取的特征图 。
提取到的特征包括:
1) first-order
2) sizeand shape-based
3)
4)
3.3特征选择
使用进行特征提取可以得到9790维特征,我们使用(ICC)进行计算特征间的相关性系数,筛选出系数大于0.9的特征,一共包括6140维特征,再对6140维特征进行进行计算相关性,筛选出218个特征 。最好使用lasso特征选择方法进行特征选择,选择10个最重要的特征 。
4.
Radiomics approach for preoperative iden

文章插图
根据选择的特征进行分类,并计算每个特征的权重一次来计算Rad-score的值 。根据值的不同对食管癌进行等级分类 。如图,当值0.054就是本实验的一个分界线 。
本实验计算的Rad-score的公式:
Rad-score=0.218+0.252×
–0.02×+0.078× –0.06×rbio1. –0.088×+0.062×bior5.+0.152×rbio1.
+0.1×rbio1.+ 0.15×rbio2.+0.39×rbio3.
表二是文章的对比试验的统计表
NRI是净重新分类改善指数 。分类模型不仅可以用AUC进行评估,还可以使用NRI对模型准确性进行评估比较 。同时有的时候AUC可能不能够方便或直观,此时NRI的价值就凸显出来了 。两外当两个模型的AUC没有统计学差异的时候,此时NRI却可以校验出统计学差异 。新、旧模型对于研究人群的分类变化,就会发现有一部分研究对象,原本在旧模型中被错分,但在新模型中得到了纠正,分入了正确的分组,同样也有一部分研究对象,原本在旧模型中分类正确,但在新模型中却被错分,因此研究对象的分类在新、旧模型中会发生一定的变化,我们利用这种重新分类的现象,来计算净重新分类指数NRI 。