基于LVQ神经网络的乳腺肿癌诊断( 二 )


威斯康辛大学医学院经过多年的收集和整理,建立了一个乳腺肿瘤病灶组织的细胞核显微图像数据库 。数据库中包含了细胞核图像的10个量化特征(细胞核半径、质地、周长、面积、光滑性、紧密度、凹陷度、凹陷点数、对称度、断裂度),这些特征与肿瘤的性质有密切的关系 。因此,需要建立-一个确定的模型来描述数据库中各个量化特征与肿瘤性质的关系,从而可以根据细胞核显微图像的量化特征诊断乳腺肿瘤是良性还是恶性的 。
2.模型建立 2.1 设计恩路

基于LVQ神经网络的乳腺肿癌诊断

文章插图
将乳腺肿瘤病灶组织的细胞核显微图像的10个量化特征作为网络的输人,良性乳腺肿瘤
和恶性乳腺肿瘤作为网络的输出 。用训练集数据对设计的LVQ神经网络进行训练,然后对
测试集数据进行测试并对测试结果进行分析 。
2.2 设计步骤
根据上述设计思路,设计步骤主要包括以下几个,如图26-2所示 。
1)数据采集
威斯康辛大学医学院的乳腺癌数据集共包括569个病例,其中,良性357例,恶性212例 。本书随机选取500组数据作为训练集,剩余69组作为测试集 。每个病例的一组数据包括采样组织中各细胞核的10个特征量的平均值、标准差和最坏值(各特征的3个最大数据的平均值)共30个数据 。数据文件中每组数据共分32个字段,第1个字段为病例编号;第2个字段为确诊结果,B为良性,M为恶性;第3~12个字段是该病例肿瘤病灶组织的各细胞核显微图像的10个量化特征的平均值;第13~22个字段是相应的标准差;第23~32个字段是相应的最坏值 。
2)网络创建
数据采集完成后,利用自带的神经网络工具箱中的函数()可以构建一个LVQ神经网络,函数具体用法将在第3节中详细介绍 。
3)网络训练
网络创建完毕后,若需要,还可以对神经网络的参数进行设置和修改 。将训练集500个病例的数据输入网络,便可以对网络进行训练 。
4)网络仿真
网络通过训练后,将测试集69组的10个量化特征数据输人网络,便可以得到对应的输出(即分类) 。
5)结果分析.
通过对网络仿真结果的分析,可以得到误诊率(包括良性被误诊为恶性及恶性被误诊为良性),从而可以对该方法的可行性进行评价 。同时,可以与其他方法进行比较,探讨该方法的有效性 。
3.LVQ 网络的神经网络工具箱函数
的神经网络工具箱为LVQ神经网络提供了大量的函数工具,本节将详细介绍这些函数的功能、调用格式和注意事项等问题 。
3.1LVQ网络创建函数
()函数用于创建一一个学习向量量化LVQ网络,其调用格式为:
net = (PR,S1, PC,LR,LE)
其中,PR为输人向量的范围,size(PR)=[R 2],R为输人向量的维数;S1为竞争层神经元的个数;PC为线性输出层期望类别各自所占的比重;LR为学习速率,默认值为0.01;LF为学习函数,默认为“" 。
3.2LVQ网络学习函数
1)LVQ 1学习算法
基于LVQ神经网络的乳腺肿癌诊断

文章插图
是LVQ1算法对应的权值学习函数,其调用格式为:
[dw,Ls] = (W,P,Z,N,A,T,E,gW,gA,D,LP,LS)
其中,dW为权值(或阈值)变化矩阵;LS为当前学习状态(可省略);W为权值矩阵或者是阈值矢量;P为输入矢量或者是全为1的矢量;Z为输人层的权值矢量(可省略);N为网络的输人矢量(可省略);A为网络的输出矢量;T为目标输出矢量(可省略);E为误差矢量(可省略);gW为与性能相关的权值梯度矩阵(可省略);gA为与性能相关的输出梯度矩阵;D为神经元的距离矩阵;LP为学习参数,默认值为0.01;LS为初始学习状态 。
2) LVQ2学习算法
是LVQ2算法对应的权值学习函数,其调用格式为: