首页 > 范文大全 > 正文

k—近邻算法在肝癌检测中的应用

开篇:润墨网以专业的文秘视角,为您筛选了一篇k—近邻算法在肝癌检测中的应用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:肝癌分类检测以区分正常肝脏与病变肝脏及确定肝脏病变的类别为主要目的。k-近邻算法是一种基于统计的经典分类方法,具有简单、有效的特点。该文针对k-近邻算法的具体分类过程,结合肝癌分类检测过程中的常用特征(纹理特征、形状特征),将纹理与形状特征分别应用于k-近邻算法分类过程中,获得了较好的实验效果。

关键词:k-近邻算法;纹理特征;形状特征

中图分类号:TP18 文献标识码:A 文章编号:1009-3044(2013)34-7832-02

肝癌是一种常见的恶性肿瘤,发病率呈逐年升高态势。临床医学中对肝癌的诊断准确率要求较高。利用计算机辅助诊断检测、判定肝癌可提高诊断的速度与精度。如何正确判断肝脏的健康状况及病变类别是肝癌检测的最终任务。目前,主要利用提取肝脏的纹理特征与形状特征,并结合相应的数据挖掘分类算法实现肝癌的具体分类与识别。

1 典型KNN算法分析

k-近邻算法,简称K-NN(k-Nearest Neighbor algorithm)算法,是一种典型的数据挖掘算法。K-NN算法主要分类原理为:在特征空间中,如k个最邻近样本中的多数都属于某一类别,则判定该待分类样本也属于该类别。K-NN方法在分类决策上依据与待分类样本最邻近的一个或者几个样本的类别来判定该样本所属的类别。

K-NN算法的基本思想为:对于给定的待分类样本进行分类,首先依据训练集中样本与待分类样本的距离(一般为欧式距离),在训练样本集中选取与该样本距离最近的k个样本,由这k个样本决定未知样本的类别。

数学描述如下:

距离最小的样本(k个最近邻样本),作为判定待分类样本类别的依据。

KNN算法具体应用过程包括如下关键步骤:1)选择训练样本;2)建立计算距离的数学模型;3)近邻个数K值的选取;4)判定分类的依据。

2 KNN算法在肝癌检测中的应用

在肝脏CT图像中,病变肝脏与正常肝脏的区别主要反映为不同的纹理特征,肝癌类别主要反映为不同的形状特征。因而可利用肝脏的纹理特征与形状特征进行肝癌的分类检测。纹理特征用于识别正常肝脏与病变肝脏,形状特征用于肝癌类型的识别。该文将K-NN算法分别应用于基于纹理特征的分类与基于形状特征的分类。

2.1 基于纹理特征的K-NN分类

经特征提取,取得用于判断肝脏是否存在病变的纹理特征按顺序为:能量、熵、对比度、相关性和局部平稳性。

利用上述特征进行KNN分类的具体过程为:

1)将上述纹理特征分别作为样本的特征向量带入公式(2),分别计算带分类样本与训练集中各样本的欧式距离。

2)K值的选取,依据实验经验,K值取7时获得结果最为精确,选取7个最近邻样本,统计样本类别,确定待分类样本的类别。

3)统计待分类样本的类别,计算分类结果的正确率,明确实验效果。

正确率结果如表1:

由表1数据得出结论:正常肝的正确识别率为82.67%,非正常肝的正确识别率为76.29%,识别正确率均达到75%以上,对正常肝癌的正确识别率高于80%。

2.2 基于形状特征的KNN分类

肝癌病变类型主要分为:囊肿、血管瘤、肝癌。经特征提取,取得用于判断肝脏病变类型的形状特征按顺序为:圆形度、边缘复杂度、离心率和矩形度。

利用上述特征对肝癌类别进行分类的具体步骤为:

1)将上述形状特征分别作为样本的特征向量带入公式(2),分别计算带分类样本与训练集中各样本的欧式距离。

2)K值的选取,依据实验经验,K值取5时获得结果最为精确。选取7个最近邻样本,统计样本类别,确定待分类样本的类别。

3)统计待分类样本的类别,计算分类结果的正确率,明确实验效果。

由表2得到结论:对与肝癌的类别判定正确率均达73%以上,其中囊肿的正确率相对较高。肝癌与囊肿两类肝癌病变较难利用形状特征识别,试验结果中囊肿识别为肝癌与肝癌识别为囊肿的图像数皆较多。

3 总结与展望

本文将经典KNN算法应用于肝癌的分类检测过程中,分别利用肝脏CT图像反映出的纹理与形状特征作为肝癌分类识别的依据,并将其应用于KNN算法的分类过程中。首先利用纹理特征区分正常与病变肝脏,在此基础上,利用形状特征识别病变肝脏的种类,判断属于何种类型的肝癌。实验证明,KNN分类算法对肝癌的分类检测正确率较高,正确率均达到73%以上。由于经典KNN算法具有局限性,因而分类识别正确率还有一定的上升空间。通过后续对KNN算法的改进期望获得更好的实验效果。

参考文献:

[1] 杨光正,吴崛,张晓莉.模式识别[M].合肥:中国科学技术大学出版社,2001.

[2] 闭小梅,闭瑞华. KNN算法综述[J].科技创新导报,2009(14).

[3] 潘丽芳,杨炳儒.基于簇的K最近邻(KNN)分类算法研究[J].计算机工程与设计,2009(18).

[4] 叶俊.基于多期肝脏CT图像的计算机辅助诊断系统中关键技术的研究[D]. 上海:上海交通大学,2010.

[5] 江少锋.医学图像的特征自动提取及基于模糊特征的图像检索研究[D]. 广州:南方医科大学,2008.