首页 > 范文大全 > 正文

主成分分析和聚类分析在烟叶全面质量评价中的应用

开篇:润墨网以专业的文秘视角,为您筛选了一篇主成分分析和聚类分析在烟叶全面质量评价中的应用范文,如需获取更多写作素材,在线客服老师一对一协助。欢迎您的阅读与分享!

摘要:为研究烟叶全面质量评价的新方法,2014年于四川省宁南县采集烟叶样品,测定分析了烤烟的外观质量、物理特性、化学成分、中性致香物质和感官质量,并应用主成分分析聚类分析烟叶38个质量指标进行了分析和聚类。结果表明,38个指标共提取出了7个主成分,方差累计贡献率为87.37%,基本上反映了原来变量的全部信息;烟叶样品经过聚类分析共分成3类,经过判别分析验证,正确率达92.86%;最适宜种植烤烟的海拔高度为1 450 m,其次为海拔1 750 m,海拔2 050 m种植效果最差,黄壤种植效果优于红壤,云烟87和云烟85种植效果优于云烟97。

关键词:主成分分析;聚类分析;烟叶;全面质量评价

中图分类号:S572 文献标识码:A 文章编号:0439-8114(2016)19-5163-03

DOI:10.14088/ki.issn0439-8114.2016.19.070

The Application of the Principal Component Analysis and Cluster Analysis in Overall Quality Evaluation of Tobacco

L?B Peng-hui1,YE Xie-feng1,YUE Dong-lin2,FAN Fang-bing2,TIAN Sheng-guo2,LI Yan-jie2,

LU Jian3,ZOU Hui-yu3,ZHOU Han-hong4,LI Yan4,YU Jian-jun1

(1. College of Tobacco Science, Henan Agricultural University,Zhengzhou 450002, China; 2. Gansu Tobacco Industrial Co., Ltd., Lanzhou 730000, China; 3. Ningnan Branch Company, Liangshan Prefecture Company of Sichuan Provincial Tobacco Company, Ningnan 615400, Sichuan, China; 4. Wuhan Cigarette Factory, Wuhan 430000, China)

Abstracts: In order to study the new method of overall quality evaluation of tobacco, tobacco leaves were collected from Ningnan county of Sichuan province in 2014, and their appearance quality, physical properties,chemical components, neutral aroma components and sensory quality were determined and analyzed. 38 quality indexes of tobacco leaf were analyzed and clustered by principal component analysis and cluster analysis. The results showed that,seven principal components were extracted from 38 indexes, and cumulative contribution rate of variance was 87.37%,which basically reflected all information of original variable; tobacco leaves were divided into three categories by cluster analysis,and correct rate reached 92.86% by discriminant analysis. The optimum altitute for planting flue-cured tobacco was 1 450 m,followed by the altitute 1 750 m, and 2 050 m in turn, the planting effects of yellow soil was better than that of red soil,and the planting effects of Yunyan 87 and Yunyan 85 were better than that of Yunyan 97.

Key words: principal component analysis; cluster analysis; tobacco leaf; overall quality evaluation

烟草是中国重要的经济作物之一,种植面积和总产量居世界第一位,在中国国民经济中占有重要地位[1]。然而烟草对环境条件的变化十分敏感,环境条件的差异不仅影响烟草的形态特征和农艺性状,而且还直接影响烟叶的化学成分和质量[2]。烤烟品种、土壤类型和海拔因素是导致烤烟内含物存在地域差异和产量高低的重要生态因素,对烟叶的产量和产值、化学成分、致香物质含量和感官质量有很大的影响[3-5]。当前对烟叶进行质量评价的方法主要有外观质量评价法、常规化学成分评价法、感官质量评价法等[6-8]。而外观评价和感官质量评价方法受主观影响较大,化学成分分析法不能完整如实地反映烟叶的质量,因此构建一种评价烟叶全部质量指标的模型显得尤为重要。

研究人员对于烟叶质量评价方法进行了很多研究[9-12],已有研究虽然利用了主成分分析、聚类分析和判别分析开辟了烟叶评价的新途径,但是评价的指标不够全面。为此,本研究通过主成分分析、聚类分析和判别分析对烟叶质量进行全面评价,以期探讨海拔、烤烟品种和土壤类型对烟叶质量的影响,为烟叶生产的栽培管理和品种规划提供参考。

1 材料与方法

1.1 样品采集

试验于2014年在四川省宁南县取样。取样时记录每个取样点的烤烟品种、海拔高度和土壤类型,共计14个样品。每个样品设3次重复,均各取2 kg C3F等级烤后烟叶备用。试验所取样品信息具体见表1。

1.2 指标测定及方法

烤烟外观质量的评价按照GB 2635-1992[13]进行,由3名烤烟分级专家对外观质量进行评价。

各物理特性指标测定方法参考吉书文等[14]的方法进行。

样品中常规化学成分总糖、还原糖、烟碱、总氮、氯含量测定参考王瑞新[15]的方法进行,钾含量测定按照YC/T 173-2003[16]进行。

中性致香物质由国家烟草栽培生理生化研究基地利用GC/MC采用内标法测定分析。

烟叶感官质量由河南中烟工业有限责任公司技术中心和国家烟草栽培生理生化研究评吸委员会进行评定。评分后由有利于吸食品质的指标得分减去不利于吸食品质的指标得分,即得到感官质量的总得分。

1.3 主成分分析

把不同样品的各个质量指标构成主成分分析相关矩阵,根据主成分分析后所确定的不同主分量的线性组合计算不同样品每个主成分的得分,进而计算每个烟叶样品各个主成分的综合得分。主成分分析采用SPSS 19.0软件进行。具体步骤为:将n个样本的p个指标变量构建成数据集,通过变换将原变量xi 转换成因子变量,因子变量是原变量的线性组合,记原变量指标为X1,X2,…,Xp,设它们降维处理后的综合指标,即新变量为f1,f2,f3,…,fm(m≤p),这m个变量之间互不相关,因子变量分别称作原始变量的第1,第2,第3,…,第m个主成分,表示为:

f1=l11X1+l12X2+…+l1pXpf2=l21X1+l22X2+…+l2pXp …………fm=lm1X1+lm2X2+…+lmpXp

1.4 聚类分析

对用主成分分析提取出的主因子(fm)根据其组成重新命名,采用Q型聚类中类间评价链锁法和欧氏距离平方对各个样品的各主成分得分(Zm)进行聚类。聚类分析采用SPSS 19.0软件进行。

1.5 判别分析

以聚类分析所确定的类别为基础,建立以各主成分得分(Zm)为基础的判别函数,将每一个主成分得分值(Zm)分别代入Fisher判别函数dik(为第k个判别函数所求得的第i个样品的值,k为判别函数组中判别函数的个数),以函数dik的大小作比较,函数值最大值表明该主成分得分值(Zm)属于该组,也即该样品属于该组[10]。判别分析采用SPSS 19.0软件进行。

2 结果与分析

2.1 烟叶质量的主成分分析

2.1.1 烟叶质量各指标主成分分析相关矩阵的特征值 对14个烟叶样品的外观质量、物理特性、化学成分、中性致香物质和感官质量共38个指标进行主成分分析,所得相关矩阵的特征值见表2。由表2可知,根据特征值大于1的原则,烟叶质量的38个指标共提取出了7个主成分,方差累计贡献率为87.37%,大于85%,说明提取的7个主成分基本上反映了原来变量的全部信息。

2.1.2 烟叶质量各指标主成分分析因子载荷和因子得分 对14个烟叶样品的外观质量、物理特性、化学成分、中性致香物质和感官质量共38个指标进行主成分分析,所得因子载荷矩阵见表3。

由表3可知,根据烟叶质量各指标在主成分中的载荷量,取载荷绝对值大于0.5可以看出,身份、外观总得分、单叶重、含梗率、填充值、拉力、总糖、还原糖、总氮、苯丙氨酸类、新植二烯、香气物质总量、香气质、透发性、细腻程度、柔和程度、圆润感、余味、刺激性、干燥感和评吸总得分在主成分f1中有较高的载荷;单叶重、含梗率、拉力、总糖、氯、烟碱、香气质、圆润感、余味和干燥感在主成分f2中有较高的载荷;颜色、成熟度、身份、油分、色度、外观总得分、苯丙氨酸类和棕色化产物类在主成分f3中有较高的载荷;叶宽、类西柏烷类、烟气浓度、劲头、香气量和透发性在主成分f4中有较高的载荷;叶长、氯、钾、类胡萝卜素类和新植二烯主成分f5中有较高的载荷;杂气在主成分f6中有较高的载荷;结构在主成分f7中有较高的载荷。

2.2 基于主成分分析的烟叶质量的聚类分析

基于表3的因子载荷矩阵,利用“材料与方法”中的公式求得各主成分的得分,然后对14个烟叶样品采用Q型聚类中类间评价链锁法和欧氏距离平方对各个样品的各主成分得分(Zm)进行聚类,结果共分成3类,分别定义为好、中、差,分别用1、2、3表示,结果见表4。

由表4可知,烟叶样品共分成3类。第1类的烟叶样品有4个,分别为T1、T2、T5、T6;第2类的烟叶样品有9个,分别为T3、T4、T7、T8、T9、T10、T11、T12、T14;第3类的烟叶样品有1个,为T13。

2.3 基于主成分分析和聚类分析进行的不同烟叶样品的判别分析

根据各个烟叶样品的7个主成分得分和表4的聚类结果,对14个烟叶样品进行判别分析,以确定聚类分析结果的可靠性,判别分析结果见表5。由表5可知,经过判别分析后,第1类的烟叶样品有4个,第2类的烟叶样品有10个,第3类的没有烟叶样品,共有13个样品被正确分类,第2类有一个样品分类错误。同聚类分析的结果比较发现,聚类分析的结果中92.86%的烟叶样品分类是正确的。

3 小结

根据特征值大于1的原则,烟叶质量的38个指标共提取出了7个主成分,方差累计贡献率为87.37%,大于85%,说明提取出的7个主成分基本反映了原来变量的全部信息,有效剔除了重复信息。

烟叶样品经过聚类分析共分成3类,第1类的烟叶样品有4个,第2类的烟叶样品有9个,第3类的烟叶样品有1个。判别分析结果显示,聚类分析结果共有13个样品被正确分类,正确率达到92.86%。表明聚类分析和判别函数分析方法有较好的一致性,所建立的烟叶评价模型是可行的。

聚类分析结果表明,最适宜种植烤烟的海拔高度为1 450 m,其次为海拔1 750 m,海拔2 050 m的种植效果最差,黄壤种植效果优于红壤,云烟87和云烟85种植效果优于云烟97。

参考文献:

[1] 刘国顺,王彦亭,陈海如,等.烟草栽培学[M].北京:中国农业出版社,2003.

[2] 刘国顺.国内外烟叶质量差距分析和提高烟叶质量技术途径探讨[J].中国烟草学报,2003(增刊):54-58.

[3] 程吕新,卢秀萍,许白成,等.基因型和生态因素对烟草香气物质含量的影响[J].中国农学通报,2005,21(11):137-139.

[4] 许自成,刘国顺,刘金海,等.铜山烟区生态因素和烟叶质量特点[J].生态学报,2005,25(7):1748-1753.

[5] 邵 丽,晋 艳,杨宇虹,等.生态条件对不同烤烟品种烟叶产质量的影响[J].烟草科技,2002(10):40-45.

[6] MOSELEY J M. The relationshlip of maturity of the leaf at harvest and certain properties of the cured leaf of flue-cured tobacco[J].Tobacco Science,1963(7):67-75.

[7] 彭黔荣,蔡元青,王东山,等.根据常规化学指标识别烟叶品质的BP神经网络模型[J].中国烟草学报,2005,11(5):19-24.

[8] 杜咏梅,郭承芳,张怀宝.水溶性糖、烟碱、总氮含量与烤烟吃味品质的关系研究[J].中国烟草科学,2000,21(1):7-10.

[9] 常寿荣,吴 涛,罗华元,等.烤烟品种、部位及生态环境对烟叶致香物质的影响[J].云南农业大学学报,2010,25(1):58-62.

[10] 叶协峰,魏跃伟,杨宇熙,等.基于主成分分析和聚类分析的烤烟质量评价模型构建[J].农业科学与综合研究,2009,25(3):268-271.

[11] 邹渊渊,伍岳庆,姚 宇.基于主成分和和回归分析的烟叶质量分析模型[J].计算机应用,2011,31(S2):81-89.

[12] 郭建华,宋纪真,王广山,等.基于主成分分析和聚类分析的烟叶物理特性区域归类[J].烟草科技,2014(8):14-17.

[13] GB 2635-1992,烤烟国家标准[S].

[14] 吉书文,腾兆波.烟草物理检测[M].郑州:河南科学出版社,1997.

[15] 王瑞新.烟草化学[M].北京:中国农业出版社,2003.

[16] YC/T 173-2003,烟草及烟草制品钾的测定火焰光度法[S].