基于煙葉化學成分烤煙香型分類模型的建立
發(fā)布時間:2019-08-24 來源: 歷史回眸 點擊:
摘要:基于煙葉化學數(shù)據(jù)建立烤煙香型分類模型,然后對各模型進行篩選比較選出最優(yōu)模型。首先對142個烤煙煙葉樣品中的9類成分的63個指標采用行業(yè)標準進行檢測,然后采用逐步回歸法篩選出19個煙葉化學成分,依據(jù)這19個指標采用線性判別分析法、Logistic回歸、高斯混合模型、分類樹、K最鄰近法、人工神經(jīng)網(wǎng)絡(luò)和支持向量機七種方法進行建模。通過對不同方法建立的模型采用100次隨機抽取訓練集樣本和測試樣本計算錯誤分類率,選擇錯誤分類率較低的模型作為優(yōu)選模型。經(jīng)比較發(fā)現(xiàn),線性判別法和高斯混合模型建立的兩種香型函數(shù)能較好地對未知樣品的香型進行正確分類,且效果較好。篩選出的兩種優(yōu)選模型對于烤煙香型分類研究具有一定的應(yīng)用價值。
關(guān)鍵詞:煙葉化學成分;烤煙香型;模型分類法
中圖分類號:TS44+1 文獻標識碼:A 文章編號:0439-8114(2015)05-1220-07
DOI:10.14088/j.cnki.issn0439-8114.2015.05.049
Abstract: Based on the chemical components of tobacco leaves, the classification models of tobacco flavor were established. All models were compared to select the optimal model. 63 components of 9 kinds of 142 tobacco leaves were detected by tobacco industry standards. 19 chemical components were selected by stepwise regression method. Seven methods including discriminate analysis, Logistic regression, Gauss mixture model, classification tree, K nearest neighbor method, artificial neural network and support vector machine were used to establish the models based on the 19 index. 100 randomly selected samples were used as the training sets and test samples to calculate the error classification rate through the establishment of the different methods of models. The model was the preferred model with classification error rate lower than others. By comparision, two kinds of flavor function model (linear discriminate method and Gauss mixed) were better to unknown sample types. Two kinds of optimization models had a certain application value for classifying tobacco flavor.
Key words: chemical components of tobacco leaves; tobacco flavor; model classification methods
目前利用烤煙中化學成分、致香成分對三種烤煙香型進行模式識別已有相關(guān)文獻報道[1-4]。在國內(nèi)的研究中,朱立軍等[2]對112份市售卷煙樣品中20種化學成分采用逐步判別方法進行判別分析取得了較好的分類結(jié)果,Zhan等[4]以63個中部和65個上部煙葉為材料,基于其中的67種致香物質(zhì)對三種香型進行逐步判別分析也取得較好的分類結(jié)果并得到很好的應(yīng)用。目前在利用化學計量學進行模式識別的過程中,已發(fā)展出了各種各樣的方法[5],采用其他類型的方法是否與經(jīng)典的判別分析方法具有同樣的效果,或是效果要好于經(jīng)典方法,此方面的研究還未見相關(guān)的報道。為此,采用目前較為成熟的經(jīng)典判別分析方法(LDA)、Logistic回歸(LR)、高斯混合模型(Mix)、分類樹(Tree)、K最鄰近法(KNN)、人工神經(jīng)網(wǎng)絡(luò)(CANN)和支持向量機(SVM)七種化學計量學方法,隨機抽取不同的訓練集和測試集進行分析,擬篩選出分類效果較優(yōu)且精度較為穩(wěn)健的模型,以期為烤煙香型分類優(yōu)化模型的選擇提供理論依據(jù)。
1 材料與方法
1.1 材料
2011年收集142份烤煙樣品,分別來自中國14個省份,16個品種。其中清香型(簡稱“清”)50個,中間香型簡稱“中”40個,濃香型(簡稱“濃”)52個。本次收集的樣品均由全國評煙委員會委員組成的評吸專家組對烤煙香型(清香型、濃香型和中間香型)進行鑒定。
1.2 方法
1.2.1 分析檢測 在煙葉化學成分中主要對9類成分中的63個指標采用行業(yè)標準進行檢測。63個指標具體是總糖、還原糖、氯、鉀、氮、總植物堿、石油醚提取物、粗纖維素、揮發(fā)酸、揮發(fā)堿、葡萄糖、果糖、蔗糖、綠原酸、莨菪亭、蕓香苷、鐵、錳、銅、鋅、鈉、硼、鈣、鎂、硝酸根、硫酸根、磷酸根、草酸、丙二酸、蘋果酸、棕櫚酸、硬脂酸、檸檬酸、亞油酸、亞麻酸、煙堿、降煙堿、麥斯明、假木賊堿、新煙草堿、2,3-聯(lián)吡啶、葉黃素、胡蘿卜素、天冬酰胺酸、組氨酸、絲氨酸、谷氨酰胺酸、精氨酸、甘氨酸、高絲氨酸、天冬氨酸、谷氨酸、蘇氨酸、丙氨酸、γ-氨基丁酸、脯氨酸、賴氨酸、酪氨酸、纈氨酸、異亮氨酸、亮氨酸、苯丙氨酸、色氨酸。
熱點文章閱讀