支持向量數(shù)據(jù)描述在煙葉異物檢測中的應(yīng)用
發(fā)布時間:2019-08-24 來源: 幽默笑話 點擊:
摘 要:針對煙葉異物檢測中很難全面收集異物樣本數(shù)據(jù)的問題,提出一種基于支持向量數(shù)據(jù)描述方法(SVDD)的煙葉異物檢測方法。該方法只需要煙葉樣本數(shù)據(jù),就可建立單值分類器。首先,提取煙葉與幾種典型異物的RGB分量與HSV分量;然后,選取煙葉的HV分量作為特征向量,訓(xùn)練SVDD分類器,實現(xiàn)煙葉異物的分類識別;最后,通過接受者操作特性(ROC)曲線對比了SVDD與其他3種方法的分類效果。實驗結(jié)果表明,采用HV分量降低了數(shù)據(jù)維數(shù),提高了計算效率;SVDD方法具有很好的分類效果和計算效率,能很好地區(qū)分煙葉與異物。
關(guān)鍵詞:支持向量數(shù)據(jù)描述;異物檢測;煙葉樣本;HV分量;分類識別
中圖分類號: TP274.3文獻(xiàn)標(biāo)志碼:A
?
Application of support vector data description to detection of foreign bodies in tobacco
?
HUANG Shi?jian??1,2?*?
?(
1.School of Physics and Electron Engineering, Yangtze Normal University, Chongqing 408100, China?;??
2.Key Laboratory of Optoelectronic Technology and Systems ?(?Chongqing University?),? Ministry of Education, Chongqing 400044, China
)?
Abstract:
It is difficult to fully collect foreign body sample in detecting foreign bodies from tobacco. A detection method based on Support Vector Data Description (SVDD) was proposed. Thus a one?class classifier can be developed by using tobacco samples soly. RGB and HSV of tobacco and several typical foreign bodies were firstly extracted; then the HV component was used as eigenvector. A developed SVDD classifier was applied to distinguish foreign bodies from tobacco by inputting the HV eigenvector. Finally through the Receiver Operating Characteristic (ROC) curve, the SVDD classifier was compared with three other methods in classification effect. The experimental results show that by adopting feature extraction with HV component, the data dimension was reduced and a higher computation efficiency was achieved. The SVDD classifier has a stronger classification ability and higher efficiency, which could distinguish foreign bodies from tobacco better.
?Key words:
Support Vector Data Description (SVDD); foreign body detection; tobacco sample; HV component; classification
?
0 引言?
國內(nèi)大多數(shù)煙草生產(chǎn)線上都采用金屬探測儀檢測和剔除金屬異物,并輔之以人工剔除其他異物的方法??[1-2]?,這些方法的異物剔除率受人為因素影響較大。因此研究煙葉異物自動檢測系統(tǒng)極為重要,自動檢測的關(guān)鍵技術(shù)多采用機器視覺技術(shù)與模式識別技術(shù)相結(jié)合??[3]?,其中分類方法的選擇是否恰當(dāng),直接影響最后的檢測結(jié)果。但近年來國內(nèi)外針對煙葉異物的分類技術(shù)卻鮮有報道,而常用的可以借鑒的分類方法有貝葉斯分類算法、支持向量機等傳統(tǒng)方法和支持向量數(shù)據(jù)描述??[4-6]?(Support Vector Data Description, SVDD)等單值分類算法。但貝葉斯分類等傳統(tǒng)分類方法在對訓(xùn)練樣本不平衡領(lǐng)域如煙葉異物檢測中異物種類繁雜甚至無法預(yù)知的情況時表現(xiàn)得力不從心,本文提出將支持向量數(shù)據(jù)描述方法運用到煙葉異物檢測技術(shù)中,該方法已在很多訓(xùn)練樣本不平衡的領(lǐng)域(如機械故障診斷??[7-8]?、語音識別??[9]?、圖像識別等領(lǐng)域)得到了成功應(yīng)用??[10-12]?。運用該方法只需用煙葉的HV分量數(shù)據(jù)訓(xùn)練單值分類器,就可實現(xiàn)分類,可以解決難以提取異物訓(xùn)練樣本的問題。?
1 顏色空間?
RGB顏色空間的基本原理是采用紅(R)、綠(G)、藍(lán)(B)3個顏色分量來表示所有的顏色。HSV顏色空間模型是孟塞爾色彩空間的簡化形式,直接采用彩色特性意義的3個分量:色度(H)、飽和度(S)、亮度(V)來描述顏色,更符合人對顏色的描述習(xí)慣。?
RGB顏色空間有不均勻和不直觀的缺點,HSV顏色空間的三分量相對獨立,易通過設(shè)定不同權(quán)值將其融合在一起,具有計算量小等優(yōu)點。?
2 支持向量數(shù)據(jù)描述算法簡述?
SVDD的基本思想是把要描述的對象作為一個整體。假定一個目標(biāo)集(Target)?包含有n個需要描述的目標(biāo)對象{x?i|x?i∈R?d;i=1,2,…,n},構(gòu)成單值分類器的n個學(xué)習(xí)樣本。試圖找到一個體積最小的超球體,使全部(或盡可能多) 的x?i都包含在該超球體內(nèi),而非目標(biāo)樣本?(Outliers)?就位于超球體外, 為了增強分類的魯棒性,引入松弛變量ξ?i。最小化超球體的體積是一個二次規(guī)劃問題,即應(yīng)滿足:?
3 實驗研究?
從人主觀觀察的角度看,煙葉異物在顏色、形狀、大小、輕重、材質(zhì)等方面都存在差異。但從機器視覺系統(tǒng)的角度來看,被檢測物的輕重材質(zhì)等特征難以獲取,而形狀、大小等參數(shù)又不具備明顯的規(guī)律性,這使得顏色成了煙葉異物檢測中最為重要的特征參量。?
在煙葉異物檢測中最重要的是識別出煙葉與非煙葉(即異物),如再進(jìn)一步識別出異物的具體類型費時費力且沒有必要,因此考慮用單值分類方法對煙葉異物進(jìn)行分類識別,把煙葉識為目標(biāo)樣本,將所有的異物都識為非目標(biāo)樣本。用煙葉的顏色特征數(shù)據(jù)訓(xùn)練SVDD單值分類器,即建立一個超球體緊緊包圍住煙葉數(shù)據(jù),再將煙葉異物混雜的特征數(shù)據(jù)輸入訓(xùn)練好的分類器進(jìn)行分類識別,把落在超球體內(nèi)的樣本判別為煙葉,把落在超球體外面的樣本判別為異物。?
在異物中選取橙紙、黑橡膠、、灰紙箱、紅紙、黃海綿、黃皮帶、綠紙這幾種典型異物作為非目標(biāo)樣本分析。在相同攝像條件下拍攝煙葉與異物圖像,并對煙葉和異物各抽取一定數(shù)量的樣本點,提取出相應(yīng)的RGB分量,以及HSV分量。表1和表2分別為對煙葉異物的RGB與HSV各分量的均值方差統(tǒng)計。?
熱點文章閱讀