數(shù)據(jù)挖掘技術(shù)在茶葉病蟲(chóng)害預(yù)警中的研究與應(yīng)用
發(fā)布時(shí)間:2019-08-31 來(lái)源: 散文精選 點(diǎn)擊:
摘要:數(shù)據(jù)挖掘技術(shù)廣泛應(yīng)用于農(nóng)業(yè)生產(chǎn),采用Weka軟件的關(guān)聯(lián)規(guī)則挖掘算法,對(duì)近3年氣象和病蟲(chóng)害監(jiān)測(cè)數(shù)據(jù)庫(kù)的重要特征屬性進(jìn)行挖掘,得到氣象條件與茶葉病蟲(chóng)害發(fā)生等級(jí)之間的關(guān)聯(lián)規(guī)則,旨在為做好病蟲(chóng)害預(yù)防準(zhǔn)備和發(fā)出預(yù)警信號(hào)提供決策支持。
關(guān)鍵詞:數(shù)據(jù)挖掘;茶葉病蟲(chóng)害;關(guān)聯(lián)規(guī)則;預(yù)警;應(yīng)用
中圖分類(lèi)號(hào):TP311.13;S685.14 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):0439-8114(2013)24-6172-03
數(shù)據(jù)挖掘(Data mining,DM)也叫數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn)(Knowledge discovery from database,KDD),是20世紀(jì)90年代發(fā)展起來(lái)的數(shù)據(jù)庫(kù)系統(tǒng)和數(shù)據(jù)庫(kù)應(yīng)用領(lǐng)域一個(gè)欣欣向榮的前沿學(xué)科,對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析以及模型化處理,提取隱含在其中的但又是潛在有用的信息和知識(shí)的過(guò)程。在過(guò)去的幾年中,我國(guó)曾耗費(fèi)巨資進(jìn)行各種農(nóng)業(yè)數(shù)據(jù)的普查,積累了各種作物的苗情、土情、肥情、水情、蟲(chóng)情、氣象和災(zāi)害等數(shù)據(jù)資料,但基本上是作為文件存檔,而在生產(chǎn)過(guò)程中,我國(guó)許多地區(qū)還處在盲目生產(chǎn)、無(wú)計(jì)劃無(wú)規(guī)律的狀態(tài)[1]。數(shù)據(jù)挖掘通過(guò)分析存在于數(shù)據(jù)庫(kù)里的數(shù)據(jù)來(lái)解決問(wèn)題,已應(yīng)用于茶葉鑒定[2]和農(nóng)產(chǎn)品安全生產(chǎn)[3]。在茶葉病蟲(chóng)害數(shù)據(jù)庫(kù)中合理使用數(shù)據(jù)挖掘技術(shù),挖掘出氣象條件與茶葉病蟲(chóng)害發(fā)生等級(jí)之間的關(guān)聯(lián)關(guān)系,有助于依據(jù)天氣預(yù)報(bào)對(duì)茶葉病蟲(chóng)害及時(shí)發(fā)出預(yù)警信號(hào),提高茶葉的產(chǎn)量和質(zhì)量。
云南省常發(fā)生的茶葉主要蟲(chóng)害有小綠葉蟬(Empoasca pirisuga Matumura)、茶葉斑蛾(Eterusia aedea Linnaeus)、茶細(xì)蛾(Caloptilia theivora Walsingham)等,其中小綠葉蟬是云南省普洱市茶葉主產(chǎn)區(qū)中心目標(biāo)害蟲(chóng),常年造成茶葉產(chǎn)量損失達(dá)10%~15%[4]。本研究以小綠葉蟬為主要研究對(duì)象,根據(jù)該市茶葉研究所提供的近3年氣象和病蟲(chóng)害監(jiān)測(cè)數(shù)據(jù)庫(kù),抽取月份(Month)、平均氣溫(Average temperature)、最高氣溫(Maximum temperature)、最低氣溫(Minimum temperature)、降雨量(Rainfall)、日照時(shí)數(shù)(Sunshine hours)和小綠葉蟬蟲(chóng)數(shù)(Insect pest level)7個(gè)特征屬性,采用理論與實(shí)踐相結(jié)合的研究方法,運(yùn)用數(shù)據(jù)挖掘Weka平臺(tái)的關(guān)聯(lián)規(guī)則算法實(shí)現(xiàn)挖掘目標(biāo)。
1 數(shù)據(jù)預(yù)處理
對(duì)氣象和病蟲(chóng)害數(shù)據(jù)庫(kù)先進(jìn)行數(shù)據(jù)格式轉(zhuǎn)換,原始的數(shù)據(jù)是存儲(chǔ)為Xls的表文件,先另存為Csv格式文件,然后打開(kāi)Weka,選擇Tools菜單下的ArffViewer模塊,找到此Csv文件,重新保存為Arff格式。其次進(jìn)行數(shù)據(jù)類(lèi)型轉(zhuǎn)換,7個(gè)特征屬性中有連續(xù)的Numeric數(shù)值型數(shù)據(jù),而關(guān)聯(lián)規(guī)則挖掘算法處理的是Nominal布爾型離散數(shù)據(jù),這就需要對(duì)挖掘數(shù)據(jù)集分組,轉(zhuǎn)換成布爾型離散數(shù)據(jù),茶葉蟲(chóng)害根據(jù)小綠葉蟬蟲(chóng)數(shù)分為4個(gè)等級(jí),分別是輕度發(fā)生(Mild)、中度發(fā)生(Moderate)、嚴(yán)重發(fā)生(Serious)、非常嚴(yán)重發(fā)生(Very serious),轉(zhuǎn)換后的數(shù)據(jù)如圖1所示。通過(guò)Preprocess中的Visualize all可視化界面,可以很直觀地看到數(shù)據(jù)的分類(lèi)匯總可視化圖,如圖2所示。
2 關(guān)聯(lián)規(guī)則挖掘
2.1 概念
根據(jù)得到的挖掘結(jié)果,可以獲取氣象條件與茶葉病蟲(chóng)害發(fā)生等級(jí)的關(guān)聯(lián)規(guī)則:降雨量小于55.77 mm或者日照時(shí)間在200.10~227.88 h的月份,小綠葉蟬蟲(chóng)害輕度發(fā)生;最高氣溫高于30.67 ℃或者日照時(shí)間少于137.17 h的月份,小綠葉蟬蟲(chóng)害中度發(fā)生;降雨量小于141.18 mm或者日照時(shí)間在87.32~113.44 h的月份,小綠葉蟬蟲(chóng)害嚴(yán)重發(fā)生;最高氣溫在29.27~30.73 ℃的月份,小綠葉蟬蟲(chóng)害發(fā)生非常嚴(yán)重。這些聯(lián)系的置信度都大于90%,降低置信度進(jìn)行挖掘,會(huì)有更多的規(guī)則。
3 結(jié)語(yǔ)
可見(jiàn),小綠葉蟬蟲(chóng)害的發(fā)生與氣象條件息息相關(guān),茶農(nóng)可以根據(jù)天氣預(yù)報(bào)提前做好預(yù)防蟲(chóng)害發(fā)生的準(zhǔn)備,如采取噴霧預(yù)防農(nóng)藥、人工遮陰、人工干預(yù)氣象等措施;農(nóng)業(yè)技術(shù)部門(mén)提前發(fā)出預(yù)警信號(hào),為蟲(chóng)害防治提供決策支持。
參考文獻(xiàn):
[1] 勞 飛,朱玉業(yè).數(shù)據(jù)挖掘技術(shù)在農(nóng)業(yè)中的應(yīng)用[J].安徽農(nóng)業(yè)科學(xué),2007,35(13):4053,4082.
[2] 張 超,張婭玲,楊如艷.數(shù)據(jù)挖掘在茶葉鑒定中的應(yīng)用[J].安徽農(nóng)業(yè)科學(xué),2012,40(2):1219-1220.
[3] 張 洵.數(shù)據(jù)挖掘在農(nóng)產(chǎn)品安全生產(chǎn)中的應(yīng)用[J].安徽農(nóng)業(yè)科學(xué),2007,35(34):11294-11295.
[4] 唐智英,王祖鳳.關(guān)聯(lián)規(guī)則挖掘技術(shù)在茶葉病蟲(chóng)害中的研究與應(yīng)用[J].計(jì)算機(jī)光盤(pán)軟件與應(yīng)用,2012(15):114-115.
[5] TAN P N, STEINBACH M, KUMAR V.數(shù)據(jù)挖掘?qū)д揫M].范 明,范宏建,譯.北京:人民郵電出版社,2006.
相關(guān)熱詞搜索:病蟲(chóng)害 預(yù)警 茶葉 數(shù)據(jù)挖掘 研究
熱點(diǎn)文章閱讀