生態(tài)農(nóng)業(yè)數(shù)據(jù)挖掘技術(shù)應(yīng)用

時(shí)間:2022-04-01 10:01:02

導(dǎo)語(yǔ):生態(tài)農(nóng)業(yè)數(shù)據(jù)挖掘技術(shù)應(yīng)用一文來(lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢(xún)客服老師,歡迎參考。

生態(tài)農(nóng)業(yè)數(shù)據(jù)挖掘技術(shù)應(yīng)用

1數(shù)據(jù)挖掘的定義和方法

數(shù)據(jù)挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中,提取出隱含在其中的、新穎的、未知的、但又有潛在有用的高質(zhì)量的信息。數(shù)據(jù)挖掘是面向應(yīng)用的。它不僅是面向特定數(shù)據(jù)庫(kù)的簡(jiǎn)單檢索查詢(xún)調(diào)用,而且要對(duì)這些數(shù)據(jù)進(jìn)行微觀和宏觀的統(tǒng)計(jì)、分析、綜合和推理,發(fā)現(xiàn)事件間的相互關(guān)聯(lián)關(guān)系,利用已有的數(shù)據(jù)對(duì)未來(lái)的活動(dòng)進(jìn)行預(yù)測(cè)[4]。數(shù)據(jù)挖掘常用的技術(shù)有:統(tǒng)計(jì)分析技術(shù),包括線(xiàn)性分析和非線(xiàn)性分析、回歸分析、邏輯回歸分析、單變量分析、多變量分析、時(shí)間序列分析、最近鄰算法和聚類(lèi)分析等技術(shù)[5];知識(shí)發(fā)現(xiàn)類(lèi)技術(shù),包括人工神經(jīng)網(wǎng)絡(luò)、決策樹(shù)、遺傳算法、粗糙集、規(guī)則發(fā)現(xiàn)和關(guān)聯(lián)順序等。應(yīng)用這些技術(shù)可完成對(duì)數(shù)據(jù)特征化區(qū)分,關(guān)聯(lián)分析,分類(lèi)和預(yù)測(cè),聚類(lèi)分析、演變分析等挖掘功能。在實(shí)際應(yīng)用中,應(yīng)結(jié)合具體應(yīng)用領(lǐng)域?qū)⒍喾N技術(shù)相結(jié)合,以期獲得最佳的挖掘質(zhì)量和效果。

2數(shù)據(jù)挖掘?qū)嵤┻^(guò)程

數(shù)據(jù)挖掘?qū)嵤┻^(guò)程分為以下4個(gè)步驟[6]。

2.1數(shù)據(jù)定義和數(shù)據(jù)清洗

創(chuàng)建元數(shù)據(jù),定義相關(guān)領(lǐng)域,填寫(xiě)空缺值、平滑數(shù)據(jù)噪聲、識(shí)別刪除孤立點(diǎn)以及處理不一致數(shù)據(jù)。

2.2數(shù)據(jù)聚集和數(shù)據(jù)挖掘模型開(kāi)發(fā)

集成多個(gè)數(shù)據(jù)庫(kù)、立方體和文件的數(shù)據(jù)。對(duì)數(shù)據(jù)進(jìn)行概化(用高層次的概念代替低層次的原始數(shù)據(jù))、規(guī)范化(將屬性數(shù)據(jù)按一定的比例縮放到特定區(qū)間)、屬性構(gòu)造、數(shù)據(jù)歸約(刪除弱相關(guān)的屬性、數(shù)據(jù)濃縮)。選擇知識(shí)發(fā)現(xiàn)的方法,確定模型。

2.3數(shù)據(jù)挖掘

運(yùn)用確定的數(shù)據(jù)挖掘模型,從數(shù)據(jù)中提取出用戶(hù)需要的知識(shí),用某種特定的方式表示或使用常用的表示方式,以滿(mǎn)足用戶(hù)的需求,使數(shù)據(jù)挖掘工作效用最大化。

2.4知識(shí)評(píng)估

知識(shí)評(píng)估包括解釋、推演及模型調(diào)整??蓪l(fā)現(xiàn)的知識(shí)以用戶(hù)需求的方式進(jìn)行表現(xiàn),根據(jù)用戶(hù)需求對(duì)過(guò)程中的某些處理階段進(jìn)行優(yōu)化,直至最大限度地滿(mǎn)足用戶(hù)的需求。

3生態(tài)農(nóng)業(yè)

“生態(tài)農(nóng)業(yè)”(EcologicalAgriculture)一詞最初是由美國(guó)土壤學(xué)家W.Albreche于1970年提出的。1981年英國(guó)農(nóng)學(xué)家MWorhtington將生態(tài)農(nóng)業(yè)明確定義為“生態(tài)上能自我維持、低投入,經(jīng)濟(jì)上有活力,在環(huán)境、倫理和審美方面可接受的小型農(nóng)業(yè)”[7]。中國(guó)生態(tài)農(nóng)業(yè)(ChineseEcologicalAgriculture)具有深厚、古老的農(nóng)業(yè)傳統(tǒng)背景和基礎(chǔ),有其本身一定的發(fā)生發(fā)展過(guò)程,具有獨(dú)特的個(gè)性,即不否定化肥、農(nóng)藥、激素等的適當(dāng)投入,追求技術(shù)和能量的高效,并具有勞力密集和技術(shù)密集相結(jié)合的特征。中國(guó)生態(tài)農(nóng)業(yè)是在傳統(tǒng)農(nóng)業(yè)的基礎(chǔ)上發(fā)展起來(lái)的,精耕細(xì)作、培肥地力、間套輪作、林糧間作、基塘種養(yǎng)、農(nóng)牧結(jié)合等傳統(tǒng)農(nóng)業(yè)精華與現(xiàn)代化技術(shù)相結(jié)合,逐步發(fā)展成為具有中國(guó)特色的農(nóng)業(yè)綜合生產(chǎn)體系[8]。我國(guó)生態(tài)農(nóng)業(yè)是綜合運(yùn)用了人與自然的關(guān)系原理,以生態(tài)學(xué)、生態(tài)經(jīng)濟(jì)學(xué)、生物學(xué)、社會(huì)學(xué)等理論為基礎(chǔ),采用系統(tǒng)工程方法和先進(jìn)科學(xué)技術(shù)成就,以研究生態(tài)經(jīng)濟(jì)協(xié)調(diào)發(fā)展,合理利用自然資源、保護(hù)生態(tài)環(huán)境為主題,以實(shí)現(xiàn)農(nóng)業(yè)和農(nóng)村經(jīng)濟(jì)持續(xù)協(xié)調(diào)發(fā)展為目的,強(qiáng)調(diào)生態(tài)效益,兼顧經(jīng)濟(jì)效益和社會(huì)效益的新型農(nóng)業(yè)發(fā)展模式[9]?,F(xiàn)代高新技術(shù)會(huì)更加廣泛地滲透于生態(tài)農(nóng)業(yè)中由于生態(tài)農(nóng)業(yè)所追求的目標(biāo)是高效益和無(wú)污染,而要實(shí)現(xiàn)這個(gè)目標(biāo)就必須更多地依靠現(xiàn)代高新技術(shù)[10]。

4數(shù)據(jù)挖掘技術(shù)在生態(tài)農(nóng)業(yè)上的應(yīng)用

農(nóng)業(yè)是一巨型復(fù)雜系統(tǒng)。我國(guó)土地遼闊,土壤類(lèi)型眾多,作物品種復(fù)雜,病蟲(chóng)害發(fā)生頻繁且癥象不斷變化,肥水、密度以及氣候相互之間的關(guān)系和影響,許多還未被人們?nèi)フJ(rèn)識(shí),然而所積累的數(shù)據(jù)之多是任何一個(gè)領(lǐng)域所沒(méi)有的,它具有大量、多維、動(dòng)態(tài)、不完整、不確定等特性。由于農(nóng)業(yè)自身的一些特點(diǎn),如:土壤類(lèi)型眾多,作物品種復(fù)雜,病蟲(chóng)害發(fā)生頻繁且癥象不斷變化,肥水、密度以及氣候相互之間的關(guān)系和影響,就使得關(guān)于它們的數(shù)據(jù)庫(kù)與知識(shí)庫(kù)具有大型、多維、動(dòng)態(tài)、不完全(缺值)、不確定(數(shù)據(jù)中的系統(tǒng)或隨機(jī)噪聲)、稀疏性(很少甚至沒(méi)有有用的記錄)等特征[11]。因此,數(shù)據(jù)挖掘工具應(yīng)能處理農(nóng)業(yè)數(shù)據(jù)的這些特征。另外,農(nóng)業(yè)數(shù)據(jù)還有另外一個(gè)特征,它的測(cè)量與時(shí)間有關(guān),在數(shù)據(jù)分析過(guò)程中要求考慮時(shí)間因素,以便進(jìn)行預(yù)測(cè)。目前及今后數(shù)據(jù)挖掘技術(shù)在生態(tài)農(nóng)業(yè)中的應(yīng)用主要集中在以下幾個(gè)方面。

4.1生態(tài)農(nóng)業(yè)類(lèi)型研究的應(yīng)用

通過(guò)長(zhǎng)期生態(tài)定點(diǎn)觀測(cè)站,包括農(nóng)田生態(tài)系統(tǒng)、草地與荒漠生態(tài)系統(tǒng)、森林生態(tài)系統(tǒng)以及湖泊濕地海灣生態(tài)系統(tǒng)各野外觀測(cè)站的長(zhǎng)期監(jiān)測(cè)數(shù)據(jù)(包括生物、土壤、水分和氣象四個(gè)部分)信息、觀測(cè)樣地信息與水分、土壤、大氣和生物監(jiān)測(cè)信息以及相關(guān)研究成果的數(shù)據(jù)。構(gòu)建相關(guān)數(shù)據(jù)庫(kù),利用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)和數(shù)據(jù)挖掘技術(shù)對(duì)大量積累的數(shù)據(jù)進(jìn)行挖掘,運(yùn)用序列分析、聚類(lèi)分析和關(guān)聯(lián)分析對(duì)生態(tài)農(nóng)業(yè)類(lèi)型相關(guān)因子進(jìn)行綜合分析,開(kāi)展不同生態(tài)農(nóng)業(yè)類(lèi)型結(jié)構(gòu)與功能的研究。

4.2生態(tài)農(nóng)業(yè)分類(lèi)體系研究的應(yīng)用

生態(tài)農(nóng)業(yè)的分類(lèi)體現(xiàn)出區(qū)域特點(diǎn),生態(tài)農(nóng)業(yè)建設(shè)區(qū)域類(lèi)型是結(jié)合本地自然條件建設(shè)的具有地區(qū)特色、符合生態(tài)規(guī)律和經(jīng)濟(jì)規(guī)律的區(qū)域生態(tài)經(jīng)濟(jì)系統(tǒng)。具體可分為以下九類(lèi):水田生態(tài)農(nóng)業(yè)、旱地生態(tài)農(nóng)業(yè)、山地生態(tài)農(nóng)業(yè)、水域生態(tài)農(nóng)業(yè)、低地生態(tài)農(nóng)業(yè)、草地生態(tài)農(nóng)業(yè)、園地生態(tài)農(nóng)業(yè)、庭院生態(tài)農(nóng)業(yè)、村鎮(zhèn)生態(tài)農(nóng)業(yè)。在每一生態(tài)農(nóng)業(yè)建設(shè)區(qū)域類(lèi)型中、根據(jù)生態(tài)農(nóng)業(yè)系統(tǒng)的結(jié)構(gòu)和功能分為4個(gè)生態(tài)農(nóng)業(yè)系統(tǒng)結(jié)構(gòu)類(lèi)型、即平面結(jié)構(gòu)型、立體結(jié)構(gòu)型、時(shí)序結(jié)構(gòu)型、鏈?zhǔn)浇Y(jié)構(gòu)型。開(kāi)展對(duì)現(xiàn)有生態(tài)農(nóng)業(yè)類(lèi)型進(jìn)行全面調(diào)查,采集各類(lèi)生態(tài)農(nóng)業(yè)類(lèi)型的地貌、土壤、水文、氣候等環(huán)境因子數(shù)據(jù),利用數(shù)據(jù)挖掘技術(shù)的關(guān)聯(lián)規(guī)則和粗糙集技術(shù),可以確定生態(tài)農(nóng)業(yè)類(lèi)型的關(guān)鍵因子,排除干擾因子。通過(guò)相關(guān)統(tǒng)計(jì)模型,可以確定各區(qū)域生態(tài)農(nóng)業(yè)類(lèi)型的相似拐點(diǎn),從而得到適應(yīng)不同地區(qū)特點(diǎn)的生態(tài)農(nóng)業(yè)類(lèi)型優(yōu)化方案。

4.3生態(tài)農(nóng)業(yè)布局研究的應(yīng)用

地理信息系統(tǒng)(GIS)技術(shù)用于國(guó)家和地區(qū)范圍內(nèi)農(nóng)業(yè)相關(guān)的評(píng)估已有多年[12]。很多特定的農(nóng)場(chǎng)系統(tǒng)利用GIS和一些相關(guān)技術(shù)來(lái)收集空間參考數(shù)據(jù),進(jìn)行空間分析和制定決策,作物狀況和收成、土地能力、土壤侵蝕、土壤密度、地表和地下水污染、蟲(chóng)害襲擊、雜草清除和氣候變化影響的評(píng)估,空間數(shù)據(jù)挖掘技術(shù)是DM技術(shù)的分支,是數(shù)據(jù)挖掘的主要研究方向之一,是KDD(KnowledgeDiscoveryinDatabase)技術(shù)在空間數(shù)據(jù)庫(kù)方面應(yīng)用的延伸??臻g數(shù)據(jù)挖掘技術(shù)的應(yīng)用一般可使GIS查詢(xún)和分析技術(shù)提高到發(fā)現(xiàn)知識(shí)的新階段,另一方面,從中發(fā)現(xiàn)的知識(shí)可構(gòu)成知識(shí)庫(kù)用于建立智能化的GIS系統(tǒng),地理信息系統(tǒng)技術(shù)與空間數(shù)據(jù)挖掘技術(shù)的集成能夠更好開(kāi)展生態(tài)農(nóng)業(yè)布局研究,挖掘影響生態(tài)農(nóng)業(yè)合理布局的關(guān)鍵因子,逐步實(shí)現(xiàn)生態(tài)農(nóng)業(yè)的合理布局。

4.4生態(tài)農(nóng)業(yè)評(píng)價(jià)方法的應(yīng)用

參照現(xiàn)階段我國(guó)生態(tài)農(nóng)業(yè)建設(shè)的規(guī)模和發(fā)展方向,運(yùn)用層次分析法(簡(jiǎn)稱(chēng)AHP)和模糊數(shù)學(xué)等系統(tǒng)分析方法進(jìn)行研究,給出了一套以定量為主、定性與定量相結(jié)合的簡(jiǎn)便易行的生態(tài)農(nóng)業(yè)綜合效益評(píng)價(jià)指標(biāo)體系與評(píng)價(jià)方法,將生態(tài)農(nóng)業(yè)的綜合效益分為生態(tài)效益、經(jīng)濟(jì)效益和社會(huì)效益三個(gè)方面(也即三個(gè)準(zhǔn)則),并將諸方面分解為若干具體指標(biāo)[13]。形成具有一個(gè)總目標(biāo)、三項(xiàng)準(zhǔn)則(子目標(biāo))和18個(gè)具體指標(biāo)的三層次生態(tài)農(nóng)業(yè)綜合效益評(píng)價(jià)指標(biāo)體系。通過(guò)對(duì)指標(biāo)體系的數(shù)據(jù)進(jìn)行量化,構(gòu)建數(shù)據(jù)庫(kù),利用數(shù)據(jù)挖掘工具和統(tǒng)計(jì)模型以及神經(jīng)網(wǎng)絡(luò)技術(shù),對(duì)數(shù)據(jù)庫(kù)的數(shù)據(jù)仔細(xì)研究,可以挖掘出評(píng)價(jià)指標(biāo)之間的相關(guān)性,設(shè)置合理的指標(biāo)權(quán)重,根據(jù)評(píng)價(jià)年效益指數(shù)和相對(duì)指數(shù)的高低作出對(duì)生態(tài)農(nóng)業(yè)系統(tǒng)綜合效益的分析判斷。進(jìn)一步探討生態(tài)農(nóng)業(yè)評(píng)價(jià)方法

5結(jié)束語(yǔ)

從農(nóng)業(yè)現(xiàn)代化走向農(nóng)業(yè)信息化是農(nóng)業(yè)發(fā)展的必然規(guī)律。數(shù)據(jù)挖掘是一個(gè)新興的、潛力巨大的研究領(lǐng)域。生態(tài)農(nóng)業(yè)領(lǐng)域的數(shù)據(jù)挖掘是計(jì)算機(jī)技術(shù)人工智能和統(tǒng)計(jì)學(xué)等與現(xiàn)代農(nóng)業(yè)相結(jié)合的產(chǎn)物。數(shù)據(jù)挖掘技術(shù)在生態(tài)農(nóng)業(yè)領(lǐng)域的應(yīng)用還處于起步階段,對(duì)它的理解和認(rèn)識(shí)還需要一個(gè)過(guò)程,具體應(yīng)用方案和技術(shù)還需要不斷探索和研究。數(shù)據(jù)挖掘只是根據(jù)純數(shù)據(jù)之間的關(guān)系挖掘出一定的決策模型,但它無(wú)法完成實(shí)現(xiàn)對(duì)結(jié)果的解析,只是給研究和應(yīng)用人員提供一個(gè)強(qiáng)大的工具,因此必須將它和現(xiàn)有的工具結(jié)合起來(lái),才能夠使模型更完備和成熟。數(shù)據(jù)挖掘技術(shù)作為具有潛力巨大的研究領(lǐng)域,通過(guò)與現(xiàn)代農(nóng)業(yè)相結(jié)合,將在農(nóng)業(yè)科研、生產(chǎn)、管理等方面發(fā)揮巨大的作用,這對(duì)推動(dòng)我國(guó)農(nóng)業(yè)現(xiàn)代化的發(fā)展具有重要的作用。

作者:劉暉林永輝林怡工作單位:福建省農(nóng)業(yè)科學(xué)院農(nóng)業(yè)生態(tài)研究所福建省山地草業(yè)工程技術(shù)研究中心