前言:想要寫出一篇引人入勝的文章?我們特意為您整理了數據挖掘技術在土壤肥力評價中應用范文,希望能給你帶來靈感和參考,敬請閱讀。
摘要:土壤肥力狀況直接影響農作物的產量,傳統的農業生產自動化水平低,化肥和農藥的施放無法做到精確把控,同時缺乏對土壤肥力的實時在線監測和評價,不利于農作物的生長,嚴重時會給農田和生態環境帶來較大的污染,影響農作物的生產質量和產量,對人類和牲畜的人身安全構成了較大威脅。為此,深入研究分析了數據挖掘技術,并將其應用在土壤肥力評價系統中,針對具體的研究區域進行土壤圖設計和土壤狀態分析,建立了土壤肥力采樣數據庫,并利用數據挖掘技術中的關聯規則算法對土壤肥力和農作物產量進行等級分類,計算分析得到土壤肥力與農作物產量之間的關聯關系。結果表明:智能數據挖掘技術在土壤肥力評價系統中發揮了重要作用,在對土壤肥力進行準確監控的同時能夠準確評價土壤肥力與農作物產量之間的相關程度,對指導農業生產、提高農作物生產質量和產量具有重要意義。
關鍵詞:土壤肥力評價;數據挖掘;數據庫;關聯規則算法
0引言
我國傳統的農藥和化肥施放主要依靠作業人員的經驗進行,施放效率低,農藥利用率低,造成了農藥和化肥的浪費,給生態環境帶來了一定的影響。農藥和化肥的不合理利用會對農作物的生長產生一定的制約,嚴重時會對消費者的健康造成威脅,因此對農藥和化肥的合理利用、對土壤肥力的準確監控越來越引起諸多學者的關注。隨著科學技術的發展,很多學者將神經網絡算法、模糊理論及專家系統等先進理論應用于土壤肥力監測和評價系統中,對土壤肥力的狀態和信息有了一定的掌握。各種智能算法和先進理論解決了土壤肥力評價指標的優化問題,但是對土壤肥力評價系統的數據來源、數據實時性和數據可用性無法精準掌握,導致各類智能算法在土壤肥力評價系統中實時性和準確性不高,對土壤肥力評價的指導性不強。為此,筆者深入研究數據挖掘技術,通過比較其中的關聯規則法、聚類分析法和人工神經網絡法等不同算法,選用關聯規則法完成對所選研究區域土壤肥力狀況的分析,繪制了土壤肥力的空間變異圖,實現了對土壤肥力監測的可視化,并應用關聯規則法得到土壤肥力和農作物產量的關聯關系,對指導農業生產作業、提高農業生產效益具有重要的借鑒意義。
1數據挖掘概述
數據挖掘是一個信息探索的過程,是從大量的隨機數據中提取有用的潛在信息和數據,并轉換為可以理解的數據。此類隨機數據多為不完全數據,并伴隨有噪音、干擾信號等隨機信息。數據挖掘的對象既包括數據庫,還可以包含各類文本、視頻、圖像和Web數據等,解決了傳統數據庫無法預測未來發展趨勢的難題。數據挖掘的分析方法較多,主要包括決策樹、聚類分析法、關聯規則法、人工神經網絡法和時序算法。具體功能如下:1)數據總結。運用統計分析法(求平均值、加權處理、直方圖)對數據源信息進行統計分析,便于數據分類。2)數據分類。利用分類函數將待數據挖掘的數據按不同類型、不同標識進行分類。3)聚類。將數據庫信息按集群進行劃分,利用聚類分析法找出集群中特性相似的集群進行區分。4)關聯分析。通過關聯規則法計算分析數據庫中同一事件的不同項的關聯性,根據關聯性預測結果。5)預測。根據數據挖掘的結果對研究對象的發展規律進行預測,分析后續變化趨勢。
2研究區域概況
選取的研究區域為吉林省農安縣開安鎮,坐標東經121°10'、北緯44°10',大陸性季風氣候,地下水源豐富,年平均降水量535㎜,為國家農業示范基地。
2.1土壤圖設計通過查閱資料、查找相關部門網站信息,得到第2次土壤普查圖(比例1:5)。以此為基礎,完成該研究區域土壤矢量圖的繪制,如圖1所示。
2.2土壤狀態分析
由圖1可知,農安縣土壤的類型較多。按土壤的類型和狀態可將農安縣土壤進行分類,如表1所示。
2.3土壤狀態采樣
將農安縣土壤矢量圖和土壤狀態等數據進行分析處理,構建土壤狀態數據庫,重點監測土壤養分值和采樣點的經緯度。土壤養分值主要包括3個指標,即堿解氮、有效磷和速效鉀。農安縣土壤狀態采樣數據如表2所示。
3土壤肥力分布變化
通過對不同采樣點的土壤肥力狀態的監測,完成了對土壤不同養分堿解氮、有效磷和速效鉀的含量分析和研究,得到土壤中堿解氮、有效磷和速效鉀的空間分布圖,如圖2、圖3所示。為確保數據的可靠性,對不同年份的土壤養分值進行匯總和分析,最后得到連續2年的堿解氮和速效鉀的空間分布變化圖。由圖2和圖3可知:土壤堿解氮含量呈下降趨勢。其中,第1年最小值為108mg/kg,最大值為216mg/kg,差值為108mg/kg;第2年最小值為86mg/kg,最大值為173mg/kg,差值為87mg/kg。這表明,經過連續2年的精準施肥后,土壤肥力的差異逐漸變小。
4數據挖掘分析
4.1關聯規則算法
應用關聯規則算法進行數據挖掘時,主要解決兩個問題,即頻繁項集和關聯規則。關聯規則算法的作業步驟為:①挖掘頻繁項集;②生成關聯規則。關聯規則的頻繁項集與支持度相關,即數據庫中支持度大于規定支持度的項目。關聯規則與支持度和可信度相關,即支持度和可信度均大于規定支持度和可信度的關聯規則。支持度sup的計算公式為sup(A=>B)=sup(a∪b)={T|T∈Dand(a∪b)}D其中:支持度sup表示事件A和事件B同時出現的概率。可信度conf的計算公式為conf(a=>b)=sup(a∪b)sup(a)其中,可信度conf表示條件概率。提升度lift的計算公式為lift=P(B|A)P(B)其中:提升度lift表示事件A對事件B的提升度。lift=1,說明事件A與事件B沒有關聯;lift>1,說明事件A與事件B相關聯,且關聯規則較好,關聯性好;lift<1,說明事件A與事件B相排斥,得到的關聯規則沒有意義,關聯性差。
4.2關聯規則分析
關聯規則算法是基于數據挖掘工具Weka軟件完成的。通過對采樣數據的分析計算,并將數據導入Weka軟件中,建立新的數據源,利用軟件自帶的算法庫,篩選頻繁項集,根據專家經驗將數據分為6組,進行土壤肥力和農作物產量的關聯規則計算,得到土壤肥力和產量數據的等級分類,如表3所示。由表3可知:根據專家經驗,土壤養分值劃分為6個等級,農作物產量劃分為3個等級。根據關聯規則,計算分析土壤肥力與農作物產量之間的關聯性。
4.3關聯結果
運行Weka軟件,選取Apriori算法,設定支持度sup范圍為10%~100%,提升度lift大于1.0,計算關聯規則,得到關聯規則結果,如圖4所示。由圖4可知:當速效磷等級為D時,農作物產量為A的概率為95%;當速效鉀為等級D的時候,農作物產量為A的概率為63%;當速效鉀等級為E時,農作物產量為B的概率為46%;當農作物產量為A時,速效磷等級為D的概率為38%;當速效磷等級為D時,農作物產量為C的概率為45%。
5結論
為解決傳統土壤肥力監測不及時、肥力評價不準確等問題,深入分析了數據挖掘技術,對數據挖掘的主要算法和功能進行分析,完成了研究區域的土壤圖繪制和土壤狀態分析。同時,對不同采樣點的土壤肥力和經緯度進行監測,完成了土壤不同養分堿解氮、有效磷和速效鉀的空間分布變化趨勢的分析。應用關聯規則算法,利用數據挖掘工具Weka,完成土壤肥力與產量的等級分類,得到土壤肥力與農作物產量的關聯關系。結果表明:智能數據挖掘技術在土壤肥力評價系統中發揮了重要作用,既可以對土壤肥力的空間分布進行準確監測,又能夠對農作物產量進行準確預測,在提高農藥和化肥利用率的同時減小對生態環境的危害,對提高農業生產質量具有顯著效果。
作者:徐霖 單位:無錫工藝職業技術學院