前言:想要寫出一篇引人入勝的文章?我們特意為您整理了農技推廣論文:農技服務系統建構思考范文,希望能給你帶來靈感和參考,敬請閱讀。
本文作者:張華千、滕桂法、劉小利 單位:河北農業大學
隨著短信平臺使用人數的增加,短信量呈幾何數量增長,傳統的工作模式在面對海量信息以及處理重復或冗余信息方面顯的力不從心。專家要花去大量時間處理重復性的問題,系統的工作效率將為變得很低,專家資源得不到合理配置。因此,規范短信息服務,在整個智能應答短信平臺的構建當中是極其重要的[2]。短信技術的低門檻性、短信平臺的快捷性和高效性是值得肯定的。本文借鑒了垃圾短信過濾方面的經驗,在原有農技推廣短信平臺的基礎上,設計了一種具備智能應答功能的農技推廣短信平臺。
智能應答短信平臺
智能應答短信平臺自上而下主要分為應用層和實現層(包含業務單元與管理單元)、數據層和接入層。其中,應用層與實現層主要通過HTTP與WebService服務接口實現無縫接入;數據層負責管理短信平臺相關數據庫,將短信過濾和分類形成目標短信,并預留接口對接專家數據庫以實現智能應答等擴展應用。三大通信運營商短信網關通過接入層與短信平臺對接。體系結構如圖1所示。應用層分布主要包括農技推廣單位在信息化進程中建立起來的各種B/S和C/S結構的信息管理系統以及各類數據庫系統。這些系統都有點對點或者點對多點的信息的需求,系統架構和編程語言不盡同,因此宜采用WebService技術實現這些異構系統到短信平臺的統一接入。實現層根據業務與管理的聯系將短信平臺劃分為諸多模塊,做到了業務與管理形式上分離、邏輯上緊密聯系。實現層不同功能模塊通過不同的協議或算法實現其具體功能,如通過SMS(ShortMessagingService)協議處理短消息文本,MMS(MultimediaMes-sagingService)處理相關文本或圖片請求,通過數據路由控制算法控制數據與運營商網關對接過程中具體的路由跳轉方法,通過調度算法來協調各功能模塊間業務邏輯。數據層為短信平臺系統提供數據支撐與應用擴展。本文的關鍵即在數據層中進行改造,從而實現自動應答功能。數據層的核心是數據庫接口模塊。短信平臺數據庫及擴展應用服務(本文擴展了專家數據庫)通過數據庫接口模塊進行數據的通信和共享。短信分類器具備將海量短信分類并轉化成可以與專家數據庫進行完全或模糊匹配的標準短信的功能。接入層通過SMPP(ShortMessagePeertoPeer,短信息點對點協議)與移動通信運營商的短信網關通信。由于國內的三大電信運營商在互聯網短信網關的通信上制定了不同的協議標準,如中國移動的CMPP協議、中國聯通的SGIP協議和中國電信的SMGP協議。因此,在接入層相應地將接入模塊分為中國移動接入模塊、中國聯通接入模塊和中國電信接入模塊,以保障不同手機號段的短信都能接入到相應的運營商網關中[3]。
傳統的短信平臺在農技推廣中一般是以農戶、短信平臺和專家隊伍“三點一線”的模式進行工作的。優點是業務模式簡單、技術門檻低和易于操作;缺點是忽視了農戶與專家知識水平上的巨大差距,沒有全面地考慮到農戶田間作業的季節性特點,最終往往形成農戶對反饋短信的含義一知半解;專家對一個重復問題多次做出相同解釋,浪費服務資源;農閑時專家工作較為輕松,農忙時問題量龐大,反饋結果難以實時反饋,農戶長時間得不到專家的建議,造成經濟損失。智能應答短信平臺綜合考慮了傳統短信平臺的優缺點,引入了短信分類與自動應答功能。傳統短信平臺工作統程如圖2所示,智能應答短信平臺工作流程如圖3所示。對比圖2和圖3,不難看出傳統短信平臺與智能應答短信平臺在工作流程上的不同之處。傳統的短信平臺中沒有對于短信內容的判斷,只是機械地接收。智能應答短信平臺在海量短信到達短信平臺之后首先進行短信內容的分類與過濾,之后通過掃描專家數據庫進行自動應答工作,這樣的工作模式更有針對性,也更加合理。
智能應答短信平臺具有傳統短信平臺的基本功能,同時具備自動應答功能,因此在農技推廣中有更加廣闊的應用前景。提供的主要服務有:面向農戶的自助和實時咨詢服務;個性化訂制;群發信息服務;定時發送提醒服務;與農技推廣應用系統集成(如氣象系統、病蟲害防治系統、農業信息化服務系統等)。
關鍵技術解決方案
智能應答短信平臺需解決的關鍵技術包括專家數據庫的建立[4]和短信分類器的設計。
短信分類器借鑒了文本數據挖掘[5-6]、BP神經網絡[7]、垃圾短信過濾相關方面的經驗。短信分類是指根據一個己經被標注的訓練短信集合,找到內容屬性(特征)和短信類別之間的關系模型(分類器),然后利用這種學習得到的關系模型對新的短信進行類別判斷。從數學的角度來看,短信分類是一個映射過程。映射規則f是系統根據已經掌握的每類若干樣本的數據信息,總結出分類的規律性而建立的判別公式和判別規則,隨著類別集合Y的不斷擴充,映射規則f也相應隨之改變。短信分類器的工作流程包括兩大步,即分類規則建立和短信分類。首先,分類規則建立,給定訓練短信集合;然后,把訓練集的文本統一表示,常用的是向量空間模型(VectorSpaceModel,VSM)表示法,再通過特征提取降維;最后,通過各種分類模型建立起一個分類規則;接著是短信分類過程,給定一條新短信,經過向量表示、特征提取后送入分類規則進行判斷,輸出該文本所屬類別(一個或多個)。對于分類結果不太明確的結果在人工神經網絡中進行第2次競爭,對結果進行排序,篩選出最優分類結果。特征提取主要分4個步驟:短信預處理、分詞、去噪和短信文本特征表示。短信預處理指根據短信內容處理一些亂碼、符號等。一般通過編寫正則表達式,根據實際需要進行貪婪或非貪婪的匹配,祛除一些諸如“#%*”之類的符號。分詞的過程類似于驗證碼識別技術當中的分割技術,根據短信內容將短信文本切分為一些有意義關鍵詞(如農技推廣、果樹、出現和病蟲害),目的是方便與專家數據庫進行匹配。去噪處理指祛除或統一短信中含有“噪聲的”數據,即刪掉與短信真正要表達的含義相差比較遠的數據。例如,祛除中文語氣詞“哎、啊、撒”和英文中的“hi,hello”,中文近義詞“果子,水果”統一表示成水果。短信文本特征表示是將短信內容在特征空間中量化,方便后續的特征提取降維,篩選出真正可以傳達農戶意圖的向量屬性,進行分類。
智能應答短信平臺中的專家數據庫通過數據庫接口模塊與短信平臺的數據庫進行通信,是短信平臺自身數據庫的擴展。專家數據庫的建立主要分為數據表的設計和觸發器設計兩個部分。專家數據庫中的數據表字段主要分為待匹配問題、解決方案、查詢率和優先級。
首先,應建立待匹配問題與相應解決方案對照數據表。待匹配問題字段的數據源來自短信平臺,通過群發功能向廣大農戶征集的短信意見,通過短信分類器處理后存儲在短信平臺自身數據庫中的記錄以及資深專家在相關研究領域遇到的新問題或成果。待匹配問題字段只記錄問題分類,通過分類索引與描述問題特征的數據表進行匹配。描述問題特征的數據表可以參考漢語行文習慣,采用主謂賓的方式插入數據。例如,某農戶發送短信是“我家的棗樹不知道為什么打了農藥以后還是生蟲子”,數據表中對應的3個字段為“棗樹”、“生”和“蟲子”。專家根據自身的時間安排,抽出集中時間登錄短信平臺進行統一作答,建立一個稍具規模的專家數據庫。
查詢率是為了記錄同一個或同一類問題最近一段時間被提問的次數與相同時間被提問總次數的比值百分化,通過設定一個閾值來衡量查詢率。查詢率高于閾值的被標記為熱點問題,不等農戶再頻繁地詢問,采用定時群發的方案,提醒廣大農民引起注意;而查詢率遠低于閾值的被標記為冷門問題,在系統負荷量加重的時候,通過降低其優先級,暫不處理,使負載恢復平衡。
優先級可根據實際需要建立和查詢率之間的算法,編寫業務邏輯來實現控制優先級的大小,從而達到優化專家數據處理、相應的速率的目的。專家數據庫中的觸發器主要觸發輪詢時間控制器對短信平臺自身數據庫的掃描和短信平臺代碼模塊中負責發送短信息的SendMessage()函數。輪詢時間控制著專家數據庫與短信平臺自身數據庫訪問的頻率。默認情況下,在農閑時可以將時鐘周期設置較為長一些,在農忙的時候設置短一些,并以標志位flag標志激活狀態。flag為0時,時間控制器處于休眠期;為1時,開始工作。當觸發器滿足輪詢時間控制器的時鐘周期時,自動將flag標志位置1,觸發輪詢時間控制器。輪詢時間控制器掃描并讀入短信平臺自身數據庫中記錄送與短信分類器分類后,通過專家數據庫給出解決建議,同時將該短信置為已讀,下個時鐘周期到來時不予處理。智能應答短信平臺的自動應答功能是由專家數據庫中的觸發器觸根據條件發SendMessage()函數后進行發送的,按優先級排列好的反饋結果被送入發送隊列等候,根據觸發器的觸發條件通過SendMessage()函數發送至運營商網關進行后續處理。
結束語
強化農技服務體系建設,提升農技推廣與農業信息服務能力,是當前各級農技推廣部門都在思考的問題。智能應答短信平臺有其極為廣闊的應用前景。本文主要針對農戶海量短信分類進而自動應答的解決方案,沒有涉及到彩信方面的自動應答,對于影響短信息傳遞、引起短信服務中心網絡阻塞的原因研究的還不夠透徹。盡管如此,相信隨著3G技術的普及,國家在農業信息化方面的資金投入逐步加大,SP服務商開發更多應用服務來開發自己的用戶,智能應答短信平臺必將在農技推廣方面為廣大農民提供更加豐富的服務[8]。因此,就農業信息短信服務平臺的合理性與準確性考慮,將物聯網和云計算等新興信息技術思想與短信平臺相結合,是今后的一個研究方向。