前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的神經網絡回歸問題主題范文,僅供參考,歡迎閱讀并收藏。
自20世紀50年代以來,世界旅游業發展迅速。蓬勃發展的旅游業給目的地帶來經濟效益與社會效益的同時,也給旅游風景區的自然生態環境造成了威脅。怎樣協調好經濟效益、社會效益和生態環境三者的關系,是我們亟待解決的問題。許多旅游景點的游客量呈現持續增長的趨勢,但這種增長并不是一條直線,往往表現為在旺季人滿為患,在淡季卻門庭冷落。游客數量在時間上的不均衡波動給景區管理帶來很大挑戰。要實現風景區科學規劃與永續利用,需要把握游客的時空變化規律,準確預測游客數量。其中短期游客量的預測是景區進行資源科學管理與合理調度的基本依據,對此進行深入研究有重要的現實意義。
2問題提出與解決框架
2.1研究區域九寨溝位于四川省阿壩藏族羌族自治州九寨溝縣境內,海拔在2000米以上,溝內遍布原始森林,分布了108個湖泊,是我國被列入世界遺產名錄的著名旅游風景區之一。九寨溝一年四季景色都十分迷人,各個季節有不同的景致,因此游客絡繹不絕,其中以4月至11月游客量最多(章小平,朱忠福,2007)。圖1研究路徑
2.2問題提出國內外學者對旅游景區容量及游客量預測問題的研究始于20世紀60年代,幾十年的發展取得了豐富的成果,如Law(1999)利用神經網絡模型預測游客需求,Mello(2001)使用向量自回歸方法預測英國旅游者的長期旅游需求及目的地份額,Stucka(2002)使用了計量經濟學中普通最小二乘法(OLS)與相似非相關模型(SUR)來預測克羅地亞的旅游需求。國內學者的研究成果也比較豐富,如楚方林研究發現非季節性自回歸移動平均結合模型能獲得較優的預測結果(ChuFonglin,1998),王朝宏使用模糊時間序列與混合灰色理論預測到臺灣的美國和香港游客的旅游需求(WangChao-Hung,2004),曾忠祿、鄭勇(2009)使用計量經濟學模型預測了內地赴澳門的游客量,雷可為、陳瑛(2007)應用了BP神經網絡和ARIMA組合模型預測中國入境游客量,顏磊等(2009)提出了小波分析法并用此方法分析了九寨溝景區游客旅游時間流的特征,胡小猛等(2006)通過研究得出三個主要阻礙上海居民去崇明島旅游的障礙因素,得出了游客量與潛在游客規模及各類阻礙相關的預測模型。這些方法大多以預測某地游客量的發展趨勢以及分析影響這些地區游客量的因素為主。雖然國內外學者對年際游客量的預測形成了豐富的成果,但是對日游客量的預測問題鮮有研究。隨著游客的旅游方式的變化,影響一個地區游客量的因素已經不僅僅是由旅游的季節性因子和景區基礎條件所決定,各種社會因素、自然突發狀況也會對一個景區的游客量產生重要影響(吳耀宇,黃震方,2010)。本文研究日游客量的預測問題正是基于對上述變化的思考。考慮季節與季節之間的
2.3解決框架本研究通過實地調查和數據采集獲得研究數據。采用逐步回歸法對日游客量預測建立回歸模型,再利用BP神經網絡對回歸模型計算出的預測結果進行誤差的修正,最后將修正出來的結果作為最終預測的日游客量。圖1為本文的研究路徑。
3實證研究
3.1多元線性回歸模型本研究通過實地調研采集了大量數據,其中包括九寨溝2009年和2010年上半年日游客量數據、九寨溝2009年和2010年每日的氣象數據,全國2009年和2010年法定假日的數據等。有研究表明氣候的季節性固然會一個景區游客量的大小產生重要的影響,但是也應該加大對社會因素、自然突發狀況的關注。因此本文重點考慮社會因素和自然突發狀況對游客量的影響,設定出與游客量波動有關的主要因子。影響游客量的因子在季節與季節之間差異大,在相鄰兩日之間差異小,因此在考慮到景區前后兩日季節性因子相差不大的情況下,設定出前日游客數量級、前日溫度、前日降雨等因子,再考慮到前后兩日的社會因子可能會因為放假等原因而產生差異的情況,設定出法定假日、寒暑假、旅游淡旺季等幾個因子。由于自然突發狀況無法準確預測以及定量,因此將其作為影響隨機誤差的一個因子。綜合考慮上述因素對景區游客量的影響之后,得出了可能影響九寨溝日游客量的因子。本文通過研究2009年數據來建立模型。首先利用SPSS軟件分別對設定的因子與九寨溝游客量之間進行相關性分析,得到前日溫度、前日降雨、法定假日、前日游客數量級、寒暑假、旅游淡旺季幾個與九寨溝游客量相關性較高的因子。然后將九寨溝實際游客量的數據和因子導入SPSS,通過模塊—逐步回歸建立回歸模型。逐步回歸的基本思想是,在考慮對Y已知的一群變量(X1…Xk)回歸時,從變量X1,…,Xk中,逐步選出對已解釋變差的貢獻最大的變量進入回歸方程,并且同時滿足偏解釋變差的F統計量的值fj的顯著性概率p小于等于選定的顯著性水平α。采用逐步回歸法,在顯著性水平α為0.05水平下,一共有4個因子依次進入回歸方程,依次是前日游客數量級、法定假期、前日溫度和旅游淡旺季,從模型匯總表中可以看出,最后一個包含了以上4個因子的回歸模型的判定系數R=0.919,校正判定系數R2=0.918,各種影響因子對實際游客量的回歸效果良好。檢驗模型的多重共線性、異方差性和序列相關性,三個問題均不存在。模型方差檢驗、回歸系數檢驗也都通過。根據高斯-馬爾柯夫(BLUE)定理,回歸系數表所求得的回歸系數具有最優性、線性和無偏性。以上從SPSS中獲取的結果證明通過多元回歸得出的模型擬合度比較高,結果比較理想。最后根據回歸系數得出的多元回歸方程為:y=-14394.805+781.351x1+1143.616x2+45.851x3+416.860x4+μ(1)其中y為預測的日游客量,x1為前日游客數量級,x2為法定假期,x3為前日溫度,x4為旅游淡旺季,μ為隨機誤差。
3.2BP神經網絡修正理論已證明,三層BP網絡可以以任意精度逼近任何連續函數(張興會,等,2004)。以多元回歸模型的預測誤差作為輸入的學習樣本,在神經網絡中經過不斷修正可以得到更好的預測結果。BP神經網絡可以從大量的離散實驗數據中,經過學習訓練,提取其領域知識,并將知識表示為網絡連接權值的大小與分布,建立起反映實際過程內在規律的系統模型。BP網絡可以包含不同的隱層,理論上已經證明,在不限制隱層節點數的情況下,只有一個隱層的BP網絡可以實現任意非線性映射。在模式樣本相對較多的情況下,較多的隱層節點,可以實現模式樣本空間的超平面劃分,因此本文使用具有單隱層的BP網絡來實現對多元線性回歸模型的修正(陳如云,2007)。圖2為BP神經網絡原理示意圖,其中Wij是輸入層到隱層的權重,Wjl是隱單元層到輸出層的權重。
3.2.1訓練樣本歸一化原始樣本中數據為預測游客量的誤差均大于1,而BP神經網絡所處理的是數值在[-1,1]區間的數據,因此這些樣本數據在研究中都需要將它們轉化為區間之間的數據。本文對樣本數據采用的歸一化公式如下:式中I為原始誤差輸入數據,I^為歸一化后的輸入數據,g為原始樣本期望目標數據即實際游客量,g^為歸一化后的期望目標數據。
3.2.2網絡訓練本文采用三層的神經網絡進行建模,對游客數量預測誤差進行修正。采用2009年數據作為訓練樣本,因數據量比較大,隱層神經元的節點個數n2要盡量多,故本文選擇n2=150,這里的隱層神經元節點個數不是固定的,要根據實際訓練的檢驗修正。輸入層神經元節點個數n1=5,輸出層神經節點個數n3=1,將1月1日-5日、2日-6日、3日-7日等的游客數量預測實際誤差作為網絡輸入,以6日、7日、8日等的實際游客量作為網絡輸出,組成樣本數據對網絡進行訓練,最后得出預測誤差。采用MATLAB測試,輸入層到中間層和中間層到輸出層的傳遞函數均受用正切函數,學習率設為0.5,訓練次數設為5000,訓練目標誤差為1×1010。使用MATLAB進行神經網絡訓練得到歸一化處理過的輸出層數據,首先需要對輸出層數據還原,根據歸一化公式得到還原公式:式中I為還原的神經網絡輸出數據,I*為神經網絡原始輸出數據。經過MATLAB的處理,將預測誤差與回歸模型預測值相加,得到最終預測值。
3.3模型驗證
3.3.1回歸部分將2010年數據帶入回歸方程,通過計算得出游客量預測值。下圖3所示為根據回歸方程(1)計算得到的2010年上半年日游客量的實際值與預測值之間的對比圖,其中y為預測游客量,g為期望目標數據,即實際游客量,橫坐標為日期的序列值,縱坐標為游客數。
3.3.2BP神經網絡部分要預測某天的游客數量誤差,應該將回歸模型預測的前五日實際誤差作為神經網絡輸入,經過神經網絡的運算之后得到輸出為當日游客量預測誤差,將此輸出的預測誤差與回歸模型的當日游客量值進行相加或相減,得到最終游客量預測值。圖4是經過BP神經網絡修正前后的兩個日游客量預測值的對比圖,其中,y為多元回歸預測值,Y為BP神經網絡修正值,橫坐標為日期的序列值,縱坐標為游客數。由圖4可以看到經過BP神經網絡修正前后的游客數變化趨勢是基本一致的,只是在游客數的多少上存在差別。下圖5為經多元回歸模型預測,BP神經網絡修正后的最終預測到達人數(Y)與九寨溝實際到達人數(g)對比圖,橫坐標為日期的序列值,縱坐標為游客數。從多元回歸模型的預測到BP神經網絡的修正,預測值與實際值的變化趨勢是基本一致的,從圖2與圖5的對比可以看出:九寨溝游客每年實際到達人數呈現出多峰性;實際到達人數與預測到達人數所呈現出的峰值是基本一致的;二者的對比圖顯示二者在數量上的預測也基本準確。而且經BP神經網絡修正后,游客到達預測值與游客實際到達值之間更為接近,通過計算,可以得到神經網絡模型對預測值修正后誤差顯著變小,經計算得修正預測值與實際值的平均誤差率為2.05%。其中誤差在1%以內的占總預測量的33.5%。誤差在2%以內的占65.9%,誤差在10%以上的占0.6%。分析有如下幾個可能產生誤差的原因:(1)由于回歸模型選擇的影響因子而造成的預測誤差。影響一個地區游客量的因素眾多,并不能全部被挑選出來,因此影響因子的選擇是造成誤差的一個最主要原因。(2)自然突發狀況。由于自然突發狀況存在突發性和偶然性,事先很難準確預測,也是一個誤差來源。(3)除法定假日以外的周末。由于周末多是九寨溝周邊城鎮的游客去旅游,而去九寨溝所花的時間可能較多,因此周末可能不是一周當中游客最多的時候,但是周末會對游客量有一定影響。(4)單位組織旅游。現在許多單位都會選擇一個相對于自身合適的時間組織員工集體旅游。(5)地震的殘留影響。
【關鍵詞】BP神經網絡;預測;誤差
1.引言
許多金融學家和計量學家對發達國家成熟市場的波動性進行了廣泛的研究,但是在對股市的預測上,由于人們在知識、能力、經驗上存在著較大的差異,加之問題本身又具有很大的隨機性和高度的非線性,即使是一些金融專家、炒股高手對出現的同一復雜行情進行分析,往往也會得出不同的結論。此外,傳統方法還要事先知道各種參數,以及這些參數在什么情況下應作怎樣的修正。這都給預測股市帶來一定的困難。
基于以上股市預測的困難性,本文提出了人工神經網絡的預測方法。隨著計算機、人工智能尤其是專家系統的發展,人工神經網絡技術逐漸成熟并開始應用于各個領域。人工神經網絡(ANN,簡稱神經網絡)作為一種由大量簡單神經元廣泛相互聯接而成的非線性映射或自適應動力系統,恰好能有效解決股市預測處理中常見的困難,因此它很快在股市預測分析與處理領域得到了廣泛的應用。
2.BP神經網絡介紹
2.1 BP 網絡算法的基本原理
2.1.1 標準的BP 網絡算法的基本原理
BP(Back Propagation)網絡是反向傳播的多層前饋式網絡,是目前使用最為廣泛的一種人工神經網絡。它的核心是BP算法,一種對于多基本子系統構成的大系統進行微商計算的嚴格而有效的方法,采用最小均方差學習方式。BP 神經網絡的原理說到底就是給它一些輸入變量,然后就有一個輸出,輸出值的情況與實際的情況進行比較,差多少,然后再進行網絡的內部調整,屬于有導師的學習規則,使得網絡輸出與實際逼近。
神經網絡能學習和存貯大量的輸入―輸出模式映射關系,而無需事前揭示描述這種映射關系的數學方程。人工神經網絡由非線性函數組成,而由一系列不同權重的線性過濾器組合而成:
2.1.2 BP網絡算法的優化
由于常用的BP算法主要缺點為收斂速度慢,局部極值,難以確定隱含層和隱含層的個數,使得在實際應用中BP算法很難應用,因此,出現了許多改進算法。BP算法的改進主要有兩種途徑,一種是采用啟發式學習方法;另一種則是采用更有效的優化算法,本文采用了動量法和學習率自適應調整的策略,從而提高了學習速度并增加了算法的可靠性。動量法降低了網絡對于誤差曲面局部極值的敏感性,有效地抑制了網絡陷于局部極小。
2.2 BP神經網絡的模型識別及步驟
模式通常指對事物的一種定量描述或結構描述,“識別”是指對客觀事物按其物理特征進行分類。模式識別的基本原理就是從待識別對象和理想標本之間若干特征的相似性推斷它們之間總體的相似性。BP神經網絡模式識別過程分為訓練階段和模式分類階段,分為初始化、數據與處理、網絡訓練以及模式分類四個步驟。以下利用實證分析來進行著四個步驟。
3.實例分析
下面以上證的某股600個交易日的股票價格收盤指數作為原始樣本數據,對上述神經網絡模型進行求解,預測20天的收盤價,與實際收盤價進行比較,并求出其誤差:
式中,表示第日的實際收盤指數,表示第日的預測值,表示誤差。主要按照如下幾部分來處理:(1)準備600個數據的時間序列,進行歸一化。BP神經網絡中每個神經元的輸出值由傳遞函數Sigmoid函數來計算,其輸出值的范圍是(0,1);(2)留出最后20個數據,作為預測檢驗使用;(3)繪制圖像,包括實際值和預測值,能量函數;(4)分析實際和預測兩曲線的趨勢。
采用I-J-K學習模型,該模型是輸入層I個神經元,隱層J 個神經元,輸出層K個神經元。利用BP神經網絡模型訓練500次、800次、1000次的輸出值和期望值以及能量函數(或者叫誤差函數)E,結果見圖1到圖3。
通過上面的圖示,可以看到用BP神經網絡預測的效果比較明顯,這說明該模型適用于短期預測嗎,股市的波動在很多地區都是非常劇烈的,各種因素的綜合作用也使得長期股指的變動具有極大的不確定性,使得預測變得很困難。而BP網絡的算法原理和自學習的特點使其能夠充分挖掘出隱含在樣本數據中的規律性,實現從輸入空間到輸出空間的非線性映射,對樣本數據進行精確的擬合。從而BP神經網絡的方法對于股市上的一些很難看出規律的數據列的預測而言,無疑是一個比較精確的預測方法。
4.結論
本文介紹了股市的特點以及股市預測的困難性,提出了利用BP神經網絡的方法來解決股市預測問題。文章介紹了BP神經網絡算法的基本原理,BP神經網絡算法的優化,BP神經網絡模型識別及步驟,最后后以上海證券交易所每日股票價格收盤指數為分析對象,把原理應用于實際,利用BP神經網絡對股票價格收盤指數進行了短期預測,并計算出預測值和實際值的誤差。通過實驗發現該模型收斂速度快,預測精度非常高,對預測短周期內股指波動具有較強的適用性。
參考文獻
[1]高琴.人工神經網絡在股市預測模型中的應用[J].微電子學與計算機,2007年第24卷第11期.
[2]周翠紅,路邁西.線性回歸與人工神經網絡預測煤炭發熱量[J].煤炭科學技術,第37卷第12期.
[3]尹慶雙,奉瑩.人工神經網絡在第三產業就業分析中的應用[J].人口與經濟,2009年第6期.
[4]鄒文安,劉寶,姜波,楊春生.基于Excel 技術平臺人工神經網絡BP模型及應用[J].水文,第30卷第1期.
[5]康進,劉敬偉.非參數回歸估計與人工神經網絡方法的預測效果比較[J].統計與決策,2009年第23 期.
[6]楊本昭,田耕.基于人工神經網絡的客戶價值分類研究[J].科技管理研究,2007年第12期.
[關鍵詞]多元線性回歸;BP神經網絡;預測模型
[DOI]10.13939/ki.zgsc.2017.06.098
1 引 言
HN省林業發展雖然迅速,但總體規模小,林業產業化水平低,林產品沒有規模化的發展。預測林產品的物流需求,能夠探索出HN省林產品的發展規律,發現林業轉型升級過程中存在的問題。本文運用與林產品物流運輸需求有強相關性的經濟指標來預測HN省林產品物流運輸需求量。
2 多元線性回歸模型
2.1 多元線性回歸
確定兩種及以上變量間相互定量關系的統計方法稱為回歸分析。在回歸分析中,如果有兩個或兩個以上的自變量,就稱為多元回歸分析,如果自變量與因變量間存在線性關系,就稱為多元線性回歸。其模型的一般形式為:
2.2 多元線性回歸模型構建
設物流運輸需求量[JB((]Y[JB))]與影響因素[JB((]X1,X2,…,XP[JB))]存在線性相關,可建立回歸函數模型Y=F[JB((]X1,X2,…,Xp[JB))],以此為基礎,對林產品物流運輸需求做出預測。
3 BP神經網絡模型
3.1 BP神經網絡
BP神經網j是一種按誤差逆傳播算法訓練的多層前饋網絡,BP網絡模型拓撲結構包括輸入層、隱含層和輸出層。
3.2 構建物流運輸需求預測模型
利用BP神經網絡構建林產品物流運輸需求預測模型,強相關性的經濟指標是輸入變量,林產品物流運輸需求量是輸出變量。
3.2.1 設計網絡輸入、輸出樣本
設Xi=[JB((]Xi1,Xi2,…,Xin[JB))]表示第i年的經濟指標向量,Yi=[JB((]yi[JB))]表示第i年的物流運輸需求量向量。以第1年至第n-1年的經濟指標值作為輸入樣本P,以第2年至第n年的物流運輸需求量作為輸出樣本T,用輸入樣本P和輸出樣本T對BP網絡進行訓練,訓練完成后,輸入第n年的輸入指標Xn來預測第n+1年需求量。
3.2.2 確定網絡層數、隱層節點數
本文選用典型的三層BP網絡。根據Kolmogorov定理n1=2n+1確定隱含層節點數。
4 HN省林產品物流運輸需求預測實證分析
貨運量能反映出物流運輸需求的變化規律,HN省鐵路網發達,故選擇“林產品鐵路貨運量”作為輸出指標,設為Y。依據預測指標選取原則,選取“人均生產總值、居民消費水平、林業生產總值、林業固定資產投資、鐵路營業里程”作為輸入指標,分別設為X1,X2,X3,X4,X5。本文選取的原始數據來源于歷年HN省統計年鑒,選取2005―2013年的數據作為樣本數據,如表1所示。2014年的數據作為預測數據加以驗證。本文以木材作為木產品的代表。
4.1 多元線性回歸模型算例分析
本文借助SPSS軟件對五個經濟指標和林產品鐵路貨運量指標之間進行相關性分析和線性回歸分析,從而對林產品物流運輸需求進行預測。
4.1.1 相關性分析
本文依據數據特點,對其采用Pearson相關系數,如表2所示。
4.1.2 線性回歸分析
選擇X1、X2、X3、X4、X5作為自變量,Y作為因變量。在SPSS軟件的計算下,根據SPSS的輸出結果得到林產品物流運輸需求量多元線性回歸模型為:Y=550.119+0.009X1-0.047X2-0.230X3-2.060X4+0.017X5
4.2 BP神經網絡模型算例分析
本文借助MATLAB軟件的神經網絡工具箱,通過編程來建立林產品物流運輸需求神經網絡預測模型。
4.2.1 對數據歸一化處理
4.2.2 設計網絡結構參數
通過試驗,隱含層節點數目為2×7+1=15個最為合適。訓練函數設為traingdx函數,傳遞函數第一層設為tansig函數,第二層設為logsig函數,學習率設為0.1,動量因子設為0.9,學習誤差設為10-5。
4.2.3 網絡訓練與測試
取歸一化后2005―2010年的輸入指標值作為訓練樣本輸入p-train,2006―2011年的輸出指標作為訓練樣本輸出t-train。在MATLAB軟件中編輯訓練語句,結果如下圖所示。
訓練結果曲線
經過了146次訓練后,網絡達到設定學習誤差,訓練效果較好。
4.3 模型預測對比
多元線性回歸方程及BP神經網絡對2014年的數據進行預測的結果如表3所示。
由表3知,BP神經網絡預測模型對2014年預測誤差為7.9%,多元線性回歸預測模型誤差為8.1%。相比而言,BP神經網絡預測模型的預測精度更高,更穩定。
通過模型可以預測到未來幾年林產品物流運輸需求量呈遞減趨勢,說明對樹木的砍伐在逐年遞減。
5 結 論
本文介紹及建立了多元線性回歸模型和BP神經網絡模型,以HN省林產品物流運輸需求量為算例,得出的研究結果表明BP神經網絡在對新數據的預測能力方面有略微的優勢,但是BP神經網絡每一次訓練運行的結果都是不同的,具有一定的不確定性,因此并不能簡單地以此判斷兩者之間在預測能力方面哪個更有優勢,但總的來說,BP神經網絡較多元線性回歸模型的預測精度更高。
參考文獻:
[1]陳思遠,郭奕崇.基于BP神經網絡的安徽省物流需求預測研究[J].物流技術,2012(17):231-233.
關鍵詞:卡爾曼濾波,BP神經網絡,狀態估計,導航系統
1 引言
捷聯慣導系統(SINS)和GPS組合而成的導航系統是當今導航領域最主要的組合方式,它有效的減少了系統誤差,提高精度,降低了導航系統的成本,這種組合方式已在航天航空、航海、陸地平臺導航、測繪等領域得到了廣泛應用。在傳統的SINS/GPS組合狀態估計中,經典卡爾曼濾波器[3]發揮重要作用,但其要求條件苛刻,主要體現在要求模型的狀態方程和量測方程精確、系統噪聲和量測噪聲的統計模型為零均值的高斯白噪聲;但在復雜環境下,噪聲的統計信息不可能預見,更不可能是理想的高斯白噪聲,因此,許多在仿真條件下表現非常好的系統運用到實際環境中就容易出現精度下降甚至發散現象。而回歸BP神經網絡具有較強的并行計算能力,容錯性好,在神經元數量足夠時,逼近非線性函數的程度比較好。本文在經典濾波的基礎上引入回歸BP神經網絡[4]對組合導航系統進行狀態估計,盡可能減少非線性噪聲對系統的影響;首先利用經典卡爾曼濾波對不同特性的噪聲輸入下的系統進行估計,得到各條件下的狀態后,將各條件下的狀態估計均值作為樣本輸出,以各種噪聲集對網絡進行訓練;在訓練結束后,將訓練后的回歸BP神經網絡作為狀態估計器輸出組合導航系統估計值。
2 回歸BP神經網絡算法
誤差反向傳播BP算法是前向網絡學習算法中應用最為廣泛的算法,回歸BP網絡是在BP算法中采用的梯度下降法推廣到回歸網絡中,其具有反饋和前饋機制,即在網絡的一個訓練周期中,網絡的輸出同時反饋給網絡的輸入神經單元作為網絡的外部輸入。如圖1所示為一個典型的三層回歸BP網絡。
圖1回歸BP網示意圖
在圖1中有一個關聯層,每一個隱含的結點都有一個相應的關聯層結點與之連接,并且連線的權值可調,而關聯層的信號來自于輸出,關聯層節點起到了存儲網絡內部狀態的作用,當關聯層與中間層連接后,起到了狀態反饋的作用,這為組合導航系統這種典型的時間序列信號分析提高了有力的工具,具有“記憶”功能的回歸BP網絡能夠對一階馬爾科夫序列很好的濾波和預報。反饋網絡的反饋激勵的加入使得局部的記憶特性被放大易造成傳統的梯度下降學習方法過早的收斂,本文采用可修正速率的梯度下降學習法,其本質是綜合考慮當前和前一時刻的梯度向量,調整其具有適應性,不因為某一時刻的梯度變化而改變網絡的收斂狀態。算法的基本要求與傳統梯度法基本相同,學習的準則是讓網絡實際輸出與樣本比較,直至誤差平方和達到最小。在算法中加入速率因子,使神經網絡權值的更新不僅考慮了當前梯度方向,還考慮了前一時刻的梯度方向,減少網絡反饋對闡述調整的敏感性,有效抑制了局部最優;速率因子的取值應當根據網絡可能陷入局部最優的程度而定。
3 導航系統的狀態表達與組合濾波
根據SINS/GPS組合導航系統得理論,可以得到如下組合誤差的狀態方程:
F(t)為系統的動態矩陣;G(T)為系統噪聲系數矩陣;W(t)為系統噪聲。
本文中對系統噪聲仍確定為高斯白噪聲,這是由于系統噪聲的統計特性一般不會劇烈變化,而系統量測噪聲的統計特性變換是引起卡爾曼濾波器性能下降的主要因素。系統量測噪聲容易受到外界環境的干擾,如溫度、電磁場、濕度等等,因此本文主要針對卡爾曼濾波中的量測噪聲統計特性變化進行研究。
4 回歸BP神經網絡對組合導航系統的狀態估計
4.1 回歸BP神經網絡對組合導航系統狀態估計模型設計
神經網絡的訓練是神經網絡能夠應用的前提。在樣本訓練中對同一狀態量輸入X,選取不同的噪聲集合,通過卡爾曼濾波器,取得一系列的不同條件下的最優估計,將這些最優估計的狀態均值作為神經網絡期望樣本輸出的真實值,構成了不同噪聲集合下得輸入樣本和卡爾曼濾波器得到的輸出樣本;通過不同噪聲集合樣本的訓練,使得神經網絡具有處理各種統計特性噪聲的自適應能力。訓練結束后,就可以利用普通的無偏卡爾曼濾波器和訓練好的神經網絡進行狀態估計。圖2為卡爾曼濾波和神經網絡組合的示意圖。
圖2 卡爾曼濾波與回歸BP神經網絡組合示意圖
在實際的參數選取和設計中,本文采用卡爾曼濾波器的初始估計和SINS/GPS的參數誤差作為回歸BP神經網絡的狀態變量。選取參數誤差X作為回歸BP網絡的狀態變量。
以上參數依次為:緯度誤差、經度誤差、高程誤差、東向速度誤差、北向速度誤差、垂直速度誤差,三個姿態角誤差。將普通卡爾曼濾波器的輸出作為初始值。
4.2 仿真實驗與分析
1)不進行任何濾波的SINS位置誤差曲線
圖4 不加濾波器的SINS位置誤差曲線 圖5 組合濾波后北向位置估計誤差曲線
圖4是斷開卡爾曼濾波器和神經網絡的結果。沒有GPS和濾波器的輔助,在很短的時間內,單純的SINS輸出就會偏移很多。。。
2)進行組合濾波后的誤差曲線
在加入GPS和濾波器后,從圖5可以看出,濾波器狀態估值與真實值之間的誤差變化保持在較高的水準,說明濾波器明顯減少了SINS的漂移和積累誤差,并且在噪聲復雜多變的情況下仍然表現出了平滑過渡的狀態。需要說明的是由于GPS的位置精度從長期看是高于SINS的,本文在進行位置估計的時候,出于以SINS為主的思想,給予GPS的權值較小。
圖6 組合濾波后滾動角估計誤差曲線 圖7卡爾曼濾波滾動角估計誤差曲線圖
從姿態角的誤差分析可以看出,濾波器能夠很快的收斂。。SINS的姿態誤差受到外界條件影響是比較大的,即量測噪聲的影響超過系統噪聲,從圖6中可以看出,在噪聲統計特性變化的條件下,誤差值仍然很小,說明神經網絡系統能夠有效地對量測噪聲進行濾波。
3)組合誤差與普通卡爾曼濾波誤差的比較
對單純卡爾曼濾波系統和組合系統分別輸出的姿態角的比較。對實測數據中SINS和GPS原始數據加載入濾波器。誤差圖進行了部分的放大,如圖7所示,從圖7中可以明顯看出,單純的卡爾曼濾波系統對復雜噪聲的濾波能力遠遠差于組合系統,表現在數據曲線上就是跳動很明顯,也驗證了組合系統具有較好的對不同統計特性的復雜噪聲的適應能力。
5 結論
本文探討了采用神經網絡系統對導航系統濾波的問題。采用卡爾曼濾波器與回歸BP神經網絡系統的組合能夠有效地提高導航系統在復雜環境下的導航精度,并且能夠做到較快的收斂。但是這種方法的缺點在于需要大量的樣本輸入和需要完善的噪聲組合選擇,同時也受到計算能力的限制。此外,隱含層層數的選擇和結點個數的選擇應當如何優化,也是一個需要探索的問題。
參考文獻:
[1] 以光衢,慣性導航原理[M],航空工業出版社,1987
[2] 張守信,GPS衛星測量定位理論與應用[M],國防科技大學出版社,1996
[3] 張玲,張鈸,人工神經網絡及其應用[M],浙江科學技術出版社,1997
[4] 秦永元,卡爾曼濾波與組合導航原理[M],西北工業大學出版社,1998
[5] Kanckar A J , Fellachi A. State estimation using artificial neural networks[A]. Proceedings of the 1994 IEEE Int.Conf. on Robotics and Automation[C],1994
[6] 周鑫,船用慣導衛星全組合技術[D], 長沙,國防科技大學碩士學位論文,2005
[7] 劉志儉,GPS載波相位差分技術、捷聯慣性導航系統初始對準技術及其組合技術研究[D],長沙,國防科學技術大學博士學位論文,2003.3
【關鍵詞】zeta電位 Elman神經網絡 BP神經網絡 建模
1 實驗數據的測量
本文所使用的藥劑PAC和PAM都取自廣西博世科環保技術有限公司,使用Nano-ZS90型Zeta電位測定儀(英國Malvern Instrument Ltd.)測量廢水中的Zeta電位值,測量原理是根據經典Helmholtz―Smoluchowski(H-S)方法計算Zeta電位。
2 神經網絡
由于廢水處理的復雜性,系統參數較多,各參數之間又相互耦合,以及非線性等特點,使得很難建立其精確有效的數學模型。然而神經網絡具有自學習、自組織和自適應能力等優點,從而為廢水處理絮凝劑工段的建模提供了新的手段。
2.1 BP神經網絡
采用的BP神經網絡由三層組成。一個輸入層,一個隱層和一個輸出層。如圖2-1所示:
2.2 Elman神經網絡
Elman網絡是 J. L. Elman于 1990年首先針對語音處理問題而提出來的, 它是一種典型的局部回歸網絡( global feed for ward local recurrent)。Elman神經網絡是兩層反向傳播網絡,隱層神經元的輸出不僅作為輸出層的輸入,還反饋至隱層的輸入,如圖2-2所示。
3 網絡建模
3.1 模型結構
系統的下一個階段的狀態是由系統當前狀態和當前階段的控制量決定的。因此,將系統的藥劑PAC和PAM作為系統模型的輸入量,將Zeta電位值作為系統的模型的輸出量。此系統模型為2個輸入向量,1個輸出向量的神經網絡模型。
3.2 BP神經網絡建模
由于單隱層神經網絡即可實現對任意函數的任意逼近,故對于廢水處理投放絮凝劑工段的模型采用單隱層BP神經網絡,進行擬合能力和泛化能力的測試。由于數據自身的原因,選用其他轉移函數效果都不如雙曲正切S型傳遞函數,因此隱層轉移函數選用tansig函數(雙曲正切S型傳遞函數);學習率選擇太小會使得訓練次數增加,太大會使得訓練出現震蕩,經過多次試湊,選用學習率為0.01;選用不同的訓練次數作對比,最后選用最大訓練次數為200次。
隱層節點數的多少與樣本數的多少及樣本蘊含規律的復雜程度有關。當選取不同的隱層節點數時,對比其擬合泛化能力。
BP神經網絡隱層節點數分別為10,30,50時都達到了較好的泛化效果。其節點數依次增多時,該網絡的泛化能力對于整個泛化數組來說沒有明顯的增強,但是對于個別的數據點卻有一定的影響,如對于第五個數據點,隨著隱層節點數的增加,它的泛化能力越差,對于第20個數據點,隨著隱層節點數的增加,它的泛化能力越好。雖然其隱層節點數的不同會對個別的數據點產生微小的影響,考慮到訓練時間的問題和數據整體泛化效果,對于BP神經網絡來說,選取10個隱層節點數為最佳。
3.3 Elman神經網絡建模
Elman神經網絡采用MATLAB系統工具箱建模和訓練,其MATLAB語句實現如下:
其中,newelm函數是用來建立Elman神經網絡模型,而訓練算法有很多種,經過多次選取不同的訓練函數對比,最后本文采用trainscg函數(SCG算法的變梯度反向傳播算法),隱層轉移函數為tansig函數(雙曲正切S形傳輸函數),輸出層轉移函數為purelin函數(線性傳輸函數)。
學習率為0.01,訓練次數為200,選取的方法與BP網絡相似。誤差訓練目標為0.005。
當隱層節點數為10時,其擬合泛化圖形如圖3-7,3-8所示。
當隱層節點數為50時,其擬合泛化圖形如圖3-9,3-10所示。
網絡性能的好壞主要是看它的泛化能力。由圖3-8,3-10,可知,隨著Elman神經網絡隱層節點數的增加,其泛化能力得到了比較明顯的提高。當Elman神經網絡的隱層節點數為50時,其泛化能力更強,由圖3-10所示,其泛化效果與實際值基本相同。之所以Elman神經網絡的泛化擬合能力比BP神經網絡的強,就是由于Elman神經網絡比BP神經網絡多了一個承接層,即隱層具有反饋連接功能。
4 結論
綜上所述,盡管目前BP神經網絡得到了比較廣泛的應用,但是由于它沒有反饋連接,其收斂速度較慢,又容易收斂到局部最小值。相比之下,動態回歸神經網絡具有學習效率高,逼近速度快、泛化能力強的特點,能夠更好地反映系統的動態特性。
(1)神經網絡的非線性映射能力,保證了對廢水處理投放絮凝劑工段建模的可行性(2)神經網絡的自學習能力,在建模過程中能夠自動解耦各參數之間的關系。(3)神經網絡的并行協同處理能力,使得網絡具有很強的實時性。(4)神經網絡的分布式存儲信息的能力,使得其在建模方面具有很好的容錯性和魯棒性。
參考文獻
[1]王國勇.4萬噸污水處理廠自動化監控系統設計與研究[D].山東大學,2008.
[2]孫體昌等.水污染控制工程[M].北京:機械工業出版社,2009.
[3]李闖.水處理濾料表面的zeta電位及其過濾除油性能研究[D].蘭州:蘭州交通大學,2009(06).
[4]王利平等.水中膠體Zeta電位及影響混凝效果的研究[J].包頭鋼鐵學院學報,1999,18(04):484-486.
[5]王曉敏等.混凝劑對膠體電動電位的影響研究[J].工業安全與環保,2006,32(02):7-9.
[6]韓立群.人工神經網絡理論、設計及應用[M].北京:化學工業出版社,2007.
Abstract: In this paper, a model combining BP neural network and Hopfield is proposed to obtain the tropospheric delay fusion model HBPF by using sounding data and CORS base station observation data. By comparing the results of the fusion model with GAMIT, it shows that the HBPF model is reliable and highly accurate.
關鍵詞:對流層延遲;Hopfield模型;BP神經網絡;融合模型
Key words: troposphere delay;Hopfield model;BP neural network;fusion model
中圖分類號:P228.4 文獻標識碼:A 文章編號:1006-4311(2017)15-0227-03
0 引言
當今社會,用戶對GPS精度以及可靠性的要求越來越高,影響GPS高程精度有關的誤差主要來自傳播路徑折射誤差中的對流層折射誤差。建立一個適用于多種導航定位用戶精度需求的高精度對流層延遲改正模型,有著很重要的戰略及現實意義[1]。
目前,國際上對流層延遲改正的方法主要是模型函數法,包括Hopfield模型、Saastamoinen模型、Black模型、UNB系列模型和EGNOS模型等。但是,由于對流層本身的復雜性,現存模型對于水汽在對流層空間的分布情況以及在時間上的變化規律仍然很難確切地描述[2]。人工神經網絡模型具有學習、記憶、計算和智能處理功能[3],在地球科學與測繪工程中發揮了重要作用。本文分析研究線性回歸模型、Hopfield模型、神經網絡融合模型(BP模型)、線性回歸模型與神經網絡融合模型(F1模型)、Hopfield模型與神經網絡融合模型(HBPF模型)共五種模型對研究區域的改正效果,以期建立較高精度的區域對流層延遲改正模型。
1 Hopfield模型原理
Hopfield模型僅將大氣層分為對流層和電離層兩層。在對流層中,其主要分析對流層中各個氣象參數與海拔高度之間的關系,然后經過推導分別得出折射率干分量和濕分量與高程之間的關系,進而后通過地面氣象參數來推演整個對流層延遲。
完整的Hopfield模型的計算公式如下:
式(1)中前半部分為干延遲,后半部分為濕延遲。其中T0為測站氣溫,h0為測站高度,e0是地面的水汽分壓,P0與T0分別為測站的地面氣壓與絕對溫度,Hw為濕對流層頂,一般取Hw=11000m;而HT為折射率為0處的大氣層高度,k1(K?mbar-1)、k2(K?mbar-1)、k3(105K2?mbar-1)為大氣折射率試驗常數。
Hopfield模型干延遲精度為2cm,濕延遲為5cm,另外地區和季節性變化會對模型產生3cm以上的延t變化。歐吉坤[4]指出,在我國Hopfield模型的誤差有時可達10cm以上,而且存在系統誤差。
2 用于計算對流層延遲BP神經網絡模型的建立
影響對流層濕延遲的水汽是一個有著極復雜變化的非線性的物理量,那么利用在處理非線性問題上有獨特優勢的神經網絡技術來討論延遲的變化,應該比傳統的方法更有效。
在眾多神經網絡模型中,BP神經網絡是目前應用最廣泛的模型[5]。BP神經網絡的模型結構包括輸入層、隱含層和輸出層三個部分(見圖1)。
BP算法計算過程分為兩個階段:信號正向傳播以及誤差反向傳播。這個過程引導各層權值調整,即網絡學習訓練的過程,這兩個階段的反復運用,在誤差達到所希望的精度時,網絡的學習過程就結束。
用于計算對流層延遲BP神經網絡的建立主要分兩個步驟:
2.1 網絡結構的確定
網絡結構的確定是BP神經網絡在工程中應用的重要工作。需要我們確定的內容有:①輸入層節點個數;為與Hopfield模型進行比較,文章采用和Hopfield模型一樣的輸入參數,即:測站的地面氣壓與絕對溫度P0與T0、測站海拔高度h0以及測站的地面水汽分壓e0。②輸出層節點個數;輸出層節點數為1,為對流層延遲δ。③隱含層節點數的選取;本文采取遺傳算法和神經網絡相結合的方法,將隱含層節點設置為從10~30,每次計算均輸出最佳計算結果。
2.2 網絡參數的設置
BP神經網絡模型的網絡參數包括:學習速率η、平滑因子α、學習誤差E。通過試算,學習速率η取值范圍為[0.5,2.5],平滑因子α取值范圍為[0.5,0.9],學習誤差控制E在[0.005,0.01]。
通過以上兩個步驟,即建立用于計算對流層延遲的神經網絡模型。
3 對流層天頂延遲的融合模型的建立
考慮到模型的應用簡便特性和獲取數據的限制,在此,選擇Hopfield模型來與BP神經網絡進行融合來建立區域對流層延遲融合模型(HBPF模型)。BP神經網絡具有強大的誤差補償能力,可用來補償Hopfield模型的系統誤差,然后將所得出的誤差返加到Hopfield模型上,即可求得精確的對流層延遲值。為了與HBPF模型進行對比驗證,同時用BP神經網絡對多元線性回歸模型進行誤差補償,所得到的融合模型簡稱為F1模型。兩融合模型具體的網型結構如下:
將地面測站的氣壓P0、絕對溫度T0、海拔高度h0、地面露點溫度td,另加Hopfield模型或多元線性回歸模型計算的對流層延遲δH作為輸入層,將Hopfield模型或多元線性回歸模型計算延遲的誤差ΔδH作為輸出層,建立一個5×N×1的神經網絡模型(N為隱含層節點數)。那么模型所得到的值為Hopfield模型或多元線性回歸模型所得值與對流層延遲真值的誤差ΔδH'。融合模型所求得的延遲δ2可通過δ2=δH+ΔδH'來計算。在具體的計算時,采用與BP神經網絡相同的計算步驟。
經過上述過程,我們就建立了與BP神經網絡相融合的融合模型。
4 工程及實例分析
為精確確定測站的氣象參數,本文采用氣象站的探空氣球采集的實時大氣參數作為計算數據,計算各個等壓面的大氣干、濕折射率,描述出測站上空對流層的折射率變化情況,再通過路徑積分精確的求出探空數據在海拔高程范圍內的對流層延遲值。
本文所選取的探空數據為徐州地區2010年全年的氣象數據,限于篇幅問題,這里僅僅將由2010年7月1號8點的探空數據計算的部分數據列于表1。
由于氣象探空數據的真實性,再加上探空數據最高高度之上所采用的中緯度大氣模型與大氣的真實輪廓近似,即氣象探空數據高度之上延遲的無差異性,我們可以認為通過路徑積分計算出來的對流層延遲與其真值無異。
4.1 對流層天頂延遲的多元線性回歸模型算例
根據探空氣球數據的格式,本文中的多元線性回歸中自變量X將包括四個參數,分別為測站的地面氣壓與絕對溫度P0與T0、測站海拔高度h0以及測站地面露點溫度td,分別表示為X1、X2、X3、X4,待求參數就有5個,分別是a0、a1、a2、a3、a4,具體公式表達見式(2):
然后通過最小二乘法求解出參數,得出對流層延遲與大氣參數之間的多元線性關系。以表1中的數據作為學習樣本,經計算得到的模型參數值如表2。
4.2 各模型檢驗精度匯總
為了各模型間的對比分析,每個模型均選取2010年7月1日8點的20個探空站觀測數據作為學習樣本,以探空數據計算得到的對流層延遲值作為基準,分別選取當天8點剩余對流層延遲樣本和20點對流層延遲樣本來進行檢驗,進而比較檢驗樣本的精度。檢驗樣本的精度匯總見表3。
從表3中,我們可以看出,Hopfield模型在研究區域內精度最差,線性回歸模型和常規BP神經網絡模型、F1模型的精度都比Hopfield模型要高,HBPF模型精度最高。這是因為,線性回歸模型和常規BP神經網絡模型都是對獲取的四個氣象參數的數學分析,沒有實際的物理意義。而Hopfield模型是基于全球氣象參數建立的經驗物理模型,是對全球對流層延遲的模擬,在針對特定的區域應用時,會出現相應的系統誤差。由于BP神經網絡強大的誤差補償能力,在Hopfield模型較大系統誤差下,HBPF模型能夠達到最優的精度,相比其他模型,極大地提高了對流層延遲的精度。
4.3 模型計算對流層延遲精度驗證
由于GAMIT軟件的對流層天頂延遲參數估計精度好于±1cm[6],因此在應用中比較公認的看法是可將GAMIT軟件計算出來的對流層延遲值視為真值。本文上述融合模型是建立在探空數據的基礎上的,為了進一步驗證HBPF模型的有效性,將其計算結果與GAMIT計算的“真值”進行對比分析。
利用GAMIT軟件對徐州地區5個CORS基站2010年7月份的數據進行了高精度基線解算,并得到了時間步長為2小時的對流層延遲。采用融合模型同樣的計算結構,在計算CORS基站天頂對流層延遲時,學習樣本依然是探空站地面氣象數據(見表1)。為了進一步分析融合模型方法計算得到對流層延遲的可靠性,本文選取2010年7月25日到7月29日連續五天的數據,每天選取兩個時刻(8點,20點),以GAMIT計算得到的對流層天頂延遲數據作為對比樣本,并與現今常用的UNB3m模型相比。三種模型解求的某個CORS基站天頂對流層延遲值對比列表如表4。
將表4中數據繪制成圖,模型數據圖見圖2。從圖2可以看出,本文中求出的融合模型與GAMIT解算出來的結果在7月25日到7月29日期間具有相同的變化規律,兩者之間的差值都在1cm左右。UNB3m模型由于是采用的差值格網模型,在選定經緯度和年積日之后,計算結果在相當長的一段時間內大致相同。
綜合這幾種常規模型,可以得出結論:本文得出的HBPF模型具有最高的精度,而且結果穩定可信,能夠滿足較高精度的GPS定位等需求。
5 結束語
近年來,GPS技術已經應用到人們生活的許多方面,要提高GPS定位精度,必須要建立一個高效、可靠的對流層延遲模型來實現對對流層延遲的反演。本文利用區域實測的氣象探空數據求得具有較高精度的區域融合模型HBPF模型,經驗證表明其在反演區域對流層延遲方面,相對于傳統模型有著更加良好的效果。但本文所選取的探空數據僅局限在徐州地區,所提出的“HBPF模型”在本區域內能取得很高的改正效果,能否在其他地區進行推廣應用,也還有待于進一步驗證分析。
參考文獻:
[1]徐酃Γ徐宗秋,隋心.精密單點定位中衛星星歷對天頂對流層延遲估計的影響[J].測繪科學,2013,38(02):19-21.
[2]戴吾蛟,陳招華,匡翠林等.區域精密對流層延遲建模[J].武漢大學學報(信息科學版),2011,36(04):392-396.
[3]胡伍生.神經網絡理論及其工程應用[M].測繪出版社,2006.
[4]歐吉坤.GPS測量的中性大氣折射改正的研究[J].測繪學報,1998,27(01):34-39.
關鍵詞:應急; 預測; 支持向量機; 人工神經網絡 ;案例推理法
一、引言
“預測”這一件事,從古到今都是人們苦苦追求與探索的話題:從“先知三日,富貴十年”到“凡事預則立,不預則廢”;從活躍在中國民間的算命先生,再到西方觀測星象的占卜師,無不寄予著世人對未知的好奇和對未來的向往。隨著科技進步與時展,特別是計算機技術的飛躍,給予人們更強大、更客觀的手段和方法進行預測。本文以應急物資需求為背景,通過對各類預測方法的介紹和對比,為應急物資的需求預測尋求最佳途徑。
二、預測方法分類及研究現狀
由于預測的對象、目標、內容和期限的不同,近幾十年來形成了多種多樣的預測方法。據不完全統計,目前世界上有近千種預測方法,其中較為成熟的有150多種,常用的有30多種,用得最為普遍的有10多種,但目前為止還沒有一個完整、統一、系統的分類體系。本文依照我國常用的分類方法,將預測方法分為定性分析和定量分析兩大類。
1. 定性分析預測法
定性分析預測法是指預測者根據歷史與現實的觀察資料,依賴個人或集體的經驗及智慧,對未來的發展狀態和趨勢做出判斷的預測方法。其主要方法包括專家意見法、頭腦風暴法和德爾菲法等。定性預測的優點在于,能夠較大程度地發揮人的主觀能動作用,簡單迅速,省時省力,具有較大的靈活性;同時它的缺點也是顯而易見的:由于它較為依賴于人的經驗和主觀判斷能力,從而易受人的知識、經驗和能力的多少大小的束縛和限制,尤其缺乏對事物發展作數量上的精確描述。因此,定性分析預測法在現代預測技術中逐漸淡出,定量分析預測法成為預測的主要手段。
2. 定量分析預測法
定量分析預測法主要依據調查研究所獲取的數據資料,運用統計方法和數學模型,近似地揭示預測對象及其影響因素的數量變動關系,建立對應的預測模型,據此對預測目標做出定量測算的預測方法。它通常可分為時間序列分析預測法和因果分析預測法。
(1)時間序列分析預測法
時間序列分析預測法是以連續性預測原理作指導,利用歷史觀察值形成的時間數列,對預測目標未來狀態和發展趨勢做出定量判斷的預測方法。較為常用的時間序列分析預測法主要有指數平滑法(包括雙指數平滑、三次指數平滑和無季節指數平滑等)、移動平均法、ARIMA模型(也稱Box-Jenkins法)等。
(2)因果分析預測法
因果分析預測法是以因果性預測原理作指導,以分析預測目標同其他相關事件及現象之間的因果聯系,對事件未來狀態與發展趨勢做出預測的定量分析方法。較為常用的主要有回歸分析預測法、計量經濟模型預測法和投入――產出分析預測法等。隨著數學方法在計算機上的運用和實現,經濟學的研究與數學和計算機科學的聯系更為緊密。近年來,許多人工智能預測模型層出不窮,極大豐富了預測的方法和手段。
三、應急物資需求預測的研究現狀
應急物資是指為應對自然災害、事故災難、公共安全事件和社會安全等突發性公共事件應急處置過程中所必需的保障性物資。應急物資的需求是應急物資保障的首要環節,它具有時間上和數量上的不確定性等特點。因此,做好應急物資的需求預測有著重要的現實意義。就國內目前的研究來看,主要體現在運用人工智能方法構建預測模型,時下最流行、使用最廣泛的方法有CBR(案例推理法),ANN(神經網絡模型),SVM(支持向量機模型)等。
1.案例推理法(CBR)
案例推理法(Case―Based Reasoning,簡稱CBR)最早是由耶魯大學Schank 教授在Dynamic Memory:A Theory of Reminding and Learning in Computers and People(1982)一文中提出的,它是人工智能領域的一項重要推理方法。國外自上世紀 8O 年代后期對 CBR 的理論和方法進行了系統研究,在通用問題求解、法律案例分析、設備故障診斷、輔助工程設計、輔助計劃制定等領域取得實用性成果[1];國內運用CBR方法對應急物資需求進行預測,取得了一定的進展:傅志妍,陳堅[2]運用歐氏算法尋求最佳相似源案例,建立案例推理――關鍵因素模型對目標案例進行需求預測,并通過實例驗證了模型的科學有效;王曉、莊亞明[3]將模糊集理論、神經網絡Hebb學習規則和多元線性回歸與案例推理法相結合,較為準確地預測出非常規突發事件的資源需求;Fu Deqiang[4]等人使用了一種基于案例推理和BP神經網絡的精度預測法,同樣通過目標案例證實了模型的可靠性。
雖然案例推理法出現的時間較早,且在各領域得到了廣泛的運用,但是這種預測方法有著較大的經驗成分,且案例庫的建立是進行案例推理分析的首要步驟和困難之處。而目前對于案例庫的建立存在著數據不全,缺失以及無系統整理歸檔的問題。
2.人工神經網絡(ANN)
人工神經網絡最早是由Lapedes和Farber于1987年在《運用神經網絡進行非線性信號處理:預測和系統模型》[5]一文中提出并使用的,他們用非線性神經網絡對計算機生成的時間序列仿真數據進行訓練和預測。王其文[6]等人和Chin Kuo[7]等分別通過對神經網絡和傳統回歸預測方法的比較,證明了神經網絡在預測中的優越性。
對于神經網絡在應急物資需求預測中的使用,國內相關文獻較少。筆者認為具有啟發性的是在《大型地震應急物資需求預測方法研究》[8]一文中,郭金芬和周剛先利用 BP 神經網絡算法對災后人員傷亡人數進行預測,然后結合庫存管理知識估算出災區應急物資的需求量;隨后,郭在其碩士論文中對該問題做出較為系統的研究[9]。而神經網絡在物流需求預測中的運用,對應急物資需求預測是同樣具有借鑒意義的:后銳、張畢西[10]提出基于MLP 神經網絡的區域物流需求預測模型,揭示了區域經濟與區域物流需求之間的非線性映射關系, 為區域物流需求預測提供了一種新思路和新方法;苗鑫[11]等人用擴展卡爾曼濾波和人工神經網絡相結合的復合算法對物流需求進行預測,并在與常規BP神經網絡算法的預測誤差比較中,顯示出其較高的可靠性;牛忠遠[12]依據物流需求的時間序列統計數據,應用人工神經網絡多步預測和滾動預測方法建立預測模型,對我國物流需求進行實證分析研究。
3. 支持向量機(SVM)
支持向量機是建立在統計學習理論的VC維理論和結構風險最小原理基礎上,根據有限的樣本信息在模型的復雜性和學習能力之間尋求最佳折衷,以求獲得最好推廣能力的一種方法。它是由Vapnik等人于1995年提出的[13][14],現已廣泛地應用于模式識別、語音識別、時間序列分析、生物信息學及經濟學等領域。
支持向量機在應急物資和物流需求預測中的研究,國內文獻一般集中在以下幾個方面:趙一兵[15]等人運用支持向量機回歸算法建立了地震中人員傷亡預測模型,而后結合庫存管理模型對應急物資進行了估算,并在實例中驗證了模型的有效性;吳潔明[16]等運用支持向量機對歷史物流需求量的數據進行學習,而后通過粒子群算法獲得模型最優參數對物流需求進行預測;何滿輝[17]等針對支持向量機在處理數據時無法將數據簡化的問題,提出了基于模糊粗糙集與支持向量機的區域物流量預測方法;朱莎[18]提出了基于小波分析和支持向量機的組合預測方法,建立了針對緊急救援階段和后續救援階段的血液需求預測模型,并在汶川地震的案例中體現出該模型較高的精度。
從以上文獻中我們可以發現,案例推理法,人工神經網絡和支持向量機的應用,都體現出跨學科,跨專業的特點,它們將生物學或計算機科學等自然科學的研究方法推廣到經濟管理等社會科學中,并很好地解決了現實問題。
四、結束語
本文首先通過對現有預測方法的簡要介紹,提出運用近年來興起的人工智能方法對預測問題的研究;而后從應急物資需求的視角出發,對國內外解決應急物資需求預測方法做出總結回顧。通過分析,筆者認為支持向量機(SVM)更適合運用于對歷史數據較少或不全的應急物資需求進行預測。下一步的工作將是對預測指標的選取和影響因子的量化,以及對輸入SVM訓練數據的處理,并在實例中驗證該預測方法的精確度和有效性。
參考文獻:
[1]侯玉梅,許成媛. 基于案例推理法研究綜述[J]. 燕山大學學報(哲學社會科學版), 2011, 12(4): 102-108.
[2]傅志妍,陳堅.災害應急物資需求預測模型研究[J].物流科技,2009(10):11-13.
[3]王曉,莊亞明.基于案例推理的非常規突發事件資源需求預測[J].西安電子科技大學學報,2010,12(7):22-26.
[4]Fu Deqiang, Liu Yun, Li Changbing, Forecasting the Demand of Emergency Supplies: Based on the CBR Theory and BP Neural Network, Proceedings of the 8th International Conference on Innovation & Management. Fukuoka, Japan, November, 2011.
[5]Lapedes A, Farber. Nonlinear signal processing using neural networks: prediction and system modeling [R]. Technical Report LA-UR-87-2662,Los Alamos National Laboratory. Los Alamos. NM,1987.
[6]王其文, 呂景峰, 劉廣靈等. 人工神經網絡與線性回歸的比較[J]. 決策與決策支持系統, 1993, 3 (3) : 205-210.
[7]Chin, Kuo, Arthur, Reitsch. Neural networks vs. conventional methods of forecasting, The Journal of Business Forecasting Methods & Systems, Winter 1995/1996 17-22.
[8]郭金芬,周剛.大型地震應急物資需求預測方法研究[J].價值工程,2011(22).27-29.
[9]郭金芬.面向大型地震的應急物資需求預測方法研究[D]. 天津:天津大學,2011.
[10]后銳,張畢西. 基于MLP神經網絡的區域物流需求預測方法及其應用[J]. 系統工程理論與實踐,2005, 25(12): 43-47.
[11]苗鑫,西寶,鄒慧敏. 物流需求的動態預測方法.哈爾濱工業大學學報[J]. 2008, 40(10): 1613-1616.
[12]牛忠遠. 我國物流需求預測的神經網絡模型和實證分析研究[D]. 浙江:浙江大學, 2006.
[13]VAPNIKV. The Nature of Statistical Learning Theory [M].New York : Spring Verlag,1995.
[14]VAPNIKV,張學工譯.《統計學習理論的本質》 [M]. 北京:清華大學出版社,2000.
[15]趙一兵,高虹霓,馮少博. 基于支持向量機回歸的應急物資需求預測[J]. 2013, 30(8): 408-412.
[16]吳潔明,李余琪,萬勵. 物流需求預測算法的仿真研究[J]. 2011, 28(9): 246-249.
[17]何滿輝,逯林,劉拴宏. 基于模糊粗糙集與支持向量機的區域物流量預測[J]. 2012,12(3):129-134.
關鍵詞:計算機 網絡預警 信息安全
中圖分類號:U441 文獻標識碼:A 文章編號:1007-9416(2012)05-0101-01
隨著網絡安全事件的不斷升級,網絡安全問題引起了人們的高度重視,人們開始反思導致網絡安全事件發生的原因,開始探索防御各類攻擊事件和入侵行為的手段,網絡預警技術應運而生。網絡預警技術是近年來發展起來的新一代安全防范技術,是一種集檢測、記錄和報警于一身的網絡安全技術,對計算機網絡或系統中的信息進行收集和分析,判斷其是否具有威脅性,如果有則立即發出警報,使操作人員提前做好防御準備,確保網絡安全。
1、預警的概念
從應用角度,預警可以理解為在災難或其他具有威脅性的事件發生前,根據事物的發展規律和以往的經驗總結,運用現有技術手段判斷目標事件是否存在問題或威脅,并向相關部門發出相應的信號提示,讓相關部門提前做好應對準備,從而將危害可能造成的損失降至最低[1]。本文研究的主要是網絡預警技術,即通過對計算機網絡或系統內的信息進行搜集分析,對其威脅性進行判斷,一旦發現威脅立即發出警報,使操作人員做好防御準備,維護網絡信息安全。
2、網絡預警的意義
網絡預警的意義主要表現在以下幾個方面:
(1)有效預警系統內部的入侵行為:據統計,約有80%的入侵行為發生于系統內部,網絡預警技術對于內部用戶的越權行為和內部用戶泄密行為具有較強的預警功能,因而對于防御內部入侵行為具有重要意義[2]。
(2)最大限度地減少攻擊事件造成的損失:網絡預警技術能夠監控、分析系統和用戶的行為、評估關鍵數據文件的完整性、核查并恢復系統漏洞、預警入侵行為的發生等[3]。一旦發現目標事件具有威脅性,系統立即發出警報信號,使操作人員及時做好防御準備,最大限度的減少了入侵行為造成的損失。
(3)最大限度的避免同樣的攻擊事件再次發生:當攻擊事件發生后,網絡預警系統會自動收集相關信息并添加到數據庫中,一旦發現相似攻擊事件信息,系統將自動檢索數據庫并立即調取相關信息作為操作人員防御參考,增強了系統的防范能力,最大限度的避免同樣的攻擊事件的再次發生。
(4)入侵行為發生后,系統自動保留入侵者的信息:網絡預警系統能夠在入侵行為發生的同時,記錄并保留入侵行為相關信息,作為可以指證入侵者非法行為的證據。
3、網絡預警技術的方法及其比較
3.1 網絡預警技術的四種主要方法
一個完整的預警過程通常要歷經預警指標選擇和確定、預警方法選擇和確定、警限界定確定、報警這幾個階段。目前,預警方法和理論有很多,本文主要介紹4種:Logistic回歸法、案例推理預警法、失敗樹預警法和基于神經網絡預警法。
(1)Logistic回歸法:Logistic回歸常用于流行病學,較為常見的情況是探尋某疾病的危險因素,并根據危險因素預測疾病發生率,目前Logistic回歸被預警領域廣泛應用,如金融危機預警、財務預警等。Logistic回歸通過目標事件影響因素分析來創建分析模型:首先對預警目標進行驗證,根據驗證結果對指標進行相關性分析,確定并剔除相關度較高的指標,根據目標事件具體情況確定警界點,對這一過程中利用的分析方法進行分析并檢驗,創建Logistic回歸模型。
(2)案例推理預警法:案例推理首先要創建一個案例庫,當新的案例發生時,對該案例進行特征描述,根據其特征從案例庫中檢索具有相似特征的案例并進行對比分析,最終實現預警的效果。
(3)失敗樹預警法:失敗樹分析法具有易理解、直觀、高效的特點,被廣泛應用于預警領域,如工程預警。失敗樹預警法的實現過程首先要對已發生的失敗事件進行分析歸納,確定其失敗的影響因素、控制條件和路徑等,之后根據失敗路線和分析結果創建模型。
(4)基于人工神經網絡(ANN)的預警法:基于人工神經網絡的預警法的工作原理是將同系列的樣本輸入和理想輸出作為訓練的“樣本”,并根據一定的訓練算法對神經網絡進行充分訓練,直至神經網絡發掘蘊含在“解”中的隱含關系,之后利用訓練完的人工神經網絡對相同問題進行求解,從而實現預警目的[4]。
3.2 網絡預警技術方法比較
Logistic回歸分析法具有操作簡單的優點,只需較少的變量就能實現預警目的,但是,Logistic回歸分析法是一種靜態預警法,無法處理遺漏信息的狀況,且缺乏自我調整力、自我學習力以及容錯能力;
案例推理預警法具有強大的記憶功能,只要檢索案例庫就能實現對相似問題的預警,無需重復預警過程。目前,案例推理預警法尚處于不斷完善階段,未能充分認識很多預警對象的知識;
失敗樹預警法具有簡單、直觀、易理解、針對性強等特點,對特定的問題能夠產生實質性的預警。但是,由于目標對象的失敗事件影響因素是多方面的,使失敗樹模型的建立受到目標對象的約束;
基于人工神經網絡預警法具較強的自我學習能力、聯想記憶能力,極佳的并行性、非線性、模糊性、全局性以及容錯性。
目前,存在多種神經網絡預警模型,每一種都存在自己的優勢和弊端,因此在選擇預警方法時,要根據具體情況慎重選擇網絡模型。
4、結語
隨著網絡安全事故的升級,網絡安全問題成為信息社會一個極為重要的研究課題,網絡預警技術應運而生,對于維護網絡信息安全具有積極意義。網絡預警方法和理論有很多,主要有Logistic回歸法、案例推理預警法、失敗樹預警法和基于神經網絡預警法四種,且每一種預警方法都有各自的優勢和弊端,因此要根據具體情況選擇網絡預警模型。
參考文獻
[1] 李翔,馬嘉川.信息網絡安全預警技術[J].辦公自動化,2010(16).
[2] 孫紅霞.計算機網絡安全探討[J].信息與電腦(理論版),2010(04).
關鍵詞:長株潭城市群;數據挖掘;逐步線性回歸;BP神經網絡
中圖分類號:F207文獻標識碼:A文章編號:1672-3309(2008)05-0026-05
1.引言
消費、投資和凈出口共同構成整個國民經濟,消費對國民經濟起著支撐作用。2004年統計數據顯示,7個主要工業化發達國家消費率英國最高達86.53%,其次是美國86.13%,平均比例達到79.93%,消費對經濟貢獻相當顯著,4個新興經濟體中俄羅斯、印度、巴西消費比重分別為65.19%、70.88%、79%,中國的這一比例為54.44%。就地區而言,2006年湖南消費率為60.95%,長株潭城市群總體消費率僅為46.33%,提升消費對中國經濟的貢獻空間廣闊。中國的經濟發展由粗放的產值增長和供應推動型,向集約化、需求拉動型轉移,將是我國城市經濟發展的必由之路。
城市群這一區域經濟模式對國民經濟發展起著重要作用。美國三大城市群對美國經濟整體貢獻率為67%;日本三大城市群對日本經濟整體貢獻率超過70%;而中國的珠江三角洲、長江三角洲、京津唐環渤海灣地區三大城市群對中國經濟整體貢獻率僅達35%。從地區來看,目前長株潭城市群占全省經濟比重為37.9%,影響力、吸引力和輻射力有很大的成長空間。城市群消費水平不僅是人民生活水平的體現,也是區域經濟實力和城市群競爭力的重要因素。
當前城市群研究,針對城市主要有城市化、城市開發區、產業結構、房地產經濟、城市基礎設施、城市可持續發展、城市競爭力、城市發展戰略等方面,而作為城市集合體的城市群其研究則包含城市群概念與內涵、城市群類型和模式、城市群形成機制、城市群空間結構、城市群規劃、城市群協調發展、城市群發展階段等領域。總的來說,由于城市和城市群的系統特征,使得該領域的研究具有系統性和復雜性,目前對于城市競爭力、城市產業以及城市可持續發展研究等方面有著較多關注。
本文運用數據挖掘方法研究城市群消費,以SAS的Enterprise Miner及SEMMA方法為工具,對長株潭城市群消費進行分析。研究發現,影響長株潭城市群消費顯著性因素在于財政、農業和人口因素,分地域影響因素則具多樣性。研究先采用雙重逐步線性回歸對各區域層次消費的顯著性因素進行篩選,分析其特征及問題;然后參考城市群回歸方程所提取變量,運用BP神經網絡模型對線性回歸模型的預測進行優化;通過回歸模型和神經網絡模型建立城市群問題發現和預測模型,對城市群消費進行監測。
2.影響消費的顯著性因素分析
研究的目標變量為社會消費品零售總額,分15個地區、3個地級市轄區以及城市群總體的層次進行系統分析。考慮到各縣市有其各自特征,各統計指標對于社會消費品零售總額的貢獻度存在差異,因此在變量選取上應盡量考慮到多種因素的共同影響。數據樣本來源于1990-2007年《湖南統計年鑒》,由于數據統計口徑、一致性、完整性等因素,主要從數據源中抽取以下指標,指標及變量說明見表1。
2.1 逐步回歸方法
要考察各因素增長對消費的貢獻度,則采用線性――對數多元回歸模型。變量同時進入模型可提高擬合優度,但解釋變量之間可能存在共線性,估計結果無法通過顯著性檢驗。綜上,采用逐步回歸分析對多種影響因素中的主要影響因素進行篩選。回歸方法選擇逐步篩選法(Stepwise),逐步篩選法每次引入模型一個最顯著變量,然后考慮從模型中剔除一個最不顯著變量,直到既無變量引入也無變量剔除為止,也稱雙重逐步回歸。模型選擇標準交叉驗證誤差,從驗證數據集中選擇最小誤差,這種方法類似于以SSE為標準選擇最佳模型。
2.2 逐步回歸結果
城市群總體:
Y=-16671192.36+3942965.34lnX10
+3331453.3lnX12-11630474.75lnX15
t= (-2.201590) (3.169381) (5.204872) (-5.789535)
p= (0.0031)(0.0068) (0.0001) (0.0000)
R2=0.989067;R2=0.986725;F=422.1905
按地級市轄區分長沙、株洲、湘潭三市:
長沙市:Y=-305296767.4+53288202.23lnX1-7664702.56lnX15
t= (-18.53315) ( 22.77283)(-4.635727)
p= (0.0000)(0.0000) (0.0003)
R2=0.973299; R2= 0.969739; F=273.3870
株洲市:Y=-10402017.23+914793.66lnX10
+173356.02lnX11+397082.87lnX12
t= (-22.11772) (5.467101) (3.590788) (3.160809)
p= (0.0000)(0.0001) (0.0030)(0.0069)
R2=0.991155; R2= 0.989259; F=522.9165
湘潭市:Y= 345212.81lnX13-876304.47lnX17
t= (44.09447) (-37.10352)
p= (0.0000) (0.0000)
R2= 0.991513; R2= 0.990983; F= 1869.232
分縣市區域結果歸納如表2,變量順序按貢獻度降序排列。
以上回歸截距變量及偏回歸系數均具有顯著性,縣市域方程省略了方程具體形式。望城縣、炎陵縣與湘潭市地市一級方程采用了逐步回歸建立NOINT方程的方法。
2.3 實驗結果評價
分縣市區域結果中,中心城市長沙市區、株洲市區、湘潭市區模型變量與Y全部正相關。長沙市區方程變量貢獻度X18>X12>X17;株洲市區方程變量貢獻度X1>X12;湘潭市區的方程X3>X12>X7>X16。所有正相關變量中,X3對消費均存在正相關特征,相對突出的是湘潭市區;收入因素X4和X5對消費均產生正向影響;財政因素X12和X13對居民收入、經濟和消費環境產生影響,均與消費呈正相關;所有負相關變量中,X2均顯示出與消費顯著負相關的性質,變量見于寧鄉縣、茶陵縣和炎陵縣的方程中,從經濟學角度理解,從業人員增加可能降低平均工資而影響消費。X14-X18這5個變量主要是教育和醫療相關變量,呈現出中心城市正相關,縣域城市負相關的特點。
地級市轄區模型中,從貢獻度看,長沙市X1>X15,株洲市X10>X12>X11,湘潭市X13>X17。從相關性來看,除株洲市全部正相關外,長沙市與湘潭市分別存在負相關變量X15、X17,長沙市中等學校教師和湘潭市醫務工作人員其人口比例增加將降低消費。值得注意的是,對比長沙市方程與所轄縣市方程發現,X15未進入縣市地區回歸模型中,湘潭市的X17也未在轄區方程中出現,可見,由于分析的區域層次不同,某些因素可能被掩蓋。
城市群總體方程中,貢獻度X10>X12>X15。農業機械動力貢獻度較高,提高農業機械化程度,會對消費產生較大影響;財政收入構成因素較多,它包括國內增值稅、企業所得稅、營業稅、增值稅和消費稅、個人所得稅等,財政收入增長,會影響社會消費;與財政收入對應,財政支出包括公務支出、國防、教育、衛生、社會保障及福利、住房和公共環境等,對消費環境具有廣泛影響,其本身與消費相關度較高,但未進入模型;負相關變量X15其數量變化對消費影響相對較大,應考慮中等教育隊伍質的提升而不是量的增加。
總的來說,雙重逐步回歸所得到的模型,對顯著性變量的篩選是有效的,回歸方程線性擬合和預測的特征,使其預測相對誤差較大,以下將通過非線性擬合的方式對城市群消費總量進行擬合預測。
3.基于BP神經網絡的消費預測
3.1 BP神經網絡
神經網絡模擬人腦工作,它由網絡分布的神經元構成,神經元層次連接成知識處理和表達系統。BP神經網絡屬于前饋神經網絡,是多層感知器(MLP)系統,它采用反向傳播學習的方式對前饋神經網絡進行訓練。其原理是,對于每個訓練實例,反向傳播首先通過網絡反饋實例,并計算網絡輸出,輸出節點的誤差反向傳播到與其相關的節點并修改其網絡權重值,進行充分迭代后,反向學習一定收斂。BP神經網絡的網絡拓撲結構如下所示:
一般而言,隱層的數量主要要考慮到輸入變量的數量、訓練數據中觀測值的數量、訓練數據潛在分布的噪聲等級因素等。
3.2 結構與方法
BP神經網絡具備很強的非線性映射能力,模型輸入變量的選取以城市群回歸模型及其變量作為參考,實驗過程中根據模型擬合效果考慮變量的去留。備選變量主要考慮與目標變量的相關程度,根據模型需要選擇,最終輸入變量為X6、X10、X12、X13、X19,輸出變量為Y。理論和實踐證明,在數據顯著性和可靠性的保證之下,僅含一個隱層的BP神經網絡通過調整隱層神經元的數量足以解決許多復雜問題,因此優先使用三層網絡結構。通過實驗,網絡結構最終選擇5-14-1,即隱層含14個神經元,學習率0.022。
歸一化采用標準差方法,它通過標準差來除以輸入值減去樣本均值將輸入變量轉換到[0,1]之內,為EM的默認方式。激活函數采用雙曲線Tanh函數,其函數形式為:f(x)=(exex)/(ex +ex),該函數值域
[-1,1],符合神經網絡特性,且比其它函數具有更快的收斂性能。模型選擇采用平均誤差方法選擇平均誤差較小的模型,目標變量為區間型變量適合采用這種方法。考慮對模型進行泛化,將數據分區為訓練數據、檢驗數據、測試數據,分區比例為80%、10%、10%,綜合考慮訓練數據與非訓練數據的平均誤差大小來選擇模型。
3.3 預測結果評價
模型平均誤差參數及輸出值對照如下:
神經網絡模型中分析模型對樣本規律的逼近情況,即泛化能力,要考慮訓練數據與非訓練數據之間誤差的大小,不能只考慮擬合能力。若非訓練數據平均誤差小于或接近于訓練數據平均誤差,則模型反映了數據所蘊涵的規律。在誤差參數中,檢驗數據和測試數據平均誤差小于訓練數據平均誤差,同時模型中預測值相對誤差小于10%,模型基本上反映出數據內在的規律,認為該神經網絡模型是合理的。
4.結論與展望
通過以上研究,可以得出以下結論:
(1)從消費增長的角度觀察,影響因素存在區域層次差異,刺激消費要注意總體和個體區別,靈活采取策略。城市群區域總體要注重農業機械動力的投入、擴大財政收入以及促進中等教育者素質和效率的提高;對于收入因素,城市在崗人均工資和農民人均純收入對消費均有正向影響,提高城鄉居民收入有利于提高消費;財政收入和支出包含對收入影響因素,也包含影響消費環境的成分,增加財政收入,加大財政對教育、醫療、社會保障、環境等方面的投入,有助于提升消費,從建設和諧社會的層面來說也是必要措施。固定資產投資對消費影響較小,在結果中也未得到體現。
(2)從城市發展的角度看,城市化、工業化是城市發展的重要特征,城市人口數與消費全部正相關,城市化對消費有明顯作用;工業對消費的影響存在地區差異,并出現負相關項,工業發展要注重惠及廣大人民。農業因素中農業機械動力投入均正相關,并表現在城市群方程中,在城市化導致耕地面積減少的情況下,推進城市化與工業化要更注重提高農業生產率,農業機械化值得重視。教育、醫療相關因素共有5個變量,在縣域、長沙市與城市群的模型中全部負相關,而地級市區方程則全部正相關,可以認為,中心城市醫療和教育水平高于縣域城市,縣域城市需要針對性地提高醫療、教育水準。
(3)從所采用方法來分析,雙重逐步線性回歸具有半自動的提取顯著變量特點,能夠保證顯著性水平,但預測結果相對誤差較大,BP神經網絡具有良好的預測能力,兩者結合能夠較好的對問題進行認識,同時根據需要可通過遞推方法,對未來數據進行預測。
長株潭城市群的發展要注重借鑒與實踐相結合。首先,長株潭城市群具備區位優勢,擁有城市區域發展的基本條件,也存在管理體制、重復建設、能源和原材料短缺,基礎設施滯后、污染嚴重等制約因素。吸取國外城市群發展經驗,不但注重產業集聚的成本效應,更注重產業發展的質量;關注公共設施建設,完善公共交通體系;強調城市群區域競爭力乃至國際競爭力的發展,建設學習型城市和城市群;注重提高城市群內人民生活質量等。其次,長株潭城市群總體消費率發展空間大。促進消費水平的提高,有利于城市第三產業的發展,能推動產業結構調整。提高城市群消費的成功經驗主要有提高最低工資標準、減免稅收、低收入者消費補貼、拓展信用卡消費、解決住房問題等措施。
隨著長株潭城市群建設兩型社會展開以及交通同環、電力同網、金融同城、信息同享、環境同治“五同”專項規劃的持續推進,將使城市群發展步入一個新的臺階,城市群內聯系將進一步加強,促進城市和經濟和諧發展、人民消費和生活水平將不斷提高。
參考文獻:
[1] 姚士謀、朱英明、陳振光.中國城市群[M].合肥:中國科學技術大學出版社,2001.
[2] 中國科學院可持續發展戰略研究組編. 2004中國可持續發展戰略報告[M].北京:科學出版社,2004.
[3] 趙勇、白永秀.城市群國內研究文獻綜述[J].城市問題.2007,(07):6-11.
[4] 趙偉.城市經濟理論與中國城市發展[M].武漢:武漢大學出版社,2005.
[5] Roiger?Geatz著、翁敬農譯.數據挖掘教程[M].北京:清華大學出版社,2003.
[6] Randall Matignon. Neural Network Modeling Using Sas Enterprise Miner[M]. Authorhouse,2005.