前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的神經網絡的概念主題范文,僅供參考,歡迎閱讀并收藏。
關 鍵 詞:BP算法;GARCH-BP模型;深證成指
中圖分類號:F830.91 文獻標識碼:A 文章編號:1005-0892(2006)06-0041-04
一、引言
股市是一個復雜的非線性系統,股票價格涉及許多不確定因素,且各個因素之間的相關關系錯綜復雜。隨機行走理論認為股價波動完全是隨機的,但大量事實表明,股價波動存在某種規律性。我們可以將股市看作確定的非線性動力系統,即內部的動力機制是確定的,股價的歷史數據和其它信息蘊含著可用于預測未來股價的信息。
近年來,神經網絡由于其強大的非線性逼近和泛化能力,得到了最為廣泛的應用。Lapedes等最早發表了神經網絡用于預測的文章,他們用非線性神經網絡對由計算機產生的時間序列仿真數據進行學習和預測。[1]后來Werbos,Varfis和Versino對實際的經濟時間序列進行了預測研究。[2]Weigend等利用神經網絡研究太陽黑子的年平均活動情況,通過與回歸方法的比較表明神經網絡的預測優于統計預測。[3]20世紀90年代以來,國外利用神經網絡對股票價格預測方法層出不窮。[4-7]國內一些學者也開始利用神經網絡的方法對中國股市的股票價格進行預測。[8-9]另外一些人工智能的方法,如遺傳算法、模糊理論和粗集,也陸續在股票市場中得到一些應用。
二、基于GARCH-BP模型的股指預測模型
(一)BP神經網絡模型
BP神經網絡模型,是目前神經網絡學習模型中最具代表性、應用最普遍的模型。BP神經網絡架構是由數層互相連結的人工神經元組成,通常包含了輸入層、輸出層及若干隱藏層,各層包含了若干神經元;神經網絡依照學習法則,通過訓練以調整連結鏈加權值來完成學習目標的收斂。
盡管神經網絡具有自我學習的功能,但要求輸入的資料需具有一定的可用性。為避免輸入神經元過少,使得網絡無法配適完成,因此本文采用前5天的收益率rt-1、rt-2、rt-3、rt-4及rt-5作為當天收益率rt的輸入神經元。因此本文所使用的神經網絡,其架構為5-7-4-1,輸入層有五個輸入神經元、7個隱藏神經元的第一層隱藏層、4個隱藏神經元的第二層隱藏層以及包含一個輸出神經元的輸出層。其網絡架構如圖1。
圖1BP神經網絡模型網絡架構
要讓神經網絡訓練更有效率,可以對網絡輸入與目標向量進行前處理程序。本文所使用的歸一化方法為極小值與極大值方法。其方式為重新定義四個向量,各自為輸入與輸出向量的極小值與極大值,依照輸入與目標向量在這四個向量中的大小重新定義。而歸一化后的輸入與輸出向量皆介于-1和+1之間。如此一來,可以直接反應出原始向量對問題的權重情況,而使得網絡訓練更有效率。當要預測一新的輸出向量時,只要將新的輸入向量根據先前的極小值與極大值向量作一調整,即可根據訓練好的網絡進行仿真。另外,網絡的轉換函數則采用雙曲線正切函數。在完成網絡的訓練與仿真后,由于輸出向量也將會介于-1和+1之間,因此需再根據原先目標向量的歸一化向量做后處理,以便使輸出向量還原到原始的資料形態。
(二)加入GARCH變量的BP神經網絡(GARCH-BP)
BP神經網絡所使用的輸入神經元僅考慮前五天的對數收益率,并未將收益率的波動程度考慮進來,因此除了使用前五天的對數收益率作為輸入神經元外,另外使用GARCH時間序列模型,將所估計的條件變異數作為第六個輸入神經元,以比較在考慮了收益率波動后的BP神經網絡對于時間序列資料的估計與預測是否較其它模型要好。
在建立了條件變異數GARCH模型后,將所得到的條件變異數作為BP神經網絡的第六個輸入神經元,而網絡架構也形成6-7-4-1,即具有六個輸入神經元的輸入層、七個隱藏神經元的第一層隱藏層、4個隱藏神經元的第二層隱藏層及一個輸出神經元的輸出層。
三、模型績效評定準則
(一)MSE準則
均方誤差(Mean Square Error)是計算實際值與預測值的預測誤差后取平方并加以平均。MSE的公式如下:
MSE=(rt-t)2 (1)
其中T代表總樣本數,T1代表估計樣本的數目,rt代表實際值,t則為模型的估計值或預測值。
(二)MSPE準則
均方比例誤差(Mean Square Percentage Error)是計算實際值與預測值的預測誤差占實際值的比例后取平方并加以平均。MSPE的公式如下:
MSPE=×100% (2)
使用MSPE的優點是考慮了誤差對于實際值所占的比例,而不會皆給予相同的權重。
(三)MAE準則
平均絕對誤差(Mean Absolute Error)考慮了誤差的絕對距離。其公式如下:
MAE=t-t (3)
(四)MAPE準則
平均絕對比例誤差(Mean Absolute Percentage Error)類似于MSPE的觀念,在MAE中每一誤差皆除以實際值,以便給予不同的權重。
MAPE=×100%(4)
(五)AMAPE準則
不對稱平均絕對比例誤差(Asymmetric Mean Absolute Percentage Error)更進一步地考慮在使用MAPE法時,在相同的誤差下由于不同實際值所產生的不對稱性現象。因此做一修正,AMAPE的公式如下:
AMAPE=×100% (5)
(六)符號正確率(Correct Sign Ratio;CSR)
CSR并不衡量誤差大小,而是僅衡量預測與實際的符號是否正確。由于在收益率估計與預測上的準確度并不高,因此若僅考慮模型所估計或預測的值與實際值間的符號是否相同,亦可比較出模型的好壞。若CSR低于50%,則表示此模型對于收益率符號的預測能力還不如隨機猜測的50%好。其公式如下:
CSR=Zt
Zt=1,當(rt?t)>0時
Zt=0,當(rt?t)≤0時 (6)
其中Zt為一邏輯變量,當實際值與估計值相乘后,其值大于0時,表示符號正確,則為1;反之則為0。
(七)Strategy
Strategy為CSR所衍生出的另一種衡量方式,其概念是通過模型的預測符號而決定投資策略。當模型預測為正收益率時,則予以買進,所獲得的收益率為當日股市的實際收益率;若模型預測為負收益率時,則予以放空,同樣地可獲得當日股市的實際收益率。但先前假設為預測符號與實際符號相同才可成立,若符號相反,則收益率應轉為損失。雖然CSR可以得知模型的預測符號的能力,但通過Strategy可以更清楚地知道采用模型的預測符號進行投資所獲得的收益率會是多少。其公式如下:
總加報=rt
若t>0,則rt符號不變
若t
在前述7個績效評定方法中,大致分類為兩種:第一種為預測誤差的衡量,此部分為衡量各模型估計或預測誤差的績效,包括MSE、MSPE、MAE、MAPE、AMAPE等。第二種為符號準確度的衡量,此部分不看預測值的大小,只針對預測的符號是否與實際值相同,包括CSR檢定以及利用預測符號決定投資策略的Strategy。
圖2列示了我們運用神經網絡進行股票市場指數收益率樣本數據的預測分析。
圖2 股票指數收益率神經網絡預測過程
四、訓練結果
中國股票市場可以觀察到的數據種類非常多,包括幾十種價格指數和上千家個股數據,本文選擇其中具有代表性的數據進行分析。具體而言,在由香港理工大學和深圳國泰安公司聯合開發的《中國股票市場交易數據庫(2003)》軟件的支持下,選取深證成指為研究對象,其時間范圍和數據長度為:2004年7月3日至2005年12月31日長度為259天的日收盤指數。
BP神經網絡的建構是前述研究方法對樣本進行訓練及測試程序。參數設定值輸入層為5;第一隱藏層為7,第二隱藏層為4,輸出層為1,訓練函數為TRAINGDX,自適應學習函數LEARNGDM,訓練次數為500,訓練精度要求0.025,學習率0.01,下降學習率為0.7,上升學習率1.05。訓練函數采用結合適應性學習速率與動量的算法。在訓練222次后,結果如圖3。
圖3BP神經網絡訓練結果圖
GARCH-BP神經網絡的建構也采用前述的參數設定方法對樣本進行訓練及測試程序。在訓練102次后,訓練結果如圖4。
圖4GARCH-BP神經網絡訓練結果圖
在估計樣本的績效分析中我們所采用的準則包含了MSE、MSPE、MAE、MAPE、AMAPE、CSR及Strategy。在建立好模型后,估計的收益率與實際收益率相比較后的結果如表1。
表1估計樣本估計誤差分析表
注:MSPE、MAPE及AMAPE的單位為%,MSE為反歸一化后的實際MSE值。
在MSE準則下,估計樣本中BP神經網絡模型的MSE值大于GARCH-BP神經網絡模型的值,不過差距僅為0.0026。說明盡管GARCH-BP神經網絡模型有利于降低估計樣本的估計誤差,但效果不是非常明顯。MSPE是考慮了估計誤差相對于實際值的權重。在BP神經網絡模型中MSPE為60.5899%,而在加入GARCH(1,1)的BP神經網絡中,MSPE為57.4962%,小于未加入GARCH的BP神經網絡,也說明了加入GARCH后確實可以改善神經網絡的估計誤差比重的問題。在MAE準則中,其估計誤差并未直接加以平方,而直接采用絕對值,通過絕對距離的概念而決定。如表1所示,這兩個模型的MAE值皆相同,表示估計時所采用此種收斂方法并不會影響模型的優劣。MAPE類似于MSPE概念,同樣在MAE中考慮了估計誤差的權重問題。在表1中,BP神經網絡的MAPE值為2.1424%;而加入GARCH的BP神經網絡的MAPE值為1.4161%,在MAPE與MPSE績效準則中皆小于未加入GARCH的神經網絡與進化神經網絡,表示在考慮估計誤差的權重概念上,加入GARCH變量的BP神經網絡比BP神經網絡模型更有效。AMAPE修正了MAPE中估計誤差不對稱性的問題。在表1的AMAPE準則中,加入GARCH的BP神經網絡,其AMAPE依舊比未加入GARCH的神經網絡要小,表示即使考慮了估計誤差的不對稱性,BP神經網絡模型也應考慮采用較有效的變量,而非使用較復雜的模型。
前面所敘述的準則是考慮估計值與實際值的差距,由于單純的以時間序列做預測的效果通常不是很好,近來較為常用的是只考慮預測的符號準確性。因此后續的兩個準則是采用預測值的符號與實際值是否相同的概念而做一延伸。
在CSR中,由表2可知,GARCH-BP神經網絡的正確率較高,其CSR為59.14%,而BP神經網絡模型為57.19%,表示GARCH-BP神經網絡不僅在預測誤差上優于BP神經網絡,而且在符號的準確性上也相對較佳。但兩個模型的預測準確度皆大于50%,表示使用模型加以預測的準確度比漲跌各占50%的隨機猜測要好。
表2估計樣本的符號準確性及投資策略績效表
在先前的CSR準則中,雖然得知各模型的符號預測性較隨機預測要高,但若實際投入股市中,其績效卻無法得知,因此應采用投資策略的準則來判斷何種模型較佳。在表2中,其收益率較高的模型為BP神經網絡,收益率達68.54%;而較差的模型為加入GARCH的BP神經網絡模型,收益率為66.37%,顯示BP神經網絡對于較大的收益率具有較佳的捕捉能力。
五、結論
通過上述分析,可知本文建立的GARCH-BP神經網絡模型在對股票指數收益率估計樣本和測試樣本的誤差分析方面均優于BP神經網絡,在預測符號的準確性方面,GARCH-BP神經網絡模型仍然優于BP神經網絡,但從整體上說,利用這兩種模型進行預測收益率符號時,在估計樣本中的表現要好于測試樣本,說明在我們的預測過程中仍然存在許多的未知因素,需要進行進一步的研究。
――――――――
參考文獻:
[1]Lapedes A, Farber R. A self - optimizing, nonsymmetrical neural net for content addressable memory and pattern recognition[J].Physica 22D, 1986. 247~ 259.
[2]Werbos P. Beyond regression: new tools for prediction and analysis in the behavioral sciences[J]. Ph D Dissertation, Harvard University, 1974.
[3]Weigend A S. Paradigm change in prediction. In: Tong H ed.Chaos and Forecasting[J]. Singapore: World Scientific, 1995:145~ 160.
[4]Baba N., Asakawa H., Sato K., Application of techniques of computational intelligence for constructing reliable decision support systems[J]. IJCNN International Joint Conference on Neural Networks, 1999, 6:3856~3859.
[5]Baba N. , Asakawa H. , Inoue N. , Application of soft computing techniques for dealing Tokyo stock exchange prices indexes (TOPIX) [J]. Third International Conference on Knowledge- Based Intelligent Information Engineering Systems, 1999: 542~ 545.
[6]Baba N., Handa H. , Utilization of neural network for constructing a user friendly decision support system to deal stocks[J]. Proceedings IEEE International Conference on Neural Networks, 1995,2: 818~823.
[7]Jung- Hua Wang, Shiuan - Ming Chen, Jia - Yann Leu, Stock trading decision support system using a rule selector based on sliding window[J]. IEEE International Conference on Systems, Man,and Cybernetics, Computational Cybernetics and Simulation, 1997,1: 559~ 564.
[8]Yang Yiwen, Liu Guizhong, Zhang Zongping, Stock market trend prediction based on neural networks, multiresolution analysis and dynamical reconstruction[J]. Proceedings of the IEEE/IAFE/ INFORMS Conference on Computational Intelligence for Financial Engineering (CIFEr), 2000:155~ 156.
[9]謝冰,等,基于遺傳神經網絡的工業股票指數預測,湖南大學學報社會科學版,2004,6:65~70.
責任編校:封明
――――――――
關鍵詞: 金融風險;預警;模糊聚類;神經網絡
一、引言
2014年中央經濟工作會議明確提出要“高度重視財政金融領域存在的風險隱患,堅決守住不發生系統性和區域性金融風險的底線”。2008年國際金融危機爆發以來,世界各國應對金融危機的經驗表明,構建金融體系風險預警機制是必要且可行的。相對于整體金融風險而言,區域性金融風險具有更強的外部傳導性和可控性,且一般早于整體金融風險爆發,在某種程度上可被視為整體金融風險的預警信號,因此,作為金融監管的有效補充,研究區域性金融風險早期預警體系并進行預警分析將對金融風險管控具有重要意義。
國外學者對于早期風險預警體系的研究較為系統和成熟,且已有一些金融監管部門建立了早期預警模型,如美聯儲的SEER評級模型、美國聯邦存款保險公司的SCOR模型、法國銀行業委員會的預期損失模型、國際貨幣基金組織的宏觀審慎評估模型等。受國際金融危機的影響,近年來國內學者在早期金融風險預警和管理方面的研究也越來越多,但由于預警指標選擇、風險狀態劃分及臨界值選擇等均不盡相同,因此建立的預警模型也有所差異。本文通過借鑒國內外對金融風險預警指標體系的既有研究成果,綜合運用模糊聚類分析、BP神經網絡建模等計量分析方法,構建區域金融風險預警體系,以期對區域性金融風險的評估和防范提供客觀性依據。
二、總體分析框架及模型構建
本文構建的區域金融風險早期預警體系由三部分組成:首先結合安徽區域特點,構建包括經濟因素、財政因素、金融因素、房地產發展、企業經營狀況等的區域性金融風險指標體系;其次利用模糊聚類分析對研究樣本進行分類,確定BP神經網絡預警模型的分割點,為區域性金融風險水平的劃分提供一種新思路;最后采用人工神經網絡來預測未來金融危機發生的可能性。
(一)區域性金融風險指標體系
區域性金融風險指標選擇既要考慮金融風險因素的普遍性,更要體現區域經濟金融發展特點。指標選取原則:一是全面性,所選指標盡可能全面反映區域金融風險;二是可得性,所選數據要容易獲得,且期間口徑未作調整;三是匹配性,數據收集成本與模型預測的經濟實用性相匹配。
(二)風險評估的模糊聚類分析
在分析一個時間序列的區域金融風險時,我們可以把指標相似程度高的樣本聚集在一起,作為一個整體進行分析,以達到簡化的效果。傳統的聚類分析是一種“硬劃分”,即把每個待識別的對象嚴格劃分到某類中,具有“非此即彼”的性質,這種分類的類別界限也是分明的。然而,在大多數情況下,風險類別可能并沒有嚴格的界定,其類屬性方面存在中介性,適合進行“軟劃分”。模糊集理論為這種劃分提供了強有力且有效的分析工具,采用相應的模糊聚類模型,可以取得較好的分類效果。“模糊聚類”概念最早由Ruspini提出,之后人們利用這一概念提出了多種模糊聚類算法。本文運用神經網絡來進行模糊聚類,其優勢在于神經網絡的并行處理結構。
(三)基于人工神經網絡的早期預警體系
人工神經網絡ANN)是一種在生物神經網絡啟示下建立的數據處理模型,其具有強大的模式識別和數據擬合能力,最為可貴的是神經網絡還有自學習和自適應性。自適應性是指一個系統能夠改變自身的性能以適應環境變化的能力,當環境發生變化時,相當于給神經網絡輸入新的訓練樣本,網絡能夠自動調整結構參數,改變映射關系,從而對特定的輸入產生相應的期望輸出。人工神經網絡包括很多種,不同類型的神經網絡適用于解決不同的問題,其中最為常用的一種就是BP神經網絡,它是一種多層前向神經網絡,其權值調整采用反向傳播學習算法。而自組織競爭神經網絡則使用了與前向神經網絡完全不同的思路,采取競爭學習的思想,網絡的輸出神經元之間相互競爭,同一時刻只有一個輸出神經元獲勝,因此自組織神經網絡主要用于解決分類、聚類問題。鑒于此,本文在進行區域金融風險評估時,運用自組織競爭神經網絡進行模糊聚類分析,得出各樣本的風險類別;而在構建區域風險早期預警體系時,采用BP神經網絡進行分析和預測。
三、區域性金融風險早期預警的實證分析
(一)區域性金融風險監測指標的選取與標準化
金融風險是一個綜合性、系統性的概念,單純選用個別指標不足以反映其真實水平。因此,根據客觀性、完備性、科學性、實用性、重要性原則,同時借鑒國內外研究成果,本文選取了經濟、財政、金融、房地產、企業經營等方面的17個金融風險評價指標,樣本區間為2009年至2014年一季度的安徽省季度數據,并根據指標與金融風險的正負相關性對其進行標準化。
論文摘要:隨著計算機技術的飛速發展,智能計算方法的應用領域也越來越廣泛。本文介紹了當前存在的一些智能計算方法,闡述了其工作原理和特點,同時對智能計算方法的發展進行了展望。
The Analysis for Several Classic Algorism of Intellegence Computation
YANG Ming-hui
(Wuhan University of Technology, Wuhan 430074, China)
Abstract: As the computer technology develops fast, the field for intelligence algorism become wider and wider.In this paper, I introduce some methods for intelligence, and analyze their Principles and characters, finally make a Forecast of the develop of integellence computation.
Key words:Intelligence Computation; Artificial Neural Network Algorithm;Genetic algorithm;Annealing Algorithm
1 引言
智能算法也稱作為“背影算法”,是人們從現實的生活中的各種現象總結出來的算法。它是從自然界得到啟發,模仿它的原理而得到的算法,這樣我們可以利用仿生原理進行設計我們的解決問題的路徑,這就是智能計算的思想。這方面的內容很多,如人工神經網絡技術、遺傳算法、模擬退火算法等,下面分別對其進行分析。
2 人工神經網絡算法
2.1 人工神經網絡(ARTIFICIAL NEURAL NETWORK,簡稱ANN)
人工神經網絡是在對人腦組織結構和運行機制的認識理解基礎之上模擬其結構和智能行為的一種工程系統。早在本世紀40年代初期,心理學家McCulloch、數學家Pitts就提出了人工神經網絡的第一個數學模型,從此開創了神經科學理論的研究時代。其后,F Rosenblatt、Widrow和J. J .Hopfield等學者又先后提出了感知模型,使得人工神經網絡技術得以蓬勃發展。
2.2 人工神經網絡的特點
人工神經網絡的知識存儲容量很大。在神經網絡中,知識與信息的存儲表現為神經元之間分布式的物理聯系。它分散地表示和存儲于整個網絡內的各神經元及其連線上。每個神經元及其連線只表示一部分信息,而不是一個完整具體概念。只有通過各神經元的分布式綜合效果才能表達出特定的概念和知識。
由于人工神經網絡中神經元個數眾多以及整個網絡存儲信息容量的巨大,使得它具有很強的不確定性信息處理能力。即使輸入信息不完全、不準確或模糊不清,神經網絡仍然能夠聯想思維存在于記憶中的事物的完整圖像。只要輸入的模式接近于訓練樣本,系統就能給出正確的推理結論。
正是因為人工神經網絡的結構特點和其信息存儲的分布式特點,使得它相對于其它的判斷識別系統,如:專家系統等,具有另一個顯著的優點:健壯性。生物神經網絡不會因為個別神經元的損失而失去對原有模式的記憶。最有力的證明是,當一個人的大腦因意外事故受輕微損傷之后,并不會失去原有事物的全部記憶。人工神經網絡也有類似的情況。因某些原因,無論是網絡的硬件實現還是軟件實現中的某個或某些神經元失效,整個網絡仍然能繼續工作。
人工神經網絡是一種非線性的處理單元。只有當神經元對所有的輸入信號的綜合處理結果超過某一門限值后才輸出一個信號。因此神經網絡是一種具有高度非線性的超大規模連續時間動力學系統。它突破了傳統的以線性處理為基礎的數字電子計算機的局限,標志著人們智能信息處理能力的一大飛躍。
3 遺傳算法
3.1 特點
遺傳算法是解決搜索問題的一種通用算法,對于各種通用問題都可以使用。搜索算法的共同特征為:(1)首先組成一組候選解;(2)依據某些適應性條件測算這些候選解的適應度;(3)根據適應度保留某些候選解,放棄其他候選解;(4)對保留的候選解進行某些操作,生成新的候選解。在遺傳算法中,上述幾個特征以一種特殊的方式組合在一起:基于染色體群的并行搜索,帶有猜測性質的選擇操作、交換操作和突變操作。這種特殊的組合方式將遺傳算法與其它搜索算法區別開來。
遺傳算法還具有以下幾方面的特點:
(1)遺傳算法從問題解的串集開始嫂索,而不是從單個解開始。這是遺傳算法與傳統優化算法的極大區別。傳統優化算法是從單個初始值迭代求最優解的;容易誤入局部最優解。遺傳算法從串集開始搜索,覆蓋面大,利于全局擇優。
(2)許多傳統搜索算法都是單點搜索算法,容易陷入局部的最優解。遺傳算法同時處理群體中的多個個體,即對搜索空間中的多個進行評估,減少了陷入局部最優解的風險,同時算法本身易于實現并行化。
(3)遺傳算法基本上不用搜索空間的知識或其它輔助信息,而僅用適應度函數值來評估個體,在此基礎上進行遺傳操作。適應度函數不僅不受連續可微的約束,而且其定義域可以任意設定。這一特點使得遺傳算法的應用范圍大大擴展。
3.2 運用領域
前面描述是簡單的遺傳算法模型,可以在這一基本型上加以改進,使其在科學和工程領域得到廣泛應用。下面列舉了一些遺傳算法的應用領域:(1)優化:遺傳算法可用于各種優化問題。既包括數量優化問題,也包括組合優化問題;(2)程序設計:遺傳算法可以用于某些特殊任務的計算機程序設計;(3)機器學習:遺傳算法可用于許多機器學習的應用,包括分類問題和預測問題等。
4 退火算法
模擬退火算法來源于固體退火原理,將固體加溫至充分高,再讓其徐徐冷卻,加溫時,固體內部粒子隨溫升變為無序狀,內能增大,而徐徐冷卻時粒子漸趨有序,在每個溫度都達到平衡態,最后在常溫時達到基態,內能減為最小。根據Metropolis準則,粒子在溫度T時趨于平衡的概率為e-ΔE/(kT),其中ΔE為溫度T時的內能,ΔE為其改變量,k為Boltzmann常數。用固體退火模擬組合優化問題,將內能E模擬為目標函數值f ,溫度T演化成控制參數t,即得到解組合優化問題的模擬退火算法:由初始解i和控制參數初值t開始,對當前解重復“產生新解計算目標函數差接受或舍棄”的迭代,并逐步衰減t值,算法終止時的當前解即為所得近似最優解,這是基于蒙特卡羅迭代求解法的一種啟發式隨機搜索過程。退火過程由冷卻進度表(Cooling Schedule)控制,包括控制參數的初值t及其衰減因子Δt,每個t值時的迭代次數L和停止條件S。
5 展望
目前的智能計算研究水平暫時還很難使“智能機器”真正具備人類的常識,但智能計算將在21世紀蓬勃發展。不僅僅只是功能模仿要持有信息機理一致的觀點。即人工腦與生物腦將不只是功能模仿,而是具有相同的特性。這兩者的結合將開辟一個全新的領域,開辟很多新的研究方向。智能計算將探索智能的新概念,新理論,新方法和新技術,而這一切將在以后的發展中取得重大成就。
關鍵詞:木質材料;神經網絡;元細胞自動機
中圖分類號:TP391;TU366 文獻標識碼:A
引言
為了對建筑進行保護,需要對建筑構件受到自然環境因素的破壞進行預測。由于影響物體變化的各種因素常常具有不規則性和不可預見性,傳統的數學方法很難描述建筑構件隨時間變化的過程。隨著人工神經網絡理論和技術的發展,該理論得到了廣泛的應用。我們采用元細胞自動機(Cellular Automata―CA),并結合BP算法,對古建筑構件受到自然環境因素的破壞進行預測。應用X光掃描獲取建筑構件的2D數據,通過CA計算出每個神經元的灰度值變化,改變建筑構件位圖所對應的單個像素點的灰度值,以預測建筑構件的受損程度。
1 CA模型
在一般CA模型中,單元的狀態只有0或1兩種,是一個離散值,它不能夠反映出物體狀態的一個連續的,持續的變化過程。在約束性CA模型中,利用“灰度”的概念 來表示和反映單元網格{x,y}狀態的連續變化過程。但灰度值 從0漸變到1的時候,表示該單元格正從開始的完好狀態轉化到被完全破壞的狀態。
基礎約束性CA模型的表示公式:
其中, 是發展狀態, 是狀態,N是臨近范圍, 是總的約束性條件, 是單元所在的具置。
總約束性系數的公式為:
2 建筑構件分析
2.1 構件的物理性質演變分析
為了方便對建筑構件隨時間的推移受到自然因素的侵蝕程度進行預測分析,本文采用了將建筑構件的模型進行數值化處理的方法。數值化的構件模型是2D灰度圖形,使獲取的古建筑模型的灰度圖中的每個像素點與神經網絡的CA模型每個元細胞相對應。利用像素點作為元細胞,可以方便的將CA模型和圖像處理系統結合起來。
獲取了建筑構件的數值化信息后,利用神經網絡的CA模型計算出每個單元格的灰度值。將溫度、濕度等自然因素的歷史數據的預測值與神經網絡的CA模型相結合進行預測,通過單個神經元灰度的變化,直觀的顯示出建筑構件大概的變化趨勢。
構件的物理性能演變分析系統結構如下圖所示:
2.2 單個元細胞的灰度值
建筑構件的模型進行數值化處理后,將每個像素點視為一個元細胞,用圖像的灰度(gray-scale)來表示神經網絡的CA模型中單個元細胞的灰度值。
從圖像輸入后,每個像素點都會于某一個灰度值相對應。將元素點的灰度值設定為 ,進行灰度變化后的灰度值為 ,則灰度值的變化可表示為 或者 。
其中,設定 和 都在圖像的灰度值規定范圍內。
函數 為灰度變換函數,它描述了輸入灰度值與輸出灰度值之間的轉換關系。
神經網絡的CA模型算出每個元細胞的灰度值變化,再通過元細胞的灰度值變化來改變與元細胞相對應的像素點的灰度值。
2.3 CA模型的神經網絡結構
研究采用的是BP神經網絡。根據預測需要,在輸入層設定11個神經元,每個輸入神經元分別于11個決定古建筑變化灰度值的因素一一對應。隱藏層的神經元個數的選取影響結果的精確度、訓練時間和容錯能力。一般來說,隱藏層的神經元越多,結果越精確,但是隱藏層的神經元過多會大大的加大訓練時間,同時隱藏層的神經元的增加會造成網絡的容錯能力下降。研究表明,對于n層的神經網絡,其隱藏層的神經元的數目至少為2n/3,其中n為輸入層神經元的數目。經過上述分析,神經網絡隱藏層的神經元的數目 ,為了使預測達到最佳效果,隱藏層的神經元設定為8個。在輸出層中,用一個神經元來輸出灰度值的數值,通過輸出的結果,改變每個元細胞對應像素點的灰度值。所建立的CA神經網絡如下:
神經網絡的隱藏層采用Sigmoid傳遞函數,這使得學習過程中訓練速度和靈敏度不高而且容易進入飽和狀態。為了提高訓練速度和靈敏性以及有效避開Sigmoid函數的飽和區,一般要求輸入數據的值在0~1之間。本文為了減少平臺現象出現的可能性,加快學習速度,對輸入樣本進行歸一化處理,處理方法如下:
2.4 算法推導
木材在自然環境中受到多種自然因素的影響,在不同的因素的影響下,木質構件將會產生不同的變化,如下圖所示:
影響古建筑木質變化的自然因素:溫度影響,濕度影響,微生物影響。將上述三個影響古建筑變化的主要因素作為輸入層的三個輸入數據。然而,古建筑模型某個元細胞處的發展變化并不是偶然的,每個元細胞由一個狀態轉變為另一個狀態是一個連續的過程。每個元細胞的灰度值都要受到與它相鄰元細胞的灰度值的影響。因此,需要將其周圍相鄰的8個元細胞在 時刻的8個灰度值作為輸入層的輸入數據。輸入為:
至此,便可以通過元細胞灰度值的變化來改變古建筑模型每個像素點的顯示灰度的變化。
為了使CA模型模擬的結果更加接近于實際情況,引入隨機變量RA,其表達式為:
其中的 表示落在范圍 之間的隨機數, 為控制隨機變量大小的參數。
引入隨機變量后,求灰度值的公式變為:
3 應用實例
下面是采用神經網絡CA模型對木質結構的古建筑構件的某個區域二十年內物理性能演變的預測分析:
圖3.a是古建筑木質構件的某個區域的灰度圖原圖,圖3.b是利用神經網絡CA模型對原圖進行預測五年后的圖片。從圖片中,我們可以看出圖3.a中淺淺的裂痕在圖3.b進一步的擴大,而原來裂痕處的灰度值有淡灰色轉化成了深灰色,同時在圖3.b的畫圈處產生了新的裂痕。圖3.c是對原圖進行預測十年后的結果,與圖3.b對比可以看出裂痕進一步擴大,原來裂痕處的灰度等級提高,在畫圈處的裂痕結合到了一起。圖3.d和圖3.e分別是對原圖進行預測十五后和二十年后的結果,兩圖對比可以看出,裂痕在擴大的同時延伸出了新的細小的裂痕,裂痕有向網狀發展的趨勢。我們可以清晰的從兩圖的畫圈處可以看到,經過五年的變化,畫圈處的裂痕結合到了一起。
從上述結果可以看出,將采集的古建筑木質構件的灰度圖,利用神經網絡的CA模型對木質構件進行預測,運用CA模型中“灰度”的概念通過神經網絡的訓練學習預測出每個元細胞的灰度值的變化,從而計算出古建筑木質構件隨時間推移而受損的情況。因此,神經網絡的CA模型對建筑木質構件的受損程度隨時間推移的預測分析有明顯的效果。
4 結 語
研究中,我們使數值化處理后的古建筑模型的每個像素點與神經網絡的CA模型中的每個元細胞一一對應,運用CA模型中“灰度”的概念通過神經網絡的訓練學習預測出每個元細胞的灰度值的變化,進而得出古建筑模型的每個像素點的灰度變化,以達到預測古建筑因自然環境因素侵蝕的效果。研究表明,該方法對古建筑因自然環境中的各種因素的影響而受到侵蝕程度的預測還是有效的。雖然研究的結果還略顯粗糙,但是它為今后的研究奠定了基礎。至于結果是否與實際情況相符合,還有待研究。
參考文獻:
[1] 袁曾任.人工神經元網絡及其應用[M].北京:清華大學出版社,1999.
[2] Wolfram S. Theory and Applications of Cellular Automata [M]. World Scientific, Singapore, 1986.
[3] 閻平凡,張長水.人工神經網絡與模擬進化計算[M].北京:清華大學出版社,2005.
[4] 樓順天.基于Matlab的系統分析與設計[M].北京:科學出版社,2006.
Abstract: Financial management decision support system (hereinafter referred to as the DSS) is to assist decision-makers at various levels realize financial management. It achieves scientific management through mainly the man-machine interactive way and the use of a lot of financial data and numerous model. Neural network is a complicated nonlinear network system, and it mainly consists of many processing units which are similar to neuron. The combination of financial management and neural network and decision support system can realize the automation of adaptive, associating and reasoning, and data mining, and make the financial management, decision-making, and execution more scientific, standardized, and intelligent.
關鍵詞: 財務管理;神經網絡;決策支持系統;專家系統
Key words: financial management;nerve network;decision support system (DSS);expert system
中圖分類號:F275 文獻標識碼:A 文章編號:1006-4311(2012)03-0126-02
0 引言
DSS是80年代迅速發展起來的新型計算機科學。它是一個有著廣泛應用背景的十分熱門的交叉科學。神經網絡是一個具有高度非線性的超大規模連續時間的動力系統。結合神經網絡的智能決策支持系統是目前研究的前沿之一,它極具理論和使用價值。
財務管理的信息化、數字化是財務規范和科學管理的趨勢。與DSS的結合將更加有利于數據標準的統一,有利于數據采集的模塊化,有利于決策支持的科學化,有利于財務公開的透明化。
1 財務管理決策支持系統的研究現狀
決策支持系統經過二十多年的發展,形成了如圖1所示公認的體系結構。它把模型并入信息系統軟件中,依靠管理信息系統和運籌學這兩個基礎逐步發展起來。它為解決非結構化決策問題提供了相應的有用信息,給各級管理決策人員的工作帶來了便利。
從圖1可以看出決策支持系統體系結構可劃分為三級,即語言系統(LS)級、問題處理系統(PPS)級和知識系統(KS)級。其中問題處理系統級包括推理機系統(RS)、模型庫管理系統(MBMS)、知識庫管理系統(KBMS)及數據庫管理系統(DBMS)。知識系統級包括模型庫(MB)、知識庫(KB)及數據庫(DB)。
九十年代中期,興起了三個輔助決策技術:數據倉庫(DW)、聯機分析處理(OLAP)和數據挖掘(DM)。聯機分析處理是以客戶/服務器的方式完成多維數據分析。數據倉庫是根據決策主題的需要匯集大量的數據庫,通過綜合和分析得到輔助決策的信息。數據挖掘顧名思義,是為了獲得有用的數據,在大量的數據庫中進行篩選。人工智能技術建立一個智能的DSS人機界面,可進行圖、文、聲、像、形等多模式交互,人機交互此時變得更為自然和諧,人們能沉浸其中,進行合作式、目標向導式的交互方法。
從目前情況來看,財務決策支持系統的研究還處于初級發展階段,財務數據的保密性、特殊性決定了財務決策不能全部公開化、透明化,但隨著中央及國務院相關部門財務預決算數據的公開,財務決策系統及其支持系統和過程也將隨之公開,這就要求決策者充分利用財務知識和決策支持系統的知識“聰明”決策、合理決策、科學決策、規范決策。
2 財務管理神經網絡智能決策支持系統總體研究框架
2.1 神經網絡運行機制 神經網絡的著眼點是采納生物體中神經細胞網絡中某些可利用的部分,來彌補計算機的不足之處,而不是單單用物理的器件去完整地復制。
第一,神經網絡中的鏈接的結構和鏈接權都可以通過學習而得到,具有十分強大的學習功能;第二,神經網絡所記憶的信息是一種分布式的儲存方式,大多儲存在神經元之間的權中;第三,神經網絡部分的或局部的神經元被破壞后,仍可以繼續進行其他活動,不影響全局的活動,因此說,神經網絡的這種特性被稱作容錯性;第四,神經網絡是由大量簡單的神經元組成的,每個神經元雖然結構簡單,但是它們組合到一起并行活動時,卻能爆發出較快較強的速度來。
我們可以利用神經網絡的上述特點,將之應用于模式識別、自動控制、優化計算和聯想記憶、軍事應用以及決策支持系統中。
2.2 財務管理神經網絡集成智能財務DSS的必然性 在企業經營管理、政府機構財務活動中,人們時常面臨著財務決策。人們往往需要根據有關的理論及經驗制定出一系列的衡量標準。這種評價是一個非常復雜的非結構化決策過程,一般都是由內行專家根據一定的專業理論憑經驗和直覺在收集大量不完全、不確定信息基礎上建立起多級指標體系。但在這種指標體系中,各種指標之間的關系很難明確,而且還受評價者的效用標準和主觀偏好所左右。因此,很難在指標體系和評價目標間建立起準確的定量或定性模型。因此,我們需要采用一種可處理不確定性、不完全性信息的評價方法以支持決策。自然,利用人工神經網絡構造系統模式來支持這類評價決策問題是目前財務管理智能決策支持系統的一種發展趨勢和必然趨勢[4]。
2.3 財務管理神經網絡集成智能DSS系統框架 神經網絡智能決策支持系統主要以知識、數據和模型為主體,結合神經網絡進行推理與數據開采。圖2給出了神經網絡智能決策支持系統研究框架[2]。研究中有兩個重點,即神經網絡推理系統和神經網絡數據開采系統。
2.3.1 神經網絡數據開采系統 神經網絡數據開采時利用神經網絡技術協助從數據中抽取模式。數據開采有五項基本任務:相關分析、聚類、概念描述、偏差監測、預測。
常用的前饋式神經網絡,如BP網絡,可用于進行概念描述及預測。對向傳播(Counter Propagation,簡稱CP)神經網路可用來進行統計分析和聚類。
CP網絡是美國神經計算專家Robert Hecht-Nielsen提出的一種新型特征映射網絡,其網絡結構分輸入、競爭、輸出三層。該網絡吸取了無教師示教型網絡分類錄活、算法簡練的優點,又采納了有教師示教型網絡分類精細、準確的好處,使兩者有機地結合起來。由競爭層至輸出層,網絡按基本競爭型網絡學習規則得到各輸出神經元的實際輸出值,并按有教師示教的誤差校正方法調整由競爭層至輸出層的鏈接權。經過這樣反復地學習,可以將任意輸入模式映射為輸出模式。
2.3.2 財務管理神經網絡推理系統 財務管理神經網絡推理系統主要利用神經網絡的并行處理機制來解決傳統推理方法中存在的“組合爆炸”、“無窮遞歸”,等問題。在神經網絡系統中,計算與存儲時完全合二為一的,即信息的存儲體現在神經元互連的分布上,并以大規模并行方式處理。流動的過程就是從部分信息找到全部信息的過程,這就是聯想記憶的基本原理。若視動力系統的穩定吸引子為系統計算能量函數的極小點,系統最終會流向期望的最小點,計算也就在運動過程中悄悄地完成了。因而,可用雙向聯想記憶(BAM)網絡或CP網絡實現并行推理。CP網絡具有特殊的聯想推理映射功能。將輸入學習模式和期望輸出模式取為同一模式,且將之分為X和Y兩部分。網絡通過提供的樣本對進行充分的學習后,就可用來進行模式間的聯想推理。
3 財務管理神經網絡智能DSS研究展望
當前世界上最熱門的研究課題,是模仿人類的思維方式來解決實際問題。專家系統和人工神經網絡是比較常用的技術,但由于自身的局限性,它們都側重于人類思維方式的某一方面。平時解決簡單的問題的時候還好,但真遇到解決復雜的問題的時候,它就顯得力不從心了,所以,這個時候我們可以將兩種技術結合起來解決,除了它們要自身不斷發展和完善外,還要注重兩者的協調配合,神經網絡DSS未來的發展趨勢就是依靠這兩種技術不斷結合,從而能幫助我們解決更多的實際問題。
3.1 財務管理神經網絡支持專家系統 常見的財務管理神經網絡支持專家系統主要包括幾個方面:知識維護、知識表示、知識獲取、推理等,我們針對各個步驟展開討論。
3.1.1 知識維護。如果知識是通過人工神經網絡來獲取的,我們就可以同樣利用人工神經網絡,來讓維護工作變得更加方便快捷,維護可以通過人工神經網絡來自動完成,我們需要做的只是重新運行網絡模塊,或者重新訓練網絡模塊,又或是增加新的網絡模塊。
3.1.2 推理。一般的專家系統只是求解專門性問題,應用的領域非常狹窄,同時由于控制策略不靈活,推理方法簡單,容易出現一些這樣或那樣的問題,推理效率低、速度慢。人工神經網絡可以解決這一問題,從根本上提升工作效率,提高工作速度,它可以拓展知識空間,不只局限在狹窄的領域。
3.1.3 知識表示。很多專家知識事實上很難用規則表示出來,但在現實工作中,我們大部分財務管理專家卻都采取這種方式,無論是直接的還是間接的。其它的知識表示方法也存在著同樣的問題。為了解決這一問題,我們可以采用人工神經網絡系統來將知識提供給專家系統,這樣做就可以避免這一問題,當專家系統需要相應知識時,就不需要用規則來表示知識,直接調用人工神經網絡就可以了。
3.1.4 知識獲取。人工神經網絡可以幫專家系統來獲取知識,知識獲取是通過人機對話的形式進行的。首先,專家系統向專家提出問題,人工神經網路則負責對這些信息進行收集、處理,在人工神經網絡的聯結權值中已經具有通用的知識,所以這一步驟會很方便,之后再產生相應的數據結果。接著,專家系統在對這些數據進行進一步的分析。在這一過程中,專家系統只運用很少的規則就可以獲得相關的知識,大大提高了工作效率。
3.2 財務管理專家系統支持神經網絡 財務管理專家主要通過三種方式來對神經網絡提供必要的支持:第一,提供相應的必要的解釋;第二,進行預處理;第三,聯合應用。
3.2.1 解釋。作為專家系統的人工神經網絡,它做不到同其他專家系統那樣,具體詳細地跟蹤問題求解的過程,以獲得答案的原因,它只能依靠增加一個小型的專家來解決這一問題,以獲得答案的原因,這個專家系統可以反向推理,從結果到初始輸入,系統提供具體的解決方法。
在這種模式中,經過訓練的人工神經網絡來解決問題。當用戶要求解釋的時候,就可以通過網絡輸入一個并行的專家系統。
3.2.2 預處理。對于人工神經網絡來說,處理數據這項工作比較難。專家系統可以幫助人工神經做好這些工作:選擇合適的收斂算法,確定訓練神經網絡的樣本的數量,選擇合適的神經網絡。收集正確數據的工作,對于人工神經網絡來說至關重要,事先對它們進行預處理,可以確保各項工作順利的完成。
3.2.3 聯合應用。將一個復問題分解為幾個子問題,如下圖3所示,再將各個子問題來逐個解決,這就是我們所常說說的聯合應用方法。它可以直接采用人工神經網絡、專家系統以及其種可能的方法來解決問題,指導實際應用。
我們當前計算機所要解決的主要問題,是如何解決半結構化和非結構化的決策等問題,它是人們在日常生活中所經常遇到的,在財務活動中會大量存在。如何更科學、更合理地處理這些問題是我們當前工作的主要方向。運用人工神經網絡技術處理半結構化和非結構化的決策是一種智能化的求解方式。但是此種方式并不是完美無缺的,它還存在著一定程度上的缺點,我們只有改善這種技術上的不成熟,將智能化研究進行到底,才能讓神經網絡決策支持系統的研究出現新的進展。
參考文獻:
[1]陳文偉.智能決策技術.電子工業出版社,1998年.
[2]鐘義信.智能理論與技術——人工智能與神經網絡.人民郵電出版社,1992年.
關鍵詞:灰色神經網絡;商品銷售;算法;銷售預測
中圖分類號:F71文獻標識碼:A文章編號:1009-3044(2009)27-7743-02
市場銷售是根據根據市場過去和現在的信息,運用一定的數學方法,對產品的需求進行評估推測,市場預測可以減少企業風險,為企業決策提供依據。做為市場預測組成部分的需求預測,是直接影響企業生產企業,投資取向,庫存保有量的重要依據,精確的需求預測可以減少庫存,降低訂單流失率,更有效的配置資源。對于商品銷售預測來說,有很多種方法,本文采用灰色神經網絡來預測商品銷量。
1 灰色系統和神經網絡概述
1.1 灰色系統
灰色系統理論是一種研究少數據、貧信息、不確定性問題的新方法,它以“部分信息已知,部分信息未知”的“小樣本”,“貧信息”不確定系統為研究對象,通過對“部分”已知信息的生成、開發、提取有價值的信息,實現對系統運行行為、演化規律的正確描述和有效監控。它是我國學者鄧聚龍教授在1982年首先提出的,經過20年的發展,灰色系統已基本建立起一門新興學科的結構體系,其主要內容包括以灰色朦朧集為基礎的理論體系,以灰色關聯空間為依托的分析體系,以灰色序列生成為基礎的方法體系,以灰色模型為核心的模型體系和以系統分析、評估、建模、預測、決策、控制、優化為主體的技術體系。
灰色系統中建立的模型稱為灰色模型(GreyModel)簡稱GM模型,是以原始數據序列為基礎做某種生成后建立的微分方程。建模中最有代表性的是針對時間序列的GM建模,它直接將時間序列數據轉化為微分方程,利用系統信息,使抽象的模型量化,量化的概念模型化,最后進行模型優化,從而使所建的GM模型在尋求不到系統的概率特性或隸屬特性的情況下顯示其優越性。
1.2 神經網絡
人工神經網絡理論(ArtificialNeuralNetworks)是智能算法理論的一種,由于其具有大規模并行處理、分布式信息存儲,容錯性,自組織性和自適應性等特點,目前已經得到了國內外學者的廣泛關注。目前,人工神經網絡已成功應用在函數擬合、數據預測、模式識別、優化控制等很多工程領域,并在一些傳統方法難以解決的問題上取得了滿意的結果。
人工神經是由一些稱為神經元的基本部件按一定規則組合形成的,它由神經元,神經元間連接方式和訓練規則三個因素組成。其中最主要的部分是神經元,它由由輸入,非線性變換和輸出三部分構成,是一個基本計算單元,計算過程為,輸入經過權值連接到內部后求和,和值首先與一個閥值做比較,然后經過非線性變化,得到輸出。神經元的非線性變換有多種形式,比較常用的有Sigmoid函數,限幅函數等。神經元間不同的連接方式構成了不同類型的神經網絡,比如信號由一層單向傳播到另一層的前饋型神經網絡,信號在層與層之間傳播的反饋型神經網絡等。目前,比較典型的神經網絡包括BP網絡,RBF網絡、小波網絡等。
2 基于灰色神經網絡的銷量建模
2.1 網絡建模
對于銷量預測的問題來說,灰色模型GNNM(1,N)的微分表達式為:
其中, y1是商品的銷售量,y2-yn是影響銷售量的因子。
求解微分方程(1)可得如下的離散響應方程:
令 ,則式2變為:
y1的閥值設為: 。
BP網絡LB層神經元的激活函數取為Sigmoid函數:
將式(3)變型后映射到BP網絡中,得到如下的映射銷量問題的灰色神經網絡模型,如圖1所示。
2.2 學習算法
該模型中各個參數根據網絡輸出和實際輸出的誤差進行調整,從而是網絡輸出不斷逼近實際輸出,學習算法如下:
Step 1.根據系統數據列特征,選取兩個較小的值做為 a,b1,b2,…,bn-1
Step 2.根據網絡權值定義計算ω11,ω21,ω22, …,ω2n,ω31,ω32,…,ω3n
Step 3.對每一個輸入序列(t,y(t)),(t=1,2,3,…,N)進行如下操作:
t輸入LA層節點,對LB、LC、LD層的節點進行如下計算:
計算每層輸出
計算網絡輸出與期望輸出的誤差
調整隔層權值:
調整LB到LC的連接權值:
調整LA到LB的連接權值:
調整閥值:
Step 4重復步驟3,直至滿足結束條件為止。
2.3 總體設計
采用灰色神經網絡進行銷量預測,總的步驟分為灰色神經網絡構建,灰色神經網絡訓練和灰色神經網絡預測三步,其中灰色神經網絡構建是根據輸入輸出變量構建灰色神經網絡,灰色神經網絡訓練是對網絡進行訓練,灰色神經網絡預測是對訓練好的網絡對數據進行預測,其灰色神經網絡預測系統總體框圖如圖2所示。
3 基于灰色神經網絡的銷量預測
采用灰色神經來對某型冰箱的銷售的做預測,分析得出影響該型冰箱的市場需求的因素為以下幾個指標,1)競爭對手;2)市場特征;3)成本;4)廣告力度;5)品牌認可;6)售后服務;7)價格性價比。輸出數據為銷售量,用模糊神經網絡進行訓練預測,設置輸入節點數為8,輸出節點數為1,即為預測銷售量,網絡共迭代100次,得到的預測值和實際值的結果如圖3所示。
從圖3中可以看到,灰色神經網絡預測的銷量值和實際值非常接近,說明了灰色神經網絡預測的有效性。
[關鍵詞]模糊粒化;小波神經網絡;股指區間預測
[DOI]101.3939/jcnkizgsc20162.71.1.3
1引言
隨著股票市場的逐漸完善和發展,投資金融理財產品成為越來越多的家庭和個人的選擇,股票就是其中重要的一種理財產品。近年來,人工神經網絡是人工智能領域興起的研究熱點,并且憑借其優秀的非線性逼近和泛化能力在金融市場得到了廣泛的應用。王文波等人進行了基于EMD 與神經網絡的中國股票市場預測[1],任崇嶺等人進行了基于小波神經網絡的短時客流量預測研究[2],以上研究表明神經網絡在股票市場上有較好的實際預測效果并獲得了廣泛的應用。潘曉明等人通過采用遺傳算法的神經網絡集成建立了一種股票市場預測模型。[3]劉沛漢等基于遺傳算法優化進行了神經網絡的光伏電站短期功率預測[4]等,上述研究結果表明遺傳算法在優化神經網絡進行預測,降低誤差方面有顯著作用。
傳統神經網絡預測多得到股指點的預測,但是股票市場隨機性較大,投資者往往更希望得到股指在未來一段時間的波動區間作為投資參考。因此,文章通過將股指開盤數據模糊粒化,然后在小波神經網絡基礎上建立一種新型的股指區間預測模型,并使用遺傳算法優化模型參數,獲得更高的精度,預測未來一段時間內股指波動范圍,為股市投資者提供投資參考。
2模型的建立
2.1信息粒化
1979年,LAzadeh教授提出了“信息粒化”(Information Granulation)的概念。信息粒化就是通過一定的劃分準則,將原始數據中難以辨別,或者具有特定功能相似的數據聚集成多個集合,構成一個個信息粒,這種信息處理的方式稱之為信息粒化。一般形式如下:
2.2基于遺傳算法和BP學習的小波神經網絡預測
2.2.1遺傳算法的使用
遺傳算法(Genetic Algorithm)是一種模擬生物進化機制的算法,具有較好的收斂性、極高魯棒性和廣泛適用性,可有效提高模型預測精度。因此,文章采用全局搜索能力較好的遺傳算法優化網絡參數,步驟如下。
2.2.2小波神經網絡的建立
小波神經網絡是在BP神經網絡基礎上,以小波基函數作為隱含層節點傳遞函數,信號前向傳播的同時誤差反向傳播的神經網絡。文章選取Morlet母小波基函數作為隱含層小波基函數:
采用梯度修正算法高模型的預測精度、使預測輸出更接近期望輸出,修正過程如下:
3實證分析
文章選擇我國股票市場中的上證指數作為研究數據。文章選取201.4 年1.2月2.2 日至2016 年3 月16 日的300 個交易日的上證指數開盤數據進行預測,數據源于新浪財經。將300個開盤數據每4 天劃分成一個數據粒,劃分成75個數據塊,隸屬函數的參數即對應模糊上界,模糊中值和模糊下界。文章使用模糊下界和模糊上界作為股票指數所在的區間。
以股指分塊數據的上界為例,選取前72個數據作為神經網絡的訓練集,后3個數據作為測試集。文章選取前6個數據作為小波神經網絡的輸入。隱含層節點的數目可根據經驗公式[KF(]m+n[KF)]+α 計算,其中α 是取值0~10之間的常數,經過多次嘗試隱含層節點為1.3時效果最好,輸出層節點個數為1,文章的小波神經網絡結構為6-1.3-1。
用遺傳算法計算小波神經網絡測初始狀態,這里文章基于Matlab的Gatbx遺傳算法工具箱進行編寫。具體的參數設置為:①個體數目:50;②最大遺傳代數:20;③變異概率:005;④交叉概率:08;⑤代溝:09。
采用梯度下降法訓練小波神經網絡,梯度下降訓練具體參數如下:(1)小波神經網絡權值學習速率η1=002;(2)小波基函數伸縮、平移因子學習速率η1=001;(3)小波神經網絡最大迭代次數為600次。訓練結果和訓練誤差如下。
利用訓練好的小波神經網絡得到2016年3月1日~3月16日的模糊上界的預測值。類似地,對上證指數模糊中間值以及模糊下界進行相同的處理方式,可以得到具體的股指預測區間為[2.73.6,2.889]、 [2.705,2.877]和[2.74.3,2.960]。2016年3月1日~2016年3月16日股指區間預測結果和實際股指圖如下所示。
由上圖可以看出,2016年3月1日―2016年3月16日一共1.2個交易日的數據幾乎全部屬于小波神經網絡預測區間,并且模型預測區間波動較小,預測較為精確。模型可以較好地預測股票指數在沒有重大政策影響的情況下的波動情況。
對于模型預測誤差,本文采取均方根誤差(RMSE),平均絕對百分比誤差(MAPE),最大絕對誤差百分比(MaxAPE)這三項指標來進行衡量。按照如下計算公式計算得到預測結果誤差并得到計算結果:
4結語
文章提出了一種基于模糊粒化和遺傳算法優化的小波神經網絡股票指數區間預測模型。該模型通過對上證指數開盤數據進行模糊粒化,建立一個基于遺傳算法優化的小波神經網絡,并對未來幾日的上證指數進行預測。實際結果表明,這一預測模型可以較好地預測未來4日上證指數的波動區間,并且具有較高的預測精度,可以作為股票投資者的一種投資參考,有效地規避風險,從而獲取更大的收益。
參考文獻:
[1]王文波,等基于EMD與神經網絡的中國股票市場預測[J].系統工程理論與實踐,2010,30(6):102.7-103.3.
[2]任崇嶺,等基于小波神經網絡的短時客流量預測研究[J].科學技術與工程,201.1,1.1(2.1):5099-5.103.
[3]潘曉明,等基于遺傳算法神經網絡集成股票市場預測研究[J].廣西師范學院學報,2007,2.4(1):77-83.
[4]劉沛漢,等基于遺傳算法優化神經網絡的光伏電站短期功率預測[J].水電能源科學,2016,3.4(1):2.1.1-2.1.4.
【關鍵詞】信息安全;技術;矩陣模型;神經網絡效應
1.IT網絡安全策略的趨勢
網絡是IT 中的一個大的概念,如何能夠在其中解決上述的問題,是有很多新技術、新產品拿來借鑒的。今天要提到的應對策略,則是希望通過對新技術的分析和融合,從而輔助決策者的判斷,讓我們結合自身的運作經營模式,產生獨到的思路和理念,將其融入到我們企業網絡建設的安全防護中去,才能做到企業的網絡安全防護適應自身、有特色,才會做到發展同時而不被技術和產品的更新所牽制。
2.采用矩陣式架構建立網絡資源平臺
2.1現有的網絡管理模式分析
這里提到的網絡雙向管理,主要就是邏輯上的縱向安全分級管理,以及橫向的企業應用分區分域管理。
縱向的企業內部分級主要就是完成對物理節點的接入進行vlan 控制、端口隔離等邏輯網絡設置,在某些時候可以減小網絡風暴、Ddos 等攻擊的作用域,但僅限于對此類攻擊范圍的最小化,而對具體的攻擊包并無法進行識別和處理,這種縱向分級的措施只是把網絡風暴和各種基于網絡的病毒包控制在一定的區域內發生,并沒有從實際上將其隔離出網絡。
橫向的企業應用,也就是依賴于IP協議的網絡應用,這種管理只發生在QSI-7層模型的會話層、應用層以及表示層,數據包的加密和解密過程也都在這些邏輯層進行,而真正傳送數據包的網絡并沒有做任何限制,只是簡單的依賴于網絡的傳輸協議,協議通過就可以進行傳輸,其目的地址的安全性對整個網絡是公開和透明的。表現在企業內部最主要的安全漏洞就是基于C/S體系開發出來的軟件系統,只要在網絡內,任何PC都具備對數據庫進行訪問的權限。在一定程度上,此時的網絡架構的橫向應用管理是存在一定的風險性的。
端口的帶寬限制:這種情況會表現在網絡系統的某些區域出現帶寬吃緊,而某些區域的帶寬空閑很大,資源不能釋放給其他吃緊的區域,讓企業的網絡這邊空閑而那邊卻擁堵的厲害,往往是讓系統管理人員對整個網絡系統的運行狀況無法捉摸,不能做出很準確的維護判斷。
2.2建立矩陣網絡模型的新思路
網絡是一種資源,這種資源的缺失是以它的帶寬以及負載能力為主要指標的,再加之不斷增長的終端設備,其網絡需求才是最終影響網絡速度的主要因素。網絡安全的設計一定要圍繞終端設備中運行的網絡應用展開。由此可看,我們對網絡的設計實際上可以轉變為如何去平衡這種資源的消耗和補償。
要解決這個問題,筆者建立了一種二維矩陣邏輯模型,命名ax=by為線性公式,a,b為補償值,從而使得45度的中心角度分割線將其分為上下兩部分,上邊的部分被定義為網絡資源補償區,下邊的部分定義為網絡資源的消耗區,中心的這條線由原點開始允許其無限的向外延展,但其運動軌跡始終是圍繞著x=y 的這條線上下調整著,a,b的數值即為調整值。
調整的過程也就是網絡資源消耗和不斷補充的過程,在這個過程中,這條向外無限延展的線應根據實際應用數據量伸長與縮短,可伸長是體現網絡具有無限可擴的特點,縮短是體現了網絡的資源得到了最可能的節省。
在網絡資源使用級別的定義中,我們可以利用ax=by線性公式的a,b的比值與1的比較來完成具體節點的應用等級的設定,即當a=b時,此時的節點網絡應用等級最高,當a>b時,網絡應用等級會隨著資源的補充而逐漸提高,當a
根據這種網絡模型建立起來的網絡架構,具備資源耗盡檢測機制和資源補充機制,每個單獨的網絡應用對資源的需求不受本身節點的瓶頸影響,有了補償機制,再結合運行級別的設定,就可借用此機制順暢的運行在網絡中。
通過對線性公式的觀察,我們不難發現,在資源消耗區距離中心分割線越近的節點,網絡應用等級最高,反之,等級就越低;在資源補償區,距離中心分割線越近的網絡資源最不易被釋放,反之,越遠越容易被釋放。
這種概念模型能夠解決網絡應用中的等級設定與資源分配的問題,那么基于矩陣模型建立網絡結構,就可以適應未來網絡結構的變化,達到資源可控的目的。其模型圖如下。
網絡資源矩陣輯模型圖
3.神經網絡效應與網絡安全防護
在傳統思維中我們總是在網絡邊界增加防火墻來降低攻擊域,這會犧牲更多的網絡資源為代價,這會造成資金投入的大量浪費。如果我們能夠不去考慮邊界的擴展安全,而是將“云”里所有的節點都虛擬化,到處都是邊界,那么,有沒有一種模型能夠處理這種虛擬“云”的安全問題呢?
這就需要一種新的概念模型來降低擴展資源的投資風險,將“云”中的每個虛擬個體作為“神經元”,從而形成牽一發動全局的“神經網絡”。
“神經網絡”這個概念是人們從醫學領域里首先認識到的,是建立AI人工智能機器人的雛形概念模型的方法論,也就是說,利用可遍布全身的神經網絡來搜集信息傳輸給大腦,達到讓機器人做出行為判斷的目的。那么,可不可以也把這種概念引入到網絡的安全防護的建設中呢?我們可以通過以下科學分析來得出答案。
網絡帶寬和應用是可被分配和共享的資源,兩者都具有“云”的特性,那么,在沒有任何防護機制在其中運行的情況下,“烏云”是很容易產生并逐漸擴大的,這里的“烏云”是一種比喻,是形容存在網絡中的某些子域。“烏云”的產生會讓網絡病毒大面積發作、某些節點對所有出口進行非法偵測和頻繁掃描的狀況,從而形成對整個網絡的威脅。
如果把所有的網絡資源都當成“神經元”,再建立一種管理機制將其控制起來,就會形成遍布整個云的“神經網絡”,當某處出現問題時,控制機制啟動,直接將其阻斷或者隔離出網絡,就會非常有效的控制網絡威脅的大面積傳播。
另外,網絡云的不斷擴大,其邊界也在不斷擴展著,這時只要在接入網絡的新子域中建立“神經元”,就可以使整個網絡“云”“知道”其存在了,能夠通過客觀的識別過程來判斷其對每個個體“神經元”的友好程度,從而實現了網絡的安全擴展的功能。通過以上對“神經網絡”概念的設想,可實現整個網絡的自我感知和修復功能,加上牽一發而動全局的機制,結合我們企業跨地區的網絡結構特點,可以有力的保障其穩定和高效運行。
【參考文獻】
[1]百度詞條.關于云計算的若干描述.
關鍵詞:信用風險預警; 模糊神經網絡; 模因算法; 粗糙集
中圖分類號:TP301.6 文獻標識碼:A文章編號:2095-2163(2013)06-0010-05
0引言
近年來,人工神經網絡已廣泛應用于信用風險預警等金融風險管理領域,研究表明神經網絡預測準確性優于統計判別分析等傳統預警方法,但其中的“黑箱”操作等缺陷卻也導致了神經網絡在信用風險管理領域的應用遭到多方質疑[1-2]。源自模糊理論與神經網絡相融合的模糊神經網絡(Fuzzy Neural Network,FNN)提高了網絡的透明性、啟發性及魯棒性,在一定程度上克服了神經網絡的“黑箱操作”,然而FNN也存在“維數災難”、結構復雜、學習算法冗長、局部早熟等問題,由此也限制了其在金融風險管理領域中的應用[3]。據此,本文試圖在對模因算法(Memetic Algorithms,MA)進行改進的基礎上,結合粗糙集(Rough Set,RS)和模糊神經網絡提出一種模因進化型粗糙模糊神經網絡(MA-RSFNN)模型,旨在利用模因算法進行模糊神經網絡的訓練學習,發揮模因算法的全局優化能力,消減網絡陷入局部早熟的可能性,使網絡具有進化和學習的雙重智能,同時借助粗糙集知識約簡精煉訓練集、降低輸入維度,避免“維數災難”現象。
1模因算法
模因算法(Memetic Algorithms,MA)由Moscato和Norman等人于1992年提出,是一種超啟發式全局搜索混合算法,主要思想源自道金斯的文化進化思想和達爾文的自然進化法則[4]。其原理是在全局搜索策略中有機集成局域搜索策略,利用局部搜索策略的局部尋優能力提高算法的性能和收斂速度。相關研究表明模因算法在搜索過程中兼顧深度和廣度,不僅有較強的全局尋優能力,同時算法收斂速度快,在許多問題上的求解獲得了比遺傳算法收斂速度更快[6-9]。
經典的模因算法通常采用遺傳算法作為全局搜索策略,因此算法流程與遺傳算法類似。根據文獻[5],模因算法的流程如圖1所示。
2模因算法改進
模糊神經網絡的訓練學習是一個連續函數優化過程,以遺傳算法為基礎的模因算法能有效求解組合優化問題,但對連續空間問題的求解則效率不高。粒子群算法是一種源自對鳥類等生物群體覓食行為進行模仿的實編碼優化算法,其概念簡單、結構簡潔,是求解實編碼優化問題的有力工具。本文提出一種以粒子群算法為全局搜索策略,BP算法為局部搜索策略的改進型模因算法,以期設計出一種高效的模糊神經網絡學習算法。
粒子群算法(Particle Swarm Optimization ,PSO)是一種基于群體智能的全局優化算法,其靈感源自鳥群、蟻群等生物群體的覓食過程[10-11]。目前,具有概念簡單、算法簡潔、隱含并行及全局收斂等優點的粒子群算法已廣泛應用到決策分析、知識發現等領域[12-13],并取得了豐碩研究成果。基本粒子群算法的數學描述如下[10]。
假設一顆微粒代表尋優空間中的一個解,算法初始化時隨機生成一定數量的微粒構成種群,而后通過不斷隨機有向迭代尋求問題最優解。在迭代過程中,微粒通過跟蹤個體及種群歷史最優值,按式(1)、(2)不斷調整個體的速度和位置以實現向最優解靠攏。
其中,式(3)為速度vij的調整量;速度vij為位置xij的調整量;w∈[0.4,0.9]為慣性因子;c1=c2=2.0為學習因子; r(·)∈(0,1)為隨機數;pij和pg分別為個體及群體歷史最優值。
2.2改進型模因算法
改進型模因算法基本流程如圖2所示。
3模因進化型模糊神經網絡
3.1網絡結構
信用風險預警通常為多輸入單輸出的問題,參照文獻[14-15]設計的模糊神經網絡拓撲結構如所圖3所示。
3.2網絡學習算法
(1)編碼。微粒的坐標值代表了模糊神經網絡的模糊參數與權值,其編碼如圖4所示。
其中,yi為實際輸出;yi為期望輸出,P為群體規模。
(3)算法步驟。學習算法的主要步驟如下:
步驟一:初始化。設置全局搜索策略和局部搜索策略的相關參數,隨機生成種群。
步驟二:BP算子。采用BP算法對每個個體進行局部尋優。
步驟三:算法終止判斷。如果算法滿足終止條件則跳轉步驟六,否則跳轉步驟四。
步驟四:PSO算子。①根據式(4)計算每個個體的適應值;②個體及群體歷史最優位置調整;③按式(1)調整微粒速度;④按式(2)調整微粒位置。
步驟五:BP算子。采用BP算法對每個個體進行局部尋優,產生新群體,跳轉步驟三。
步驟六:算法結束。
其中,算法終止條件:① MSE最大進化代數。
BP算子的目標函數為式(4)所示的適應值函數,學習過程中,網絡參數與權值按以下數學公式作調整:
上述模因進化型模糊神經網絡采用模因算法對網絡進行學習與訓練,使得模型具備了學習與進化的雙重智能,但該模型也存在一般模糊神經網絡的“維數災難”現象。為此,采用粗糙集知識約簡對模型輸入數據進行前置處理,簡化訓練集、減少輸入維數,從而降低網絡結構的復雜程度,避免“維數災難”現象。前置處理的主要步驟如下:
(1)指標初選和數據預處理
在考慮數據可獲取性的前提下初步建立預警指標體系,指標體系要求涵蓋各方面的信息,力圖從全方位、多層次反映信用風險特征。
數據預處理主要是根據指標的特性,對連續型預警指標的數據進行離散化處理。數據離散化的原則是保持數據集分類或決策能力不變的前提下盡可能壓縮數據。
(2)建立決策表
以指標初選和數據預處理后的數據為基礎,建立如表1所示的決策表。
(3)知識約簡
對建立的決策表進行約簡處理,得到條件屬性的相對約簡,選取相對約簡所代表的預警指標組成指標集作為模型的輸入指標體系。
5模型在信用風險中的應用
從商業銀行的角度看,信用風險是指借款人的違約而造成的損失可能性。本文從商業銀行的企業貸款違約方面研究模型在信用風險評估中的應用,以檢驗模型在金融風險管理領域中的應用成效。
5.1指標初選與數據采集
在研究國內外相關成果的基礎上,參考相關商業銀行的企業績效評價指標體系[16-19],選擇涵蓋企業盈利能力、償債能力、成長能力及營運能力等方面的共21個指標構成初選指標集,如表2所示。
5.2粗糙集前置處理
(1)數據離散化與決策表的建立
采用等頻率劃分算法在保持數據分類能力的前提下對數據進行離散化處理,斷點集數k可通過試驗獲得,一般取k=3。在數據離散化的基礎上,以初選指標為條件屬性,屬性Bc(1:貸款違約公司,0:貸款正常公司)為決策屬性,建立信用風險預警的決策表,如表3所示。
(2)屬性約簡
5.3模型訓練學習
學習算法的相關參數初始化如下:
(1)模糊子集數設為3(代表高、中、低),則該模型為6-18-3-1結構的模糊神經網絡,輸出Y為企業違約信號(1:違約;0:不違約)。
(2)參數初始化。網絡的模糊參數及權值隨機初始化,隸屬中心∈[-1,1],隸屬寬度∈(0,1],耦合權值∈(-1,1)。
(3)模因算法的參數設置。PSO算子隨機生成規模M=30的種群,w=0.729, c1=c2=1.49,[Vup,Vdown]為[-1,1],Vmax=0.3,BP算子的學習率η=0.005。
(4)訓練終止條件:①適應值10 000。
在Matlab7.0環境中,編程實現上述的模型與算法,采用訓練數據集的150份數據對模型進行訓練學習,訓練過程誤差變化如圖5所示。經過3 000多代的進化,MSE達到了0.000 281。
采用測試集的數據對預警模型進行仿真實驗,表4匯總了三類模型的實驗結果,從中可以看出MA-RSFNN模型的預測準確率高達90%,相比BP神經網絡及單純模糊神經網絡均有了大幅度提高。無論是第一類錯誤還是第二類錯誤MA-RSFNN模型的表現都最好。
6結束語
模糊神經網絡具有啟發性、透明性等特征,可處理模糊信息,能避免神經網絡的“黑箱操作”,但其存在“維數災難”現象、結構復雜及收斂性差等缺陷。本文所提出的MA-RSFNN模型將模因算法和粗糙集理論融入模糊神經網絡,發揮模因算法的全局搜索能力提升模糊神經網絡的學習能力,借助粗糙集知識約簡的降維消冗能力對訓練數據進行降維消冗處理,從而精簡網絡結構,避免網絡陷入“維數災難”。應用實例的結果表明了新模型的有效性,可望為金融風險管理提供一種新方法和新思路。
參考文獻:
[1]MIN J H, LEE Y C. Bankruptcy prediction using support vector machine with optimal choice of kernel function parameters[J]. Expert Systems with Applications, 2005, 28 :603-614.
[2]BAHRAMMIRZAEE A. A comparative survey of artificial intelligence applications in finance: artificial neural networks, expert system and hybrid intelligent systems[J].Neural Comput & Applic,2010,19:1165-1195.
[3]HAMDANI T M, ALIMI A M, FAKHRI K. Enhancing the structure and parameters of the centers for BBF fuzzy neural network classifier construction based on data structure[A]// Proceedings of the International Joint Conference on Neural Networks[C]. Piscataway NJ: IEEE, 2008: 3174-3180.
[4]MOSCATO P. On evolution, search, optimization, genetic algorithms and martial arts: towards memetic algorithms[A]//Tech. Rep. Caltech Concurrent Computation Program [C]. Pasadena, California, USA, 1989: 1-67.
[5]NORA S,CHRISTIAN S, ANDREAS Z.A memetic clustering algorithm for the functional partition of genes based on the gene ontology[C]//Proc of the 2004 IEEE Symposium on Computational Intelligence in Bioinformatics and Computational Biology.San Diego,USA,2004:252-259.
[6]DAWKINS R. The selfish gene[M].UK:Oxford University Press,1976.
[7]MOSCATO P, NORMAN M G. A memetic approach for the traveling salesman problem-implementation of a computational ecology for com-binatorial optimization on message-passing systems[C]// Proceedings of the International Conference on Parallel Computing and Transport Applications. Amsterdam:IOS Press,1992: 177-186.
[8]RADCLIFFE N J, SURRY P D. Formal memetic algorithms[J]. Evolutionary Computing, 1994,865: 1-16.
[9]XU Xin,HE H G.A theoretical model and convergence analysis of memetic evolutionary algorithms[C]//Proc of Int Conf on Natural Computation.Changsha,2005:1035-1043.
[10]KENNEDY J. EBERHART R C. Particle swarm optimization [A]// Proceedings of IEEE, International Conference on Neural Networks [C]. Piscataway NJ:IEEE, 1995: 1942-1948.
[11]KENNEDY J. The particle swarm: social adaptation of knowledge [A]//Preceedings of Evolutionary Computation [C] ,Indianapolis: IEEE, 1997:303-308.
[12]EBERHART R C, SHI Y H. Particle swarm optimization: developments, applications and resources [A]//Proceedings of the IEEE Congress on Evolutionary Computation [C]. Piscataway, USA: IEEE Service Center, 2001:81-86.
[13]吳啟迪,汪鐳. 智能微粒群算法研究及應用[M]. 南京:江蘇教育出版社,2005-04.
[14]AKAGI T, SUGENO M. Fuzzy identification of systems and its application to modeling and control[J]. IEEE Transactions on Systems, Man, and, Cybernetics, 1985,15(1): 116-132.
[15]黃福員. 金融風險預警的MPSO-FNN模型構建與應用[J]. 計算機工程與應用,2009,45(14):210-212.
[16]ALTMAN E I, MARCO G, VARETTO F. Corporate distress diagnosis: comparisons using linear discriminant Ana analysis and neural networks[J]. Journal of Banking and Finance, 1994, 18: 505-529.
[17]李志輝, 李萌. 我國商業銀行信用風險識別模型及其實證研究[J]. 經濟科學, 2005(5): 61-71.