前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的神經網絡主題范文,僅供參考,歡迎閱讀并收藏。
摘要:
高軌衛星是我國衛星導航系統的重要組成部分。提升該類衛星的軌道預報精度有利于用戶定位精度的提高。提出了一種改進高軌衛星軌道預報精度的新方法。該方法避開了精化動力學模型的困難,嘗試從軌道預報誤差的規律中尋找突破。利用神經網絡作為建立預報模型的工具,將某歷史時刻的軌道預報誤差作為訓練樣本,利用訓練好的神經網絡模型補償當前時刻的預報軌道以提高軌道預報精度。對影響神經網絡模型補償效果的各因素進行了詳細分析,制定了適應于高軌衛星短期、中期和長期預報的神經網絡最優模型。利用實測數據進行了試驗分析,結果表明:預報8,15及30d應選擇的訓練步長分別為10,20及25min;軌道預報8~30d時,訓練噪聲均選取0.01。神經網絡模型有效地改進了高軌衛星的軌道預報精度,預報4~30d,軌道精度提高幅度為34.67%~82.37%不等。
關鍵詞:
神經網絡;軌道預報;訓練噪聲;訓練步長;地球靜止軌道衛星;傾斜地球同步軌道衛星
高軌衛星在我國的航天系統中應用十分廣泛。特別是我國的衛星導航系統BDS(Beidousystem),其主要包括GEO衛星和IGSO衛星。導航衛星星歷的精度是定位精度的基礎,而廣播星歷本身便是軌道預報的結果。預報精度問題是制約BDS衛星導航系統服務性能的關鍵因素,因此有必要對導航系統中的高軌衛星軌道預報精度展開研究[1]。改進軌道預報精度的一種方法是建立更加精準的動力學模型[2 ̄3]。然而由于該方法需要長期精密軌道數據的支撐,周期長、難度大。改進軌道預報精度的另一種方法可以從軌道預報誤差的規律中尋找突破[4]。神經網絡作為一種新興的建模工具,特點在于處理高維性、非線性的問題時不需要準確知道輸出輸入函數的結構參數。只要通過訓練來掌握它們之間的內在關系,在輸入訓練集以外的數據時,神經網絡可以獲得它們之間正確的映射關系。該方法的優勢在于不確定性系統的控制和預測。目前在軌道預報中使用神經網絡工具的相關研究較少,文獻[5]根據GPS衛星星歷的相關周期特性,以時間系列預報作為基礎,利用神經網絡建立預報模型。在沒有任何動力學模型的情況下得到了精度為數百米(1周)的預報結果。但是由于將衛星位置量直接作為神經網絡的輸出,神經網絡算法的狀態量動態范圍大,限制了預報精度的提高。文獻[6]利用GPS衛星精密星歷已知的優勢,將神經網絡與動力學模型相結合組成混合預報模型,改進GPS導航衛星的中長期預報。該方法可以在一定程度上改進軌道預報精度,但不是每次改進均能成功,存在改進失效的情況。針對高軌衛星的高精度軌道預報這一難題展開研究。以神經網絡作為建立預報模型的工具,在動力學模型基礎上建立神經網絡模型,通過對歷史時刻預報誤差的學習及訓練,掌握其變化規律,再用于補償和改進當前時刻的預報軌道,以達到提高預報精度的目的。針對神經網絡訓練及補償特性,分析了不同因素對神經網絡模型性能的影響。基于此制定了短、中、長期軌道預報的最優模型,最后利用不同類型衛星進行了試驗分析。
1基于BP神經網絡的軌道預報算法
BP神經網絡是一種多層網絡的“逆推”學習算法[7 ̄9]。利用神經網絡進行軌道預報分為訓練和補償兩個階段。在訓練階段,采用拼接方法得到一條長時間的精密軌道,用于衡量動力學模型預報誤差及神經網絡模型的訓練誤差。針對拼接處小量級的跳躍現象,采用Robust ̄loess數值濾波方法進行軌道預報誤差平滑[10]。由于預報軌道和預報誤差為訓練樣本,故需要對兩者的特性進行分析。同時神經網絡模型參數在一定程度上影響神經網絡的訓練效果,因此有必要對影響神經網絡模型的一些關鍵因素進行分析,以確定最優的神經網絡模型。在補償階段,將當前時刻的預報軌道X(T)和V(T)作為神經網絡模型的輸入;將利用函數f(X,V)計算得到神經網絡模型的輸出作為當前時刻預報軌道的補償值ΔXNN(T),將改進后的預報軌道X(T)和V(T)作為最終軌道輸出。在神經網絡具體應用中,為了提高網絡性能以完成預定任務,需要認真考慮訓練集預處理、網絡結構設定以及訓練算法等內容。網絡的性能主要表現在訓練效率及泛化能力。泛化能力是指辨識訓練樣本中所隱藏的規律并且當被輸入樣本以外數據時,網絡能正確地反應這種規律的能力。關于網絡泛化能力的相關討論及改進措施,已有文獻進行了比較詳實的總結。這里涉及到的方法主要包括下列3個方面:一是處理訓練樣本的方法[11],將神經網絡的訓練樣本進行歸一化處理,使其在[-1,1]變化,以提高神經網絡的性能;二是訓練步長的選取;三是增加隨機噪聲[12 ̄13]。
2不同因素對神經網絡模型性能的影響
分別針對預報軌道和預報誤差特征、訓練步長的選擇、訓練噪聲的大小對神經網絡模型性能的影響進行討論。
2.1預報軌道和預報誤差的特征分析
2.1.1中長期預報軌道和預報誤差特征將短期軌道預報弧長定位為1~13d,中期軌道預報弧長為14~27d,長期軌道預報弧長大于27d。以某初始時刻的預報誤差作為訓練樣本訓練得到的神經網絡可以對其他初始時刻的預報軌道提供補償,但前提是兩個初始時刻的預報誤差數值大小及波形圖要相近。對GEO衛星的預報誤差進行時間序列分析,結果可以看出,預報誤差最大值呈現以14d為周期的變化規律;IGSO衛星具有相同的特征。文中選取的訓練弧長與當前時刻的軌道預報弧長相等。對于中長期軌道預報可以采用以下方案:假設預報弧長為md(14n≤m≤14(n+1),n≥1),用當前時刻起14(n+1)d之前那天的預報誤差和預報軌道作為訓練樣本,訓練弧長為md,訓練得到神經網絡模型。采用神經網絡模型計算得到的補償誤差波形對當前的預報誤差進行補償。對于短期預報,由于預報弧長小于14d,其軌道預報方案中還考慮了預報誤差波形的最佳匹配。即充分結合預報誤差和預報軌道的動力學特性,建立了一個訓練樣本集。根據當前時刻的預報誤差波形變化特征在樣本集中搜索最佳訓練樣本,實現兩者波形變化的最優匹配,從而實現最優的補償效果。在中長期預報中未采用波形匹配算法的主要原因是,需要兼顧工程應用中的實時性,波形匹配耗時較長。
2.1.2短期預報中的波形匹配算法航天器是一個受攝動力系統,其初值不穩定性使得利用不同初始軌道得到的預報軌道和預報誤差的特性均不同。這就導致不同初始時刻的預報誤差并無規律。為了實現最佳的神經網絡模型補償效果,必須找到與當前時刻預報誤差變化波形最為相近的歷史時刻中的一條預報軌道。采用歷史時刻的預報軌道和預報誤差作為訓練樣本,訓練得到神經網絡模型。在實際工程應用中,因為當前時刻之后的預報弧段中的精密軌道無法獲取,故不能獲得當前時刻的預報誤差波形變化規律,所以并不能直接通過預報誤差波形比對來尋找補償當前時刻預報軌道的訓練樣本。但是基于動力學模型外推可以得到當前時刻的預報軌道,如果能找到預報軌道與預報誤差之間的波形變化對應關系,就可得到當前時刻的預報誤差波形變化規律。由于預報誤差的變化周期與軌道周期相同,對于GEO/IGSO衛星均為1d,通過對比預報誤差波形變化最大值和最小值出現的時刻,搜尋得到用于補償當前時刻預報誤差的訓練樣本。由于預報軌道在數值上遠遠大于預報誤差,為了便于分析問題,將兩者進行歸一化處理,即分別將兩者除以各自的最大值,這樣它們就在±1之間變化。圖2和圖3分別給出了某GEO衛星和某IGSO衛星在2013年第23天預報8d的軌道與相應的預報誤差之間的對應關系。其中,橫坐標表示預報時間,單位為d;縱坐標表示歸一化后的數值,無量綱。1)對于兩種類型的衛星,在J2000坐標系中X和Y軸方向,當預報軌道X/Y=0時,對應時刻的預報誤差為最大值(峰值)或最小值(谷值)。預報軌道從正值變化為負值經過零值的時刻對應著預報誤差的峰值,從負值變化為正值經過零值的時刻則對應著預報誤差的谷值。2)在Z軸方向,GEO衛星的預報軌道和預報誤差之間并無明顯的對應關系;IGSO衛星存在與X/Y軸相同的對應關系。將作為訓練樣本的預報誤差選擇定義在J2000坐標系中,主要是因為在該坐標系中預報誤差的規律性強,并且與預報軌道之間存在一定的對應關系。
2.2訓練步長對預報精度的影響預報誤差改進率的計算公式如下。以某GEO衛星為例,表1給出了不同預報弧長、不同訓練步長下利用神經網絡模型得到的預報誤差改進率。分析表1中的數據可以看出下列3點。1)訓練步長越小,神經網絡模型的改進率就越高。2)預報弧長的長度與對訓練步長的敏感度成反比,即弧長越長,訓練步長的延長對改進率的影響就越小。訓練步長從5min延長至40min,預報8,15和30d的改進率分別降低5.68%,3.9%和1.36%。3)由于訓練步長越小,訓練時間越長,因此改進率與訓練時間是一對矛盾體。從綜合改進率和訓練時間的要求考慮,即改進率應盡可能高,而訓練時間應盡可能短。故預報8,15和30d應選擇的訓練步長分別為10,20和25min。
2.3訓練噪聲對預報精度的影響以某初始時刻的軌道預報誤差(稱為訓練值)作為訓練樣本訓練神經網絡模型,用其補償另一個初始時刻利用動力學模型外推得到的預報誤差(稱為期望值)。如果訓練值和期望值在同一時刻吻合的很好,那么利用神經網絡模型一定能很好地修正動力學模型的預報誤差。以某GEO衛星軌道預報8d為例,圖4給出了采用不同噪聲值時訓練值和期望值之間的吻合關系。分為無噪聲、噪聲為0.01、噪聲為0.05和噪聲為0.10共4種情況。從圖4中可以看到,不加噪聲時訓練值與其期望值的差別較大,因此應加入訓練噪聲以提高神經網絡的泛化能力;加入噪聲后訓練值與期望值吻合的較好,但無法區分噪聲值為多大時預報精度最高。表2給出了采用不同訓練噪聲時,經神經網絡模型補償后的軌道預報誤差最大值的統計結果。其中原始預報誤差為未進行補償時的采用動力學模型外推得到的預報誤差。表2不同訓練噪聲下的預報分析表2中數據可以看出下列兩點。1)無噪聲時,前4d無改善,精度反而降低;預報8d及更長弧段時預報誤差略有改善,故應加入訓練噪聲。2)增加噪聲后,噪聲從0.001~0.100的變化對預報精度的改進幅度相當。但從總體來看,噪聲越小,前6d的預報精度越高;但預報8d以及更長弧段時噪聲為0.010的預報誤差最小,故應選擇訓練噪聲為0.010。
3試驗結果及分析
根據上述短、中、長期軌道預報方案,并結合不同神經網絡模型參數的優化設計分析,給出了利用神經網絡模型進行軌道預報的試驗結果。通過與精密星歷比對可以分別得到動力學模型和神經網絡模型的預報精度。表3列出了BDS系統中兩顆GEO、三顆IGSO共5顆衛星在2013年第23天利用神經網絡模型和動力學模型外推得到的預報誤差(其中NN代表神經網絡模型;Dyn代表動力學模型)。Sat02衛星由于軌道機動未能統計其中長期預報結果。表3中誤差是在一定弧段內預報誤差的最大值。從表3可得,神經網絡模型1d預報誤差有時會大于動力學模型的預報誤差;但預報4,8,15及30d各衛星采用神經網絡模型補償后的預報精度均有所提高。這主要因為1d的預報弧段規律性不強,不利于神經網絡模型的學習及訓練。隨著弧段的增長,訓練樣本的規律性增強,神經網絡模型的補償效果有所提高。為了更好地衡量神經網絡模型的改進效果,給出各衛星的預報精度提高幅度,其與預報誤差改進率的計算公式相同。表4給出了各衛星經神經網絡模型補償后的預報精度提高幅度。從表4中可以看出,預報4d各衛星的軌道精度改進幅度為40.25%~60.31%;預報8d各衛星的軌道精度改進幅度為63.28%~72.59%;預報15d改進幅度為47.01%~82.37%;預報30d改進幅度為34.67%~82.35%。可見神經網絡模型在改進軌道預報誤差中的作用顯著。
4結論
關鍵詞:神經網絡技術,ANNBP網絡算法
1、人工神經網絡概述
人工神經網絡是模擬生物神經信息處理方法的新型計算機系統,它可以模擬人腦的一些基本特征,(如自適應性,自組織性和容錯性),是一個并行、分布處理結構,它由處理單元及其稱為聯接的無向信號通道互連而成。
人工神經網絡力圖模仿生物神經系統,通過接受外部輸入的刺激,不斷獲得并積累知識,進而具有一定的判斷預測能力。盡管神經網絡模型的種類很多,但基本模式都是由大量簡單的計算單元(又稱為節點或神經元)廣泛相互連接而構成的一種并行分布處理網絡。。基于神經信息傳輸的原理,各個節點通過可變的權值彼此相連接,每個節點對N個加權的輸入求和,當求和值超過某個閾值時,節點呈“興奮”狀態,有信號輸出。節點的特征由其閾值、非線性函數的類型所決定,而整個神經網絡則由網絡拓撲、節點特征以及對其進行訓練所使用的規則所決定。
2、多層前向網絡
神經網絡按拓撲結構分為前饋型網絡和反饋型網絡。前饋型網絡在結構上采用的是其信息只能從前一層到它下面一層的單元,在網絡運算過程中不存在任何反饋。從學習觀點看,前饋網絡是一種強有力的學習系統,其結構簡單,易于編程;從系統觀點看,前饋網絡是非線性映射,通過簡單非線性處理單元的復合映射可獲得復雜的非線性處理能力,因此具有較強的分類能力和模式識別能力。
反向傳播(BP)網絡是典型的前饋型網絡,結構上它屬于多層前向網絡,它的結構如圖1所示。它分為輸入層、隱含層和輸出層,層與層之間多采用全互連方式,同一層之間不存在相互連接。網絡中每一層權值都可通過學習來調節,且網絡的基本處理單元(輸入單元除外)為非線性輸入、輸出關系,處理單元的輸入、輸出值可連續變化。由于BP網絡可在多個連續的輸入和一個或多個連續的輸出之間建立非線性映射這一特性,它常被用于智能預測。
多層前向網絡是使用最廣泛的一種網絡結構,它可很好的解決XOR等經典的非線性問題,比起單層的感知器有很大的優越性,尤其80年代中期,Rumelhart和Mcclelland最先提出了多層前饋網絡的反向傳播學習算法,簡稱BP算法,它的效率很高,是目前應用最為普遍的訓練算法,這使得多層前饋網絡應用更加廣泛。應該指出,我們常說的BP網絡,嚴格說是基于BP算法的多層前向網絡。
圖 1 BP網絡結構圖
4、 BP網絡算法
BP網絡算法的思想是把一組樣本的I/O問題變為一個非線性優化問題,使用了優化中最普通的梯度下降法,用迭代運算求解權對應于學習記憶問題,加入隱含層節點使優化問題的可調參數增加,從而可得到更精確的解。BP網絡模型設計的最大特點是網絡權值是通過使用網絡模型輸出值與已知的樣本值之間的誤差平方和達到期望值而不斷調整出來的,并且確定BP神經網絡評價模型時涉及隱含層節點數、轉移函數、學習參數和網絡模型的最后選定等問題。下面簡單介紹一下基本BP算法相關數學描述:
(1)梯度下降算法
(2)S(Sigmoid)型函數
BP網絡的激活函數經常使用的是Sigmoid對數或正切激活函數和線性函數。對數S型函數 f(x)=1/(1+exp(-x)), Sigmoid 函數具有非線性放大功能,它可以把輸入從負無窮大到正無窮大的信號,變換成-1到1之間的輸出,對較大的輸入信號,放大系數較小,而較小的輸入,放大系數較大,所以采用S型激活函數可以去逼近非線性的輸入/輸出關系。
(3)BP算法
BP網絡學習是典型的有導師學習,其學習算法是對簡單的學習規則的推廣和發展。BP網絡實現了多層網絡學習的設想,其學習過程包括正向傳播和反向傳播兩部分。。
在正向傳播過程中,給定網絡的一個輸入模式時,輸入信息從輸入層經過隱含層逐層處理,并傳向輸出層,每一層神經元的狀態只影響下一層神經元的狀態,由輸出層單元產生一個輸出模式,這是一個逐層狀態更新過程,稱為前向傳播。。如果輸出響應與期望輸出的模式誤差值不滿足要求,那么就轉入誤差反向傳播,將誤差值沿連接通路逐層傳送并修正各層連接權值。對于給定的一組樣本,不斷用一個個訓練模式進行學習,重復前向傳播和誤差反向傳播過程,當各個訓練模式都滿足要求時,BP網絡訓練完畢。
其中的激發函數我們采用S型函數, 即f(x)=1/(1+exp(-x))。BP算法描述如下:
(2)提供訓練樣本:輸入矢量Xk ,k=1,2,..n 和期望輸出tk, k=1,2,…,m;對每個輸入樣本進行(3)到(5)的迭代。
(3)計算網絡的實際輸出okj 。
(4)分別計算輸出層和隱含層的訓練誤差
其中(4-2)為輸出層的誤差值, (4-3)為隱含層的誤差值。
(5)修正權值和閾值
(6)判斷實際誤差指標是否滿足規定誤差的要求,滿足則到(7)。
(7)結束 。
BP算法是人工神經網絡中最為重要的網絡之一, 也是迄今為止應用最為廣泛的網絡算法, 實踐證明這種基于誤差反傳遞算法可以解決許多實際問題, 但其算法自身也存在著局部極小點、算法的收斂速度慢等缺陷,需要我們在今后的研究中不斷完善改進。
一般而言,計算機網路安全管理指的是計算機在連接網絡后進行信息的交換、瀏覽以及下載的過程中,對信息安全進行有效的管理,防止信息被他人竊取或者破壞。隨著信息時代的到來,越來越多的人對計算機產生了很強的依賴,從兒童到老年人,計算機的影響無處不在,隨著計算機的普及,人們在使用計算機的過程中對其安全性就有了顧忌。對于計算機網絡,只要連接互聯網,隨時都存在被攻擊的可能,相對而言,沒有任何計算機是絕對的安全或者是不受到任何的攻擊。運用計算機網絡技術進行攻擊或者盜取個人信息或者是企業信息的事件凡乎每年都會發生,計算機網絡存在嚴重的安全隱患。所以,要及時的認識以及了解計算機網絡面臨的安全隱患,積極的采取相應的措施加強對計算機網絡安全的管理
2神經網絡在計算機網絡安全管理應用的現狀
2.1對神經網絡在計算機安全管理運用中的重視程度不夠。計算機網絡安全是因特網發展的最基礎的目的,但與此同時近乎所有的計算機網絡在開創以及不斷的發展過程中都趨向于實用以及便利,相反卻在一定程度卜沒有重視對計算機的安全管理,更沒有將神經網絡技術運用到計算機的安全管理中,進而對計算機網絡的安全管理留下了嚴重的隱患。另外,神經網絡在計算機網絡安全管理中主要是對計算機的網絡安全進行評估,然而由于不重視對神經網絡在計算機網絡安全管理中的運用,使得沒有建立良好的計算機網絡安全評價標準體系。
2.2對神經網絡在計算機網絡安全評價模型的設計和實際運用不夠合理。一般來說,神經網絡在計算機網絡安全管理中主要是對計算機網絡安全進行一定的評估,在對其進行評估的過程中,就需要設計一定的計算機網絡安全評價模型,主要包含刊浦俞入層、輸出層以及隱含層的設計;但是,目前神經網絡在計算機網絡安全管理中對于評價模型的設計還沒有將這三方面有效的聯系起來、除此之外,對神經網絡在計算機網絡安全管理的實際運用中,不能科學、合理的實現計算機網絡安全管理評價模型運用,不注重對評價模型的學習以及不關注對評價模型進行有效的驗證。
3加強神經網絡在計算機網絡安全管理中的應用采取的措施
3.1神經網絡在計算機網絡安全管理中要科學、合理的設計網絡安全評價模型。神經網絡在計算機網絡安全管理中要科學。合理的設計網絡安全評價模型,以便更好的實現計算機網絡安全、高效的運行。為此,計算機網絡安全評價模型需要進行一下設計:首先是對輸入層的設計,一般來說,神經網絡在計算機網絡安全管理運用中,對于輸入層考慮的是神經元的節點數以及評價指標的數量,盡可能的使這兩者數量保持一致。其次是對隱含層的設計,對于隱含層的設計需要注意的是若某個連續函數在任意的閉區間中,可以通過在隱含層里的神經網絡來靠近,大多數情況下,神經網絡通常運用的是單隱含層。最后是輸出層的設計,神經網絡的輸出層設計主要是獲得計算機網絡安全管理評價的最終結果,例如可以設置計算機網絡安全管理評價的輸出層節點數為2,那么相應的輸出結果(l,)l指的是非常安全、(o,)l指的是較不安全、(,l山指的是基本安全以及(,0切指的是非常的不安全。
3.2神經網絡在計算機網絡安全管理運用中要對評價模型進行有效的驗證。需要注意的是,神經網絡在計算機網絡安全管理運用中要對評價模型進行有效的驗證,一般體現在一下幾方面:首先是要關注評價模型的實現,為了實現神經網絡在計算機網絡安全管理中的良好運用,就要依據客戶滿意的評價模型,運用計算機網絡技術創建設置含有輸入層、隱含層以及輸出層的神經網絡模型,然后再對網絡安全進行檢驗。其次是要注意對評價模型的學習,在對計算機網絡安全進行評價之前,需要對神經網絡進行標準化的處理,才能盡可能的減少對計算機網絡安全管理評價中的誤差。最后要注意對評價模型進行驗證,當神經網絡經過標準化處理以及在計l章機網絡安全評價之后,就需要刊輸出的結果進行一定的驗證,以便確定神經網絡對計算機網絡安全的評價輸出結果是否與期望的評價結果相一致,進一步驗證神經網絡在計算機網絡安全管理中安全評價模型的準確與否。
3.3重視神經網絡在計算機網絡安全管理運用以及建立健全安全評價標準體系。神經網絡在計算機網絡安全管理運用中主要的任務是對計算機網絡的安全進行一定的評價,并且將評價的結果準確、及時的反饋給用戶,所以就應該對其在計算機網絡安全管理中的應用引起高度的重視,為此就應該建立健全計算機網絡安全管理的評價標準體系。一方面是評價指標的建立,計算機網絡安全管理是復雜的過程,同時影響計算機網絡安全的因素比較多。因此,建立科學、合理以及有效的計算機網絡安全管理評價標準,對于神經網絡高效的開展評價工作有很大的關聯。另一方面是刊評價標準的準確化,影響計算機網絡安全管理的因素非常的多,就應該對各種評價標準進行細化,以達到評價的準確。
4結束語
1基于貝葉斯算法的BP神經網絡
1.1貝葉斯算法基于貝葉斯算法的BP神經網絡是基于貝葉斯定理而發展出來的用于解決統計問題的方法,即任意一個待求量都可以看作是一個隨機變量,因此可以通過概率分布來對待求量進行描述,這個概率是在抽樣前就有的關于待求量的先驗概率分布。貝葉斯理論正是在沒有樣本信息時,只根據先驗概率分布來求解待求量。而在有樣本后,則可根據總體、樣本和先驗信息的聯合分布來對未知量進行判斷。后驗分布π(θ|x)是反映人們在抽樣后對隨機變量θ的認識,其與先驗分布即樣本x的差異是由于樣本出現后人們對θ的調整,即后驗分布π(θ|x)為抽樣信息對先驗分布π(θ)調整的結果[6]。
1.2貝葉斯算法BP神經網絡基于貝葉斯算法的BP神經網絡是一種以神經網絡基本原理為構架,通過引入貝葉斯推理有效地控制網絡模型的復雜度,進而更好地解決非線性問題及其不確定性[7]。在BP神經網絡中,訓練樣本集為D(xm,Om),xm為輸入信號,Om為輸出節點,在一定的網絡結構A與網絡參數W下,可以得到網絡的輸出由網絡的輸入D唯一的確定。網絡訓練的目標函數為誤差函數ED(D|W,A),則有。采用貝葉斯算法BP神經網絡步驟如下:(1)確定網絡結構A,初始化超參數α,β,對網絡參數W進行賦值。(2)以最終目標函數為M(W)最小為原則,對BP神經網絡進行訓練,尋找最優可能網絡參數W。(3)尋找最優可能參數α,β。(4)采用不同初始網絡參數尋找最優網絡參數。(5)對不同網絡結構A,尋找最優網絡參數。
2貝葉斯算法的BP神經網絡量化結果分析
2.1訓練樣本與測試樣本在對管道進行磁化的過程中,最常用的方法是沿管道軸向進行磁化,提取缺陷處沿軸向變化的漏磁場與沿周向變化的漏磁場,缺陷的長度信息主要由沿軸向變化漏磁場反應,缺陷的寬度信息主要由沿周向變化的漏磁場反應,而缺陷的深度信息則是由這兩個量共同反應[9]。本文采用實驗的方法獲取網絡所需樣本,這里以對陡壁缺陷的分析為例,研究貝葉斯算法的BP神經網絡對陡壁缺陷量化的有效性。分別制作缺陷長度為3,3.5,4,4.5,5,5.5倍管道壁厚,寬度為0.5,1,1.5,2倍管道壁厚,深度為0.1,0.15,0.2,0.25倍管道壁厚,共得到96組測量結果,取其中80個缺陷特征作為網絡的訓練樣本,剩余的16個缺陷特征作為測試樣本。
2.2長度的量化采用統計分析的方法選取與缺陷長度關系密切的特征量作為神經網絡的輸入信號,將缺陷長度作為網絡的輸出信號來對網絡進行訓練。所選取主要特征有漏磁場軸向分量的靜態閾值截取長度、一階微分信號極小值的位置與周向變化漏磁場動態閾值截取長度。分別對基本的BP神經網絡與貝葉斯算法的BP神經網絡進行訓練,當均方誤差小于10-3時停止訓練,得到兩種網絡的訓練與學習過程如圖1所示。比較兩種算法訓練過程可以看出貝葉斯算法的BP神經網絡總共進行了331次訓練,而基本的BP神經網絡總共進行了1789次訓練,可見貝葉斯算法的BP神經網絡的收斂速率更快。用16組測試數據對兩種網絡長度的量化誤差進行比較,得到量化后缺陷最大相對誤差與最小相對誤差如表1所示,對應貝葉斯算法BP神經網絡量化的缺陷如表2所示。從表2中可以看出,采用貝葉斯算法的BP神經網絡量化得到的缺陷長度與設計值的誤差明顯小于基本的BP神經網絡,最大相對誤差僅為0.05%。
2.3寬度的量化與缺陷長度的量化相似,采用統計分析的方法選取與缺陷寬度關系密切的特征量作為神經網絡的輸入信號,將缺陷寬度作為網絡的輸出信號來對網絡進行訓練。所選取主要特征有軸向變化漏磁場峰谷值、周向變化漏磁場波形面積、波形能量、靜態閾值截取長度。分別對基本的BP神經網絡與貝葉斯算法的BP神經網絡進行訓練,當均方誤差小于10-3時停止訓練,得到兩種網絡的訓練與學習過程如圖2所示。比較兩種算法訓練過程可以看出貝葉斯算法的BP神經網絡總共進行了269次訓練,而基本的BP神經網絡總共進行了2248次訓練,可見引入貝葉斯算法后的BP神經網絡的收斂速率大幅提升。與之前相同,用16組測試數據對兩種網絡寬度的量化誤差進行比較,得到量化后缺陷誤差如表3所示,貝葉斯算法BP神經網絡量化達到誤差的缺陷見表4。在對缺陷寬度進行量化的過程中,盡管量化得到的最大相對誤差仍較大,采用貝葉斯算法的BP神經網絡量化得到的缺陷寬度與設計值的誤差明顯小于基本的BP神經網絡。
2.4深度的量化在對缺陷的深度進行量化時,采用統計分析的方法選取了缺陷的長度、寬度以及軸向變化漏磁場的兩個峰谷值、波形面積、周向變化漏磁場峰值、峰谷值作為神經網絡的輸入信號,將缺陷深度作為網絡的輸出信號來對網絡進行訓練。對基本的BP神經網絡與貝葉斯算法的BP神經網絡進行訓練,得到兩種網絡的訓練與學習過程如圖3所示。貝葉斯算法BP神經網絡總共進行了4152次訓練,基本的BP神經網絡總共進行了8763次訓練,盡管引入貝葉斯算法BP神經網絡的訓練過程仍舊較長,但比基本BP神經網絡的收斂速率有所提升。用16組測試數據對兩種網絡深度的量化誤差進行比較,得到量化后缺陷誤差如表5所示,貝葉斯算法BP神經網絡量化達到誤差的缺陷見表6。從對缺陷深度量化結果可以看出,采用貝葉斯算法的BP神經網絡對缺陷深度進行量化,得到的缺陷深度與設計值的誤差小于基本的BP神經網絡。
3結束語
本文主要介紹了人工神經網絡的概念,并對幾種具體的神經網絡進行介紹,從它們的提出時間、網絡結構和適用范圍幾個方面來深入講解。
【關鍵詞】神經網絡 感知器網絡 徑向基網絡 反饋神經網絡
1 引言
人工神經網絡是基于對人腦組織結構、活動機制的初步認識提出的一種新型信息處理體系。它實際上是一個由大量簡單元件相互連接而成的復雜網絡,具有高度的非線性,能夠進行復雜的邏輯操作和非線性關系實現的系統,通過模仿腦神經系統的組織結構以及某些活動機理,人工神經網絡可呈現出人腦的許多特征,并具有人腦的一些基本功能,利用這一特性,可以設計處具有類似大腦某些功能的智能系統來處理各種信息,解決不同問題。下面對幾種具體的神經網絡進行介紹。
2 感知器網絡
感知器是由美國學者Rosenblatt在1957年首次提出的,感知器可謂是最早的人工神經網絡。感知器具有分層結構,信息從輸入層進入網絡,逐層向前傳遞到輸出層。感知器是神經網絡用來進行模式識別的一種最簡單模型,屬于前向神經網絡類型。
2.1 單層感知器
單層感知器是指只有一層處理單元的感知器,它的結構與功能都非常簡單,通過讀網絡權值的訓練,可以使感知器對一組輸入矢量的響應達到元素為0或1的目標輸出,從而實現對輸入矢量分類的目的,目前在解決實際問題時很少被采用,但由于它在神經網絡研究中具有重要意義,是研究其他網絡的基礎,而且較易學習和理解,適合于作為學習神經網絡的起點。
2.2 多層感知器
多層感知器是對單層感知器的推廣,它能夠成功解決單層感知器所不能解決的非線性可分問題,在輸入層與輸出層之間引入隱層作為輸入模式的“內部表示”,即可將單層感知器變成多層感知器。
3 線性神經網絡
線性神經網絡類似于感知器,但是線性
神經網絡的激活函數是線性的,而不是硬限轉移函數。因此線性神經網絡的輸出可以使任意值,而感知器的輸出不是0就是1。線性神經網絡最早的典型代表就是在1963年由美國斯坦福大學教授Berhard Windrow提出的自適應線性元件網絡,它是一個由輸入層和輸出層構成的單層前饋性網絡。自適應線性神經網絡的學習算法比感知器的學習算法的收斂速度和精度都有較大的提高,自適應線性神經網絡主要用于函數逼近、信號預測、系統辨識、模式識別和控制等領域。
4 BP神經網絡
BP神經網絡是1986年由以Rumelhart和McCelland為首的科學家小組提出的,是一種按誤差逆傳播算法訓練的多層前饋網絡,在人工神經網絡的實際應用中,80%~90%的人工神經網絡模型采用BP網絡或者它的變化形式,它也是前向網絡的核心部分,體現了人工神經網絡最精華的部分,BP神經網絡由信息的正向傳播和誤差的反向傳播兩個過程組成。輸入層各神經元負責接收來自外界的輸入信息,并傳遞給中間層各神經元;中間層是內部信息處理層,負責信息變換,根據信息變化能力的需求,中間層可以設計為單隱層或者多隱層結構;最后一個隱層傳遞到輸出層各神經元的信息,經過一步處理后完成一次學習的正向傳播處理過程,由輸出層向外界輸出信息處理結果。當實際輸出與期望輸出不符時,進入誤差的反向傳播階段。誤差通過輸出層,按誤差梯度下降的方式修正各層權值,向隱層、輸入層逐層反傳。周而復始的信息正向傳播和誤差反向傳播過程,是各層權值不斷調整的過程,也是神經網絡學習訓練過程,此過程一直進行到網絡輸出的誤差減少到可以接受的程度,或者達到預先設定的學習次數為止。
BP網絡主要應用于以下方面:
(1)函數逼近:用輸入矢量和相應的輸出矢量訓練一個網絡逼近一個函數。
(2)模式識別:用一個特定的輸出矢量將它與輸入矢量聯系起來。
(3)分類:對輸入矢量以所定義的合適方式進行分類。
(4)數據壓縮:減少輸出矢量維數以便于傳輸或存儲。
5 反饋神經網絡
美國加州理工學院物理學家J.J.Hopfield教授于1982年發表了對神經網絡發展頗具影響的論文,提出一種單層反饋神經網絡,后來人們將這種反饋網絡稱作Hopfield網。在多輸入/多輸出的動態系統中,控制對象特性復雜,傳統方法難以描述復雜的系統。為控制對象建立模型可以減少直接進行實驗帶來的負面影響,所以模型顯得尤為重要。但是,前饋神經網絡從結構上說屬于一種靜態網絡,其輸入、輸出向量之間是簡單的非線性函數映射關系。實際應用中系統過程大多是動態的,前饋神經網絡辨識就暴露出明顯的不足,用前饋神經網絡只是非線性對應網絡,無反饋記憶環節,因此,利用反饋神經網絡的動態特性就可以克服前饋神經網絡的缺點,使神經網絡更加接近系統的實際過程。
Hopfield神經網絡的應用:
(1)在數字識別方面。
(2)高校科研能力評價。
(3)應用于聯想記憶的MATLAB程序。
6 徑向基神經網絡
徑向基RBF網絡是一個3層的網絡,除了輸入、輸出層之間外僅有一個隱層。隱層中的轉換函數是局部響應的高斯函數,而其他前向網絡,轉換函數一般都是全局響應函數。由于這樣的差異,要實現同樣的功能,RBF需要更多的神經元,這就是RBF網絡不能取代標準前向型絡的原因。但是RBF網絡的訓練時間更短,它對函數的逼近時最優的,可以以任意精度逼近任意連續函數。隱層中的神經元越多,逼近越精確。
徑向基網絡的應用:
(1)用于曲線擬合的RBF網絡。
(2)徑向基網絡實現非線性函數回歸。
7 自組織神經網絡
自組織競爭型神經網絡是一種無教師監督學習,具有自組織功能的神經網絡,網絡通過自身的訓練。能自動對輸入模式進行分類,一般由輸入層和競爭層夠曾。兩層之間各神經元實現雙向連接,而且網絡沒有隱含層。有時競爭層之間還存在著橫向連接。
常用自組織網絡有一下幾種:
(1)自組織特征映射網絡。
(2)學習矢量量化網絡。
(3)自適應共振理論模型。
(4)對偶傳播網絡。
參考文獻
[1]韓力群.人工神經網絡教程[M].北京:北京郵電大學出版社,2006.
[2]周品.神經網絡設計與應用[M].北京:清華大學出版社,2013.
作者簡介
孔令文(1989-),男,黑龍江省齊齊哈爾市人。現為西南林業大學機械與交通學院在讀研究生。研究方向為計算機仿真。
關鍵詞:神經網絡;RBF神經網絡;高壓斷路器;故障診斷
中圖分類號:TP3文獻標識碼:A文章編號:1009-3044(2009)25-7224-02
The Research and Application of RBF Neural Network
MA Yan-fang1,2, ZHOU Bing2
(1.Henan Polytechnic University, Jiaozuo 454000, China; 2.JiaoZuo University, Jiaozuo 454000, China)
Abstract: neural network is the mathematical simulation to human brain’s nervous system, its goal is to study and imitate human brain's information processing way. The paper introduced the principle and model of neural network, the learning process of RBF neural network as well as the training process of using RBF neural network to carry on fault diagnosis on high voltage circuit breaker.
Key words: neural network; RBF neural network; high voltage circuit breaker; fault diagnosis
神經網絡是對人腦神經系統的數學模擬,其目的是學習和模仿人腦的信息處理方式。人們對神經系統的研究已經有了很長一段歷史,早在十九世紀末,人們就開始認識到人腦包含著數量大約在1010-1012之間的神經元,他們有著復雜的聯接,并形成一個整體,使得人腦具有各種智能行為,由三個區組成:細胞體、樹突、軸突。一個神經元有多個樹突,它們起感受作業即接受外部(包括其它神經元)傳來的信息。軸突只有一條,用于傳遞和輸出消息。神經元之間通過突觸聯結,突觸是一個神經元軸突的末梢與另一個神經元的細胞體或樹突相接觸的地方,每個神經元大約有103-104個突觸與其它神經元有連接,正是因為這些突觸才使得全部大腦神經元形成一個復雜的網絡結構。
由此可知,人腦神經系統的工作原理就是:外部刺激信號或上級神經元信號經合成后由樹突傳給神經元細胞體處理,最后由突觸輸出給下級神經元或做出響應。
人工神經網絡的網絡模型有很多種,如感知器網絡、線性網絡、BP網絡、徑向基函數網絡(RBF網絡)、自組織網絡、回歸網絡等。本文介紹RBF網絡的學習過程以及采用RBF神經網絡進行高壓斷路器故障診斷的過程。
1 RBF神經網絡的學習過程
對于RBF網絡的數學描述可表達為:在n維空間中,給定N個輸入樣本Xi(i=1,2,…,N),則網絡隱含層的第k個節點的輸出可以表示為:
(1)
其中,Xi是n維輸入向量;Tk是第k個隱層節點的中心,k=1,2,…,l;?通常為歐式范數。
R(?)即是RBF函數,具有局部感受的特性,體現了RBF網絡的非線性映射能力。而網絡輸出層第j個節點的輸出,則為隱含層節點到輸出層的線性映射,即:
(2)
式中,wkj是隱含層到輸出層的權值,θj是第j個輸出節點的閾值,m是輸出節點數。
最常用的RBF函數形式是Gauss函數:
(3)
它的可調參數有兩個,即中心和寬度參數隱含層節點k的傳遞函數表達式為:
(4)
其中,X=(x1,x2,…,xn)―n維輸入向量,Tki為節點k的中心Tk的第i個分量,σk為節點k的Gauss分布寬度,?表示歐式范數。
輸出層節點j相應的輸出則可以表示為:
(5)
由此可見,對于RBF網絡來說,Tk、σk及w是最為重要的參數,設計RBF網絡的任務就是用一定的學習算法來確定這三個參數。
設有N個訓練樣本,則系統對所有N個訓練樣本的總誤差函數為:
(6)
式中,N為模式樣本對數;L為網絡輸出節點數;tkp表示在樣本p作用下的第k個神經元的期望輸出;ykp表示在樣本p作用下的第k個神經元的實際輸出。
RBF網絡的學習過程分為兩個階段:第一階段是無教師學習,是根據所有的輸入樣本決定隱含層各節點的高斯核函數的中心向量ci和標準化常數σi;第二階段是有教師學習,在決定好隱含層的參數后,根據樣本,利用最小二乘原則,求出隱含層和輸出層的權值wki。有時在完成第二階段的學習后,再根據樣本信號,同時校正隱含層和輸出層的參數,以進一步提高網絡的精度。下面具體介紹一下這兩個階段:
1) 無教師學習階段
無教師學習也稱為非監督學習,是對所有樣本的輸入進行聚類,求得各隱含層節點的RBF的中心向量ci。這里介紹k-均值聚類算法調整中心向量,此算法將訓練樣本集中的輸入向量分為若干族,在每個數據族內找出一個徑向基函數中心向量,使得該族內各樣本向量距該族中心的距離最小。
算法步驟如下:
① 給定各隱節點的初始中心向量ci(0)和判定停止計算的ε;
② 計算距離(歐氏距離)并求出最小距離的節點;
(7)
式中,k為樣本序號,r為中心向量ci(k-1)與輸入樣本x(k)距離最近的隱節點序號;
③ 調整中心
(8)
式中,β(k)是學習速率;, int(?)表示對(?)進行取整運算。可見,每經過q個取樣本之后,調小一次學習速率,逐漸減至零;
④ 判定聚類質量
對于全部樣本k(k=1,2,…,N)反復進行以上②, ③步,直至滿足以下條件,則聚類結束。
(9)
2) 有教師學習階段
有教師學習也稱為有監督學習。當確定以后,訓練由隱含層至輸出層之間的權值,由上可知,它是一個線性方程組,則求權值就成為線性優化問題。因此,問題有惟一確定的解,不存在BP網絡中所遇到的局部極小值問題,肯定能獲得全局最小點。
類似于線性網絡,RBF神經網絡的隱含層至輸出層之間的連接權值wki(k=1,2,…,L;i=1,2,…,q)學習算法為
(10)
式中,,Ri(x)為高斯函數;η為學習速率。可以證明,當0
2 高壓斷路器故障的訓練
對高壓斷路器進行狀態監測,獲取12組故障樣本數據,包括機構正常(ZC)、操作電壓過低(GD)、合閘鐵心開始階段有卡澀(HKS)、操作機構有卡澀(CKS)、合閘鐵心空行程太大(TD)、輔助開關動作接觸不良(FK),其中前6組數據作為建立神經網絡時的輸入向量,二進制輸出向量的位數由故障的種類數來決定,發生某種故障時其所對應的二進制位為1,其余位為0。利用
net=newrb(P,T,Goal,SPREAD)
建立神經網絡,取誤差目標值Goal為 0.01;RBF網絡的分布密度SPREAD為0.6。
接下來對網絡進行訓練,用后六組數據如表1做為訓練樣本。輸入到上面建立的RBF網絡中。
訓練結果如圖1所示。
可見,經過10次的訓練后,網絡的輸出已經達到預先設定的精度要求,結果如圖1所示。輸出結果如表2所示。
以表2中所示的樣本序號3為例,當輸入合閘鐵心開始階段有卡澀故障樣本數據時,其輸出結果中越接近1表明發生該故障的幾率越大,因此可以看出發生HKS故障的幾率最大。說明此RBF神經網絡可以投入實際應用之中。
3 結束語
人工神經網絡是模仿生物腦結構和功能的一種信息處理系統,已經在信號處理、目標跟蹤、模式識別、機器人控制、專家系統等眾多領域顯示出極大的應用價值。本文介紹了RBF神經網絡的學習過程,并給出了RBF神經網絡在高壓斷路器故障診斷中的應用。
參考文獻:
[1] 劉愛民,林蘋,劉向東.基于(RBF)神經網絡的自動化電器設備故障診斷方法[J].控制與監測,2005.(12):67-72.
關鍵詞:ZISC78;徑向基函數神經網絡(RBFNN);實時;預報
1引言
神經網絡是近年來得到廣泛關注的一種非線性建模預報技術。它具有自組織、自學習、自適應和非線性處理、并行處理、信息分布存儲、容錯能力強等特性,對傳統方法效果欠佳的預報領域有很強的吸引力。基于神經網絡的非線性信息處理方法已應用于軍事信息處理及現代武器裝備系統的各個方面,并有可能成為未來集成智能化的軍事電子信息處理系統的支撐技術。該技術在一些先進國家已部分形成了現實的戰斗力。
船舶在波浪中航行,會受到風、浪和流的影響,因而將不可避免地發生搖蕩運動。嚴重的搖蕩會使船員工作效率下降、物品損壞、軍艦的戰斗力下降。如果能夠預知未來一段時間船舶的運動情況,不僅有利于盡早采用先進控制算法控制艦載武器平臺隔離船舶運動的影響,使其始終穩定瞄準目標,而且還可獲得未來一個海浪周期內的船舶運動情況,以研究船載武器上層的控制策略,從而提高火力密度,因此,有必要研究在海浪中具有一定精度的海浪中船舶運動的短期預報。此外,如能有效準確地預報船舶的橫搖運動,對于提高船舶的耐波性和適航性也有重要意義。
國內外學者也將神經網絡用于船舶運動預報研究,但往往沒有考慮實時性等實現問題,因而不能實用化。神經網絡實現技術是神經網絡研究的一個重要方面。神經網絡實現可分為全硬件實現和軟件實現兩種。目前神經網絡的實現還主要以軟件模擬為主,由于現行的馮諾曼計算機體系結構不能實現并行計算,因而神經網絡軟件的實時應用還受到一定限制。
目前,一些著名集成電路制造公司如Intel、Mo-torola、松下、日立、富士通等均已推出自己的模擬或數字神經網絡芯片,這些芯片無論在網絡規模還是運行速度上都已接近實用化的程度,因而給神經網絡應用的發展以極大的推動。由于艦載武器系統,需選用具有在片學習功能的神經網絡芯片,即將網絡訓練所需的反饋電路及權值存儲、計算和修正電路都集成在了一個芯片,因而可實現全硬件的、具有自學習能力的神經網絡系統,也可以說,這是一種具有自適應能力的神經網絡。
2ZISC78的功能及工作原理
ZISC78是由IBM公司和Sillicon聯合研制的一種低成本、在線學習、33MHz主頻、CMOS型100腳LQFP封裝的VLSI芯片,圖1所示是ZISC78的引腳排列圖。ZISC78的特點如下:
內含78個神經元;
采用并行結構,運行速度與神經元數量無關;
支持RBF/KNN算法;
內部可分為若干獨立子網絡;
采用鏈連接,擴展不受限制;
具有64字節寬度向量;
L1或LSUP范數可用于距離計算;
具有同步/異步工作模式。
2.1ZISC78神經元結構
ZISC78采用的神經元結構如圖2所示,該神經元有以下幾種狀態:
(1)休眠狀態:神經網絡初始化時,通常處于這種狀態。
(2)準備學習狀態:任何時侯,神經網絡中的神經元都處于這種狀態。
(3)委托狀態:一個包含有原型和類型的神經元處于委托狀態。
(4)激活狀態:一個處于委托狀態的神經元,通過評估,其輸入矢量處于其影響域時,神經元就被激活而處于激活狀態。
(5)退化狀態:當一個神經元的原型處于其它神經元類型空間內,而大部分被其他神經元類型空間重疊時,這個神經元被宣布處于退化狀態。
2.2ZISC78神經網絡結構
從圖3所示的ZISC78神經網絡結構可以看出,所有神經元均通過“片內通信總線”進行通信,以實現網絡內所有神經元的“真正”并行操作。“片內通信總線”允許若干個ZISC78芯片進行連接以擴大神經網絡的規模,而這種操作不影響網絡性能。
ZISC78片內有6bit地址總線和16bit數據總線,其中數據總線用于傳輸矢量數據、矢量類型、距離值和其它數據。
2.3ZISC78的寄存器組
ZISC78使用兩種寄存器:全局寄存器和神經元寄存器。全局寄存器用于存儲與所有神經元有關的信息,每片僅有一組全局寄存器。全局寄存器組中的信息可被傳送到所有處于準備學習狀態和委托狀態的神經元。神經元寄存器用于存儲所屬神經元的信息,該信息在訓練學習操作中寫入,在識別操作中讀出。
2.4ZISC78的操作
ZISC78的操作包括初始化、矢量數據傳播、識別和分類等三部分。
初始化包括復位過程和清除過程。
矢量數據傳播包括矢量數據輸入過程和神經元距離計算過程。神經元距離就是輸入矢量和神經元中存儲的原型之間的范數。通常可選L1范數或Lsup范數:
其中,Xi為輸入矢量數據,Xs為存貯的原型數據。
對于識別和分類,ZISC78提供有兩種可選擇的學習算法RBF和KNN。其中RBF是典型的徑向基函數神經網絡。在該RBF模式下,可輸出識別、不確定或不認識的狀態;KNN模式是RBF模式的限制形式,即在KNN模式下,新原型的影響域總被設為1,輸出的是輸入向量和存儲原型之間的距離。需要指出的是,ZISC78具有自動增加或減小神經元個數以適應輸入信號的分類和識別功能,神經元個數的最大值和最小值在全局寄存器組中設定。
2.5ZISC78的組網
一個ZISC78芯片內可以通過寄存器操作定義若干個獨立的網絡。若干個ZISC78芯片通過層疊可以組成一個更大的神經網絡,組網芯片數量沒有限制,小于10個ZISC78組網時,甚至連電源中繼器件也不需要。所以,ZISC78具有最大的靈活性,能夠滿足不同的需要。
3仿真實例
為了驗證ZISC78用于船舶運動實時預報的精度,本文對徑向基函數神經網絡預報進行了仿真,圖4給出了基于徑向基函數神經網絡和船舶運動慣導實測信號預報的0.3秒(15步)誤差曲線圖。
通過以慣導實測數據ZHX_lg.dat為例預報0.3秒(15步)以后的船舶運動,作者運用相空間重構理論已經判斷出本數據為非線性信號。
該仿真的最大預報誤差方差為6.4666e-004,該數據可以滿足戰技指標。
關鍵詞:BP神經網絡;學習過程;模式識別;旋轉機械;故障診斷
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2009)15-3982-02
The Study and Application of the BP Neural Network
HOU Zhi-bin, WEN Bi-teng, PENG-Hua, LI Chun-hou
(Department for Graduate Students of Artillery Academy, Hefei 230031,China)
Abstract: The manual NN as a highly integrated chiasma subject. Most of models about NN are adopting the BP network and the changed form at the practical appliance, which is also the hard core of forward network, incarnating the essential part of NN. The paper introduces the studying process of the BP network and uses the BP network for the mechanical failure diagnoses as assorted organ in the mode identification.
Key words: BP neural network; studying process; mode identification; revolving machine; failure diagnoses
1 引言
人工神經網絡是一門高度綜合的交叉學科,它的研究和發展涉及神經生理學、數理科學、信息科學和計算機科學等眾多學科領域。
人工神經網絡是模仿生物腦結構和功能的一種信息處理系統,雖然目前的模仿還處于低水平,但已顯示出一些與生物腦類似的特點:1) 大規模并行結構與信息的分布式存儲和并行處理,克服了傳統的智能診斷系統出現的無窮遞歸、組合爆炸及匹配沖突問題,它特別適用于快速處理大量的并行信息。2) 具有良好的自適應性,系統在知識表示和組織、診斷求解策略與實施等方面可根據生存環境自適應、自組織達到自我完善。3) 具有較強的學習、記憶、聯想、識別功能,系統可根據環境提供的大量信息,自動進行聯想、書記及聚類等方面的自組織學習,也可在導師的指導下學習特定的任務,從而達到自我完善。4) 具有很強的容錯性,當外界輸入到神經網絡中的信息存在某些局部錯誤時,不會影響到整個系統的輸出性能。神經網絡已經在信號處理、模式識別、目標跟蹤、機器人控制、專家系統、系統辨識等眾多領域顯示出其極大的應用價值,作為一種新的模式識別技術或一種知識處理方法,神經網絡在機械故障診斷中顯示了其極大應用潛力。
目前,在人工神經網絡的實際應用中,絕大部分的神經網絡模型是采用BP網絡和它的變化形式,它也是前向網絡的核心部分,體現了人工神經網絡最精華的部分。本文介紹BP網絡的學習過程以及從模式識別角度應用BP神經網絡作為分類器進行機械故障診斷。
2 BP神經網絡的學習過程
有多層感知器可知,輸入層中人以神經元的輸出為輸入模式分量的加權和。其余各層中,設某一層中任一神經元j輸入為netj,輸出為yi,與這一層相鄰的低一層中任一神經元i的輸出為yi。則有
如式(5)和式(6)所示,輸出層中神經元的輸出誤差反向傳播到前面各層,以各層之間的權值進行修正。
3 旋轉機械故障的訓練
表1是一組旋轉機械故障的訓練示例,表內的值表示各訓練示例的特征值大小,其取值區間為[0,1],如在不平衡訓練示例中,0~1/4倍頻的振動幅值的當量值為0;1/4~3/4倍頻的振動幅值的當量值為0;3/4~1倍頻的振動幅值的當量值還為0;1倍頻的振動幅值的當量值為0.9;2倍頻的振動幅值的當量值為0.1;等等,其余類推。
將這些故障訓練示例輸入到一個具有8個輸入節點,8個中間層節點和3個輸出層節點的網絡中,經過1200次迭代,形成了一個網絡,該網絡的記憶效果如表2所示,經過12000次迭代形成網絡的記憶效果如表3所示。
表2中第一行表示,當輸入一組不平衡故障時,得出該故障的置信度為0.94,而其他故障幾乎為0;第二行表示,當輸入一組油膜渦動故障時,得出該故障的置信度為0.96,而其他故障幾乎為0;第三行表示,當輸入一組不對中故障時,得出該故障的置信度為0.90,而其他故障幾乎為0。表3中的結果有所改進,其值已趨于穩定。通過比較表2和表3,可看出訓練中迭代次數越多,所得到的網絡越能夠更好的聯想出訓練示例。但訓練次數不宜過長,只要滿足精度要求,訓練次應盡可能少,以減少訓練時間。
4 結論
人工神經網絡是模仿生物腦結構和功能的一種信息處理系統,并且已經在信號處理、模式識別、目標跟蹤、機器人控制、專家系統、系統辨識等眾多領域顯示出其極大的應用價值。文章介紹了BP神經網絡的學習過程,并給出了BP神經網絡在旋轉機械故障診斷中的應用。作為一種新的模式識別技術或一種知識處理方法,神經網絡在機械故障診斷中顯示了其極大的應用潛力。
參考文獻:
[1] 王江萍.機械設備故障診斷技術及應用[M].西安:西北工業大學出版社,2001.
[2] 盛兆順,尹琦嶺.設備狀態監測與故障診斷技術及應用[M].北京:化學工業出版社,2003.
[3] 溫熙森.模式識別與狀態監控[M].長沙:國防科技大學出版社,1997.
[4] 李孝安.神經網絡與神經計算機導論[M].西安: 西北工業大學出版社,1994.
關鍵詞神經網絡;反向傳播算法;PSO算法;適應度函數
人工神經網絡是由人工神經元互連而成的網絡,它從微觀結構和功能上實現對人腦的抽象和簡化,具有許多優點。對神經網絡的權值系數的確定,傳統上采用反向傳播算法(BP算法)。BP網絡是一種多層前向反饋神經網絡,BP算法是由兩部分組成:信息的正向傳遞與誤差的反向傳播。在反向傳播算法中,對權值的訓練采用的是爬山法(即:δ算法)。這種方法在諸多領域取得了巨大的成功,但是它有可能陷入局部最小值,不能保證收斂到全局極小點。另外,反向傳播算法訓練次數多,收斂速度慢,使學習結果不能令人滿意。
粒子群優化算法(ParticleSwarmOptimizer,PSO)是一種進化計算技術(evolutionarycomputation)。源于對鳥群捕食的行為研究,PSO中,每個優化問題的解都是搜索空間中的一只鳥,我們稱之為粒子。所有的粒子都有一個由被優化的函數決定的適應值(fitnessvalue),每個粒子還有一個速度決定他們飛翔的方向和距離。然后粒子們就追隨當前的最優粒子在解空間中搜索。如果用粒子群算法對神經網絡的權值進行訓練,會得到較快的收斂速度,而且可以避免局部最值得出現。研究表明PSO是一種很有潛力的神經網絡算法。
本文提出了一種基于PSO算法的BP網絡學習算法,并通過MATLAB7.0實現對一組簡單的向量進行訓練對PSO—BP算法和BP算法進行了對比,試驗結果說明PSO—BP算法適合訓練BP網絡,并且也有希望應用于其他種類的前向網絡的訓練。
1PSO算法
PSO中,每個優化問題的解都是搜索空間中的一只鳥。我們稱之為“粒子”。所有的例子都有一個由被優化的函數決定的適應值(fitnessvalue),每個粒子還有一個速度決定它們飛翔的方向和距離。然后粒子們就追隨當前的最優粒子在解空間中搜索。
D維搜索空間中,有m個粒子,其中第i個粒子的位置是,m,其速度為。將帶入目標函數可計算出適應值。記第i個粒子搜索到的最優位置為,整個粒子群搜索到的最優位置為。離子狀態更新操作為:
其中,i=1,2…,m,d=1,2…,D;是非負常數,稱為慣性因子。也可以隨著迭代線性減小;學習因子,是非負常數;r1,r2是介于[0,1]之間的隨機數;是常數。
迭代中止條件一般選為最大迭代次數和粒子群迄今為止搜索到的最有位置滿足適應閾值。
2基于PSO的BP網絡學習算法
BP網絡是一種多層結構的前向網絡,其隱層神經元的激活函數為S型函數,而輸出神經元的激活函數可以是S型函數,也可以實線性函數,典型的S型函數為:
(3)
其中:s為神經元的加權輸入函數。
用PSO算法訓練BP網絡時,定義粒子群的位置向量的元素是BP網絡的全體連接權和閾值。首先初始化位置向量,然后用PSO算法搜索最優位置,使如下均方誤差指標(適應值)達到最小
(4)
其中,N是訓練集的樣本數;是第i個樣本的第j個網絡輸出節點的理想輸出值;是第i個樣本的第j個網絡輸出節點的實際輸出值;C是網絡輸出神經遠的個數。
基于PSO算法的BP網絡學習算法流程如下:
1)選定粒子數m;適應值閾值ε;最大允許迭代步數;、和;初始化X和V為(0,1)間的隨機數。
8)endfor
9)fori=1:1:m
10)按式(1)計算;按式(2)計算;
11)endfor
12)endwhile
13)以所得權值閾值為初始值用BP算法對網絡進行訓練
上述流程中,1)到12)用標準PSO算法對權值和閾值進行訓練,13)對PSO輸出的權值和閾值作為初始值用BP算法訓練網絡(MATLAB中有集成的訓練函數)。另外,,其中是第I個粒子的位置;V=,其中是第I個粒子的速度;是m個粒子迄今搜索到的最優適應值,其對應的粒子位置矩陣是p=;是粒子群迄今搜索到的最優適應值,對應的最優粒子位置是,粒子數m選定為30個。
3結果分析
本實例中隨機選取機輸入和輸出矩陣,如:p=[00000;10001;01001;00100;00010];t=[0000;1000;0100;0010;0001]。由于P是五行的矩陣,所以網絡輸入層的神經元個數為:5個,T為五行矩陣,故輸出層神經元個數為:5個,隱含層神經元個數為:6個。
首先觀察一下PSO算法中的適應值(fitness)的變化過程,圖1中,實線表示適應值的平均值,虛線表示是最優適應值。從圖中可以看出適應值迅速的選擇過程。
圖2為用PSO—BP算法和BP算法在訓練誤差精度為0.002的情況下的誤差演化曲線:(a)為PSO—BP算法訓練誤差演化曲線,所用時間是20.422000s。(b)為常用BP算法訓練誤差演化曲線,對權值的訓練采用的是梯度下降法,所用時間是27.172000s。從圖中可以看到:PSO—BP算法的迭代次數遠遠小于BP算法,并且訓練時間也縮短了。
(a)
(b)
圖2
為了充分說明實驗結果,筆者做了多次反復實驗,實驗結果如下表:在訓練誤差精度為0.002的情況下,十次試驗中PSO—BP算法的平均迭代次數遠小于BP算法,收斂時間較接近。
算法
次數BP算法PSO—BP算法
迭代次數收斂時間迭代次數收斂時間
1158735.79700071719.547000
2105123.17200079433.390000
391718.28100068327.813000
480916.28200087933.265000
5132333.125000109730.218000
6214643.76600093126.046000
7116123.64100056817.391000
853014.68700073625.782000
9141526.75000086927.625000
10122724.17200095329.422000
平均值1216.625.967300822.727.04990
4結論
本次試驗中對BP算法和PSO—BP算法進行了對比試驗,試驗結果證明:PSO—BP算法優于BP算法。具體表現在:學習算法的收斂速度有所提高;BP算法中的局部極小問題常令學習結果不滿意,PSO的全局優化能力使問題得到解決。
參考文獻
[1]MartinT.Hagan,HowardB.Demuth,MarkH.Beale,著,戴葵,等譯.《神經網絡設計》.機械工業出版社,2002年9月
[2]徐麗娜編著.《神經網絡控制》.電子工業出版社,2003年2月
[3]高雋編著.《人工神經網絡原理及仿真實例》.機械工業出版社,2003年8月
[4]ZbigniewMichalewicz,DavidB.Fogel著,曹宏慶,李艷,董紅斌,吳志健,譯.《如何求解問題——現代啟發式方法》.中國水利水電出版社,2003年2月