前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的神經網絡的基本特征主題范文,僅供參考,歡迎閱讀并收藏。
【關鍵詞】建筑經濟管理;神經網絡
中圖分類號:TU198文獻標識碼: A
一、前言
建筑經濟管理在我國是一個非常重要的行業,為社會的進步提供了夯實的基礎,但是在神經網絡的應用這方面還是存在一定的問題,所以,科學技術人員在這個方面還是很努力的研究,并且促使這個技術發展更為全面。
二、神經網絡的特征及其信息處理特點
人工神經網絡(Application of Neural Network,即:ANN)是一種對人腦中樞神經系統的生物神經結構進行的功能性抽象,在模式識別和分類領域顯示了強大的能力,它們以“黑箱”模式工作,不需要先驗模型,具有自適應能力,可以從數據中捕捉和學習規律,其計算能力在預測和評估、模式識別和優化等領域得到了廣泛驗證。神經網絡尤其適合解決那些采用傳統的數學方法和手段建模困難的復雜問題,并已被證明是解決復雜非線性問題的一種有效工具。
1、神經網絡的基本特征
(1)內在并行性。神經網絡是一個高度并行的非線性系統,其并行性不僅體現在結構上,它的處理運行過程也是并行的。神經網絡從單個處理單元到整個系統,在理論和實踐上都反映了并行性,計算是分布在多個處理單元上同時進行的。
(2)分布式存儲。與傳統計算機不同,神經網絡中信息并非存儲在一個特定的存儲區域,而是分布存儲在整個系統中。神經網絡的每一個神經元都只是整體概念的一個部分,每一個單元都包含著對整體的貢獻,而每一個單元都無法決定整體的狀態。
(3)容錯性。因為信息是分布存儲在整個系統中,而不是駐留在某一個特定的存儲區域內,因此,網絡中部分神經元的誤差不會在很大程度上影響改變整個系統的行為。
(4)學習與自適應性。神經網絡的一個重要特點是具有很強的學習能力,它可以通過對數據的監督或非監督學習,實現任意復雜的函數關系,而且整個網絡具有自適應性,即進行自我調節的能力。
2、神經網絡的信息處理特點
神經網絡的基本特征使其在信息處理上具有與傳統信息處理技術不同的特點。
(1)數據驅動、“黑箱”建模方式。神經網絡通過訓練能夠直接從數據中發現規則和特征,實現任意復雜的函數映射。這種學習能力使得神經網絡分析和建模過程相當于一個“黑箱”,既無需模型結構設計和參數估計過程,而且在沒有輸入模式先驗信息的情況下,通過數據驅動取得優良的結果。
(2)非編程、自適應的工作方式。神經網絡的學習是便利而且可塑的,在網絡整體結構不變的情況下,只需調整權值即可完成任意關系的學習,通過遞進補充訓練樣本即可跟蹤和適應外界環境的不斷變化。因此,神經網絡的工作方式可以是實時的和自適應的。
(3)信息處理與存儲合二為一。神經網絡在運行時信息處理與存儲同時完成,信息的隱含特征和規則分布于神經元狀態和權值之上,通常具有冗余性。這樣,當不完全信息或含噪信號輸入時,神經網絡就可以根據這些分布記憶進行聯想以恢復全部信息。同時,這種合二為一的方式從本質上消除了軟件和算法的“瓶頸效應,”提供了實現高速信息處理的手段。
(4)實時信息處理。神經網絡是一個大規模非線性動力學系統,具有高維、高密度的并行計算結構。大量神經元的微觀活動構成了神經網絡的整體宏觀效應。這種集體運算能力使得神經網絡可以完成高維數據的在線實時處理。
三、建筑經濟管理研究面臨的問題
1、對系統的非線性認識不足
(1)忽視了系統內各變量之間復雜的非線性關系,過分強調先驗假設。建筑活動在理論和實踐中有明顯的非線性和復雜性。建筑經濟管理問題的本質上是因為現實的復雜性導致的非線性。建筑活動隨時代和環境的變遷表現出其非線性特征。一方面,建筑經濟管理問題的線性假沒體現了系統特殊性。但另一方面,系統建模時所使用的理論總是落后于現實,這是因為其相關理論發展的滯后性,而這又是由于其非線性和復雜性引起的。
(2)忽視數據本身效用,過分依賴理論指導。模型的函數形式很難僅僅通過理論考慮獲得。在實踐中選擇理論框架既是十分重要又是十分困難的。
2、對系統變量自身特征的認識不足
(1)變量(數據)的高噪聲。采集、編制建筑經濟管理數據時會有很多誤差,再加上諸多外在因素的沖擊造成了波動強烈變形,所以數據是包含有許多“奇異點”而且是高噪聲。
(2)變量的高度不確定性。目前經濟學界對不確定性沒有一個統一的定義,一般情況下有2種不確定性的定義。一種定義是變量的不確定性通過隨機變量的方差來定義,通常稱為概率型不確定性,也可稱為“風險”。另一種定義是一種沒有穩定概率的隨機事件,稱為非概率型不確定性。
(3)變量不同程度的模糊性。一定的模糊性是大多數建筑管理問題變量的特點。現實中的不分明現象就是模糊性。而從一種狀態過度到另一種有差異的狀態的過程中,中間發生了量變到質變的連續過程。總之,常常需要解決建筑管理中的決策、優化等非線性問題,由于它們的一次性、高度動態性和復雜性的特點,建筑管理的信息是隨機的,具有非線性和時變性,相應的變量也有不確定性、高噪聲和模糊性的特點,因此搜集數據、分析因素等方面有相當大的難度。
四、ANN在建筑工程項目管理中的應用研究
1、ANN在造價預測方面的應用
汪應洛,楊耀紅(2004年)總結了ANN在費用估計方面的應用。采用BP網絡,用40個公路工程樣例訓練網絡,并用工程實例進行驗證,發現效果比傳統方法好。Tarek Hegazy(1998年)等用MS-Excel表格進行ANN模擬,并在輸入層和隱含層加入了偏置神經元來促進網絡學習。其缺點是由于網絡學習時的訓練樣本數據中有噪聲,會造成過度學習現象,運用規范化網絡可以解決這個問題。周麗萍,胡振鋒(2005年)在研究BP神經網絡在建筑工程估價中的應用時指出,可以利用神經網絡“特征提取器”的作用,從大量過去的工程資料中自動提取工程特征與預算資料的規律關系;由于神經網絡具有高度的容錯性,因而對于過去的工程資料中由于人為的或其他因素造成的偏差有自動糾偏功能;此外由于神經網絡是并行處理數據的,因而其處理速度相當快,這點滿足了快速估算要求,實踐證明是有效的。
2、ANN在工程項目管理績效評價中的應用
閆文周(2005年)等運用ANN中的BP網絡對工程項目管理績效評價問題進行研究,建立了一個綜合考慮項目工期、質量、費用、安全四大控制指標的工程項目管理績效評價模型。實例分析表明,其評價結果更加全面、更加符合實際情況,從而有助于促進工程項目管理水平的提高。基于BP神經網絡的工程項目管理績效評估模型,將影響工程項目管理績效的主要因素進行整合,通過神經網絡反映了工程項目工期、質量、成本、安全與項目績效之間復雜的非線性關系,從而使項目管理績效的評價更客觀。
3、Hop field網絡模型在建設工程評標中的應用
建設工程評標是一個多目標決策過程,評標過程中存在著大量的定性和模糊的因素,評標人很難快速做出準確客觀的評判。朱玉濤(2006年)等用ANN作為新型信息處理工具,在建設工程評標中可應用于優選中標企業。介紹了Hop field網絡模型構造及算法設計,包括進行方案優劣排序、換位矩陣以及能量函數構造、神經元之間連接和輸出,并用實例說明了該方法的優越性和實用性。應用Hop field網絡對非定量因素進行科學的分析,可以消除一些人為因素的影響,使評選結果更加合理。
4、BP網絡模型在建設工程招投標管理中的應用
BP網絡以其自學習、自聯想功能的優點在建設工程招投標中得到廣泛應用。楊中宣(2006年)結合人工神經網絡基本理論,介紹了它在工程招投標的招標價格、風險因素分析以及競標單位資格審查等方面的應用,指出利用人工神經網絡具有的高度并行處理和可完成復雜輸入輸出的非線性映射能力,不僅可以保證高的中標率,且可避免招標過程中不確定性因素的影響。
五、人工神經網絡的發展趨勢
人工神經網絡在建筑管理中的應用與研究,解決了不少該領域中的難題,顯現出廣闊的應用前景。但是,神經網絡作為新興學科,在理論和實踐中,還有很多不完善和不成熟的地方,又在一定程度上制約了它的實際應用。因此在利用人工神經網絡解決問題時,需要選定合適的網絡模型及網絡算法,同時還要加深人工神經網絡基礎理論方面的研究。
六、結束語
總而言之,就建筑經濟管理中神經網絡的應用這方面而言,這項技術的發展不僅使建筑經濟管理體系更加的完善,更加使人們的生活帶來了許多的便利條件,通過科學技術人員的不斷努力,會使為社會發展做出巨大的貢獻。
參考文獻
[1]王其文,劉廣靈.人工神經網絡與線性回歸的比較 決策與決策支持系統,2008(4):22-26.
(①東軟集團股份有限公司,沈陽 110179;②沈陽工程學院,沈陽 110136)
(①Neusoft Group Co.,Ltd.,Shenyang 110179,China;②Shenyang Institute of Engineering,Shenyang 110136,China)
摘要: 本文在闡明企業綠色競爭力內涵及特征的基礎上,構建企業綠色競爭力評價指標體系,給出了基于BP神經網絡的企業綠色競爭力評價模型,以期為企業構建綠色競爭力,實現可持續發展提供支持和參考。
Abstract: The enterprise green competitiveness evaluation index system is constructed based on clarifying the meaning and characteristic of green competitiveness. And then, the evaluation model of green competitiveness based on BP neural network is provided, so as to provide support for enterprise to construct green competitiveness and attain sustainable development.
關鍵詞 : BP神經網絡;綠色競爭力;評價
Key words: BP neural network;green competitiveness;evaluation
中圖分類號:F272.5 文獻標識碼:A 文章編號:1006-4311(2014)34-0005-02
作者簡介:韓意(1986-),女,遼寧沈陽人,東軟集團股份有限公司會計師,碩士,研究方向為工程管理;姚大鵬(1963-),男,遼寧沈陽人,沈陽工程學院信息學院,副教授,碩士,研究方向為計算機工程。
0 引言
近年來,越來越多的人開始關注環境保護與環境影響評價、綠色認證和綠色消費、清潔生產與綠色制造等,因為它們直接而廣泛地影響著人們的消費行為和企業的經營行為。因而在企業戰略管理領域的研究中,國內外學者對綠色競爭力做了許多有益的研究探索工作,如Porter和Vander Linde(1995)提出 “雙贏”的觀點,認為恰當設計的環境規制可以激發被規制企業創新,產生效率收益[1];Bonnifant等(1995)認為通過創新,可減少環境方面的成本從而獲得競爭優勢[2];吳曉玲(2004)把綠色競爭力的內涵概括為發展度、協調度和持續度三個方面等[3];但至今有關企業綠色競爭力評價方面的研究成果卻相對少見,為此,本文試圖做一粗淺研究,聚焦企業綠色競爭力評價問題,以期為企業構建綠色競爭力,實現可持續發展提供支持和參考。
1 企業綠色競爭力的內涵及特征
企業綠色競爭力可理解為企業在科學發展觀的指導下,采取可持續發展戰略,通過綠色創新提高企業資源利用效率、生產效率和管理水平,向市場提供比競爭對手更具吸引力的綠色產品和服務,從而在環境保護、資源節約和經濟績效方面獲得競爭優勢的一種綜合能力。企業綠色競爭力應表現出的基本特征是[4]:
①資源屬性方面的特征。企業的資源與企業競爭力密切相關,其素質與規模是企業競爭力的基本保證。
②技術屬性方面的特征。現代企業的競爭是技術的競爭,只有當企業具備一定的經營優勢和核心技術時,企業的競爭力才有堅實的基礎并體現出競爭優勢。
③管理屬性方面的特征。管理能力是企業競爭力的核心內容,包括環境適應能力、創新能力、企業文化建設等。
④經濟屬性方面的特征。主要體現在產品全生命周期成本低,企業的環境處理成本低,產品具有綠色性和環保競爭優勢,產品市場占有率高。
⑤環境屬性方面的特征。企業的環境行為是一種提高企業競爭力的戰略性資產,是提高企業競爭力的基本因素。
⑥責任屬性方面的特征。企業從事生產經營活動時,必須考慮社會的整體利益和長遠發展,自覺承擔其相應的社會責任,促進企業、環境和社會和諧發展。
2 企業綠色競爭力的評價指標體系建立
企業綠色競爭力評價機制是通過一系列評價指標來完成的,評價指標選擇不同會產生不同的評價結果,所以評價指標的選擇是建立評價系統的關鍵。對應于綠色競爭力的基本特征,構建評價指標體系包含六個方面的指標。然后采用頻度統計法、理論分析法初步設置指標,通過主成分分析法、極大不相關法對指標進一步篩選、分類,然后采用專家咨詢法調整指標,并綜合前人的研究成果構建企業綠色競爭力評價指標體系如表1所示。
3 基于BP神經網絡的企業綠色競爭力評價方法
3.1 指標歸一化處理 企業綠色競爭力評價指標體系中有些指標是正指標,有些指標是逆指標,需要對各指標進行歸一化去量綱處理。
對于正指標:X’i=Xi-Xmin/Xmax-Xmin
對于逆指標:X’i=Xmax-Xi/Xmax-Xmin
歸一化處理后的指標值X’i在數值上介于0-1之間,它消除了量綱的影響,具有了可比性,可以進行指標間的相互比較。
3.2 BP神經網絡評價的基本原理 BP神經網絡是一種具有兩層或兩層以上的階層型神經網絡,層間神經元實現全連接,而層內各神經元間無連接。典型的BP網絡是三層前饋階層網絡,即:輸入層、隱含層和輸出層。
BP網絡的學習由四個過程組成,輸入模式由輸入層經中間層向輸出層的“模式順傳播”過程;網絡的希望輸出與網絡實際輸出之差的誤差信號,由輸出層經中間層向輸入層逐層修正連接權的“誤差逆傳播”過程;由“模式順傳播”與“誤差逆傳播”的反復交替進行的網絡“記憶訓練”過程;網絡趨向收斂即網絡的全局誤差趨向極小值的“學習收斂”過程。
BP 神經網絡分析具有許多優秀的品質,并且善于從近似的、不確定的、甚至相互矛盾的知識環境中做出決策,其模型的結構如圖1所示。
應用BP網絡對企業綠色競爭力做評價的方法是把用于描述評價對象的特征信息作為神經網絡的輸出向量,將代表相應綜合評價的量值作為神經網絡的輸出向量;使用網絡前,用一些經傳統綜合評價取得成功的樣本訓練這個網絡,使它所持有的權值系數值經過自適應學習后得到正確的內部表示,訓練后的神經網絡便可作為企業綠色競爭力評價的有效工具。
4 企業綠色競爭力評價實例分析
本文的實證分析過程選取了我國造紙業上市公司作為研究案例,具體指標值來源于X紙業集團。首先對各輸入指標進行歸一化處理,然后利用BP神經網絡模型對企業綠色競爭力進行評價。
在構造評價企業綠色競爭力的BP神經網絡時,考慮到二級指標體系包括36個指標,所以輸入層神經元設36個;設置1個輸出層神經元,為了增加評價結果的直觀性,將評價結果劃分為優、良、中、差四個等級,分別對應于(1,0,0,0)、(0,1,0,0)、(0,0,1,0)、(0,0,0,1);隱含層神經元可根據經驗公式n1=sqrt(m+n)+d來確定,其中m為輸入層神經元個數,n為輸出層神經元個數,d為0到10之間的常數,本文取d=5,由此可確定隱含層神經元個數n1=11。使用Matlab編程軟件編寫BP神經網絡程序,取神經網絡學習效率η=0.05,給定收斂值ε=0.001,當企業的指標值經輸入層進入網絡時,網絡便用訓練好的權值進行運作,最后根據輸出層輸出的向量值的隸屬關系確定企業的綠色競爭力,得到輸出結果為(0.9863,-0.0048,-0.0169,-0.0124),此輸出結果與(1,0,0,0)等級最為契合,表明該企業具有較強的綠色競爭力。
5 結論
適應當今企業經營綠色化發展趨勢和新的形勢要求,本文提出了企業綠色競爭力評價指標體系,給出了基于BP神經網絡的企業綠色競爭力評價模型,推演出了企業綠色競爭力評價指標的應用途徑,并結合具體的實例對該指標體系的整合性評價模式進行了實證分析,以期為企業實現可持續發展提供支持和參考。
參考文獻:
[1]Porter M E, Vander Linde C. Toward a New Conception of the Environment Competitiveness Relationship [J]. Journal of Economic Perspectives, 1995(9): 97-118.
[2]Bonifant B C, Arnold M B, Long F J. Gaining Competitive Advantage through Environmental Investments [J]. Business Horizons, 1995,38(4): 37-47.
關鍵詞:人工神經網絡;金屬切削刀具;磨損檢測
1.前言:
隨著我國的工業飛速發展,對于工件的要求也愈發嚴格,但是從工廠中制造出的工件或多或少都有些不盡人意,所以必須依靠金屬切削技術對工件進行二次加工。但隨著時間流逝,金屬刀具的磨損逐漸成為了一個問題。而且隨著機器的柔性化與機械化愈發提高,人工觀測刀具磨損狀況的方法也愈發得不可取。無數科學家為此進行了大量研究,討論出了是數種方法,而人工神經網絡運用于金屬切削機的技術也應運而生。人工神經網絡是一種以模擬動物神經網絡而創造的數學模型,人工神經網絡有大量簡單的處理單元組成,它最大的作用處理信息,并且擁有學習和記憶、歸納的能力。目前,人工神經網絡在智能控制、優化計算與信息處理中都有很大的進展,人工神經網絡的前景不可估量。
2.人工神經網絡在金屬切削刀具中的應用
2.1人工神經網絡的基礎知識
人工神經網絡是一種建立在現代醫學對于人腦的研究上的一種模擬人腦的數學模型。它是由大量簡單的處理單元組成的復雜網絡,用以模仿人類大腦的神經活動與規律。所以,人工神經網絡擁有人類大腦的基本特征,即:學習、記憶與歸納功能。雖然人工神經網絡與人類大腦相比略有不足,但是由于其獨特的結構,人工神經網絡可以對己輸入信息進行分析與歸納,并且擁有簡單的決斷能力與簡單的判斷能力,所以人工神經網絡在邏輯學推理演算中,比起人類大腦更加有優勢。故,人工神經網絡在一些比較簡單同時需要大量計算的工作上比起人腦更有優勢。于是,人工神經網絡被廣泛用于金屬切削技術,并獲得了大量的好評。
2.2人工神經網絡使金屬切削的過程更加智能化
人工神經網絡具有自學習、聯想存儲與優化計算的能力,在金屬切削中被大量運用。人工神經網絡在金屬切削中起著多傳感器多信息融合與模式聯想器的作用。在對選定的人工神經網絡進行訓練,通過人工神經網絡的學習與記錄作用,將人工神經網絡訓練為模型,并將這個模型運用于金屬切削中,使金屬切削過程智能化。1992年王衛平博士使用人工神經網絡令金屬切削機在金屬切削的過程中智能化。李旭東利用BP網絡與人工神經網絡的學習性,實現了金屬切削加工的智能化選擇。實際上,國內有許許多多的人用人工神經網絡實現了金屬切削過程的智能化,而隨著他們的成功,越來越多的人也將加入金屬切削智能化的隊伍中來。
并且隨著我國技術的逐漸加強,人工神經網絡技術的逐漸完善,金屬切削智能化的程度只會越來越強。
2.3人工神經網絡對于刀具磨損的檢測
人工神經系統被運用于金屬切削領域的初衷,就是希望借助它的智能化與信息處理的優越性,代替人工來檢驗刀具的磨損程度。
通過人工神經網絡的學習性,可以輕易在網絡中建模,使人工神經網絡可以輕易地檢測出刀具的正常狀態與非正常狀態――即刀具是否磨損。當刀具處于磨損狀態時,人工神經網絡可以發出警告。實際上,在刀具磨損狀態下發出警報已經不再是現在的研究重點了,在無人參與定情況下,對整個金屬切削過程進行識別,當刀具發生磨損,人工神經網絡可以進行自主替換,這,才是理想中的智能刀具檢驗系統,同時也是研究熱點。如果要實現上述內容,應該具備這些特點:對于來自多個傳感器的信息可以快速處理;在擁有樣本數據的情況下可以快速學習;可以根據外界數據的變化,快速調整自身,以適應周遭環境。
2.4通過人工神經網絡的計算,預測金屬切削加工中的狀態.
在人工神經網絡運用于金屬切削中的一個重要研究,便是通過人工神經網絡的計算來預測金屬切削加工中的狀態。可惜這項技術現在還只是處于理論研究與建模模擬的狀態下,跟可以正式使用還有一定的距離。如果這項技術可以得到突破,那么,毋庸置疑得,不止在金屬切削領域是一大進步,更加可以推動工廠全智能化、C械化,這無疑是一場重工業的一場大地震與大革命。
關鍵詞 人工神經網絡模型,人工語法學習,自動聯系者,序列學習,簡單循環網絡。
分類號 B842
1 引言
人工神經網絡模型(Artificial Neural Network Model,簡稱ANN),顧名思義,就是用人造的程序、機械或設備來模擬人腦神經網絡的模型。人工神經網絡模型的用途有二:(1)發明基于神經網絡的人工智能系統,來模擬人的學習、記憶、推理等智能活動,以服務于人類的現實生活;(2)構建各種心理活動和心理過程的模型,以為各種心理學理論提供支持。前者是自動化、通信、制造、經濟領域關注的,我們平時所見的語音識別、經濟領域使用的股票走勢預測等智能系統大多是基于人工神經網絡模型研制出來的。而后者則是心理學家所關注的領域。至今,人工神經網絡模型已被用來模擬諸如知覺、記憶、學習、判斷等各種心理活動,以解釋矛盾的實驗數據,為有關的心理學理論提供豐富的證據。
和其他領域的研究者們一樣,內隱學習領域的研究者們也注意到了這一行之有效的工具。Cleeremans(1993)指出根據已有的內隱學習理論構造人工神經網絡模型,將模型的輸出數據與人類被試的實驗數據進行比較,能為原有的理論觀點提供證據[1]。Dienes和Perner(1996)也有類似的看法[2]。然而,在發揮人工神經網絡模型在內隱學習研究上的功效之前,必須解決如下問題:人工神經網絡模型是否正如Cleeremans等所言適用于內隱學習研究?如果是,用哪類人工神經網絡模型來模擬內隱學習?
2 人工神經網絡模型的工作原理及其研究內隱學習的適用性
人工神經網絡模型之所以適用于內隱學習,是因為它的基本工作原理和內隱學習的兩個本質特征有著驚人的相似。
2.1 人工神經網絡模型的工作原理
早在20世紀40年代,便有研究者對人工神經網絡模型的工作原理做了最初的嘗試。1943年,McCulloch和Pitts用類似“開關”的閾限邏輯單元(Threshold Logic Unit)**來模擬神經元,并將多個這樣的單元以相等的強度(權重)連接起來,形成網絡,這就是著名的MP模型[3]。1949年,Hebb在論述條件反射的形成時,無意間提到了神經元間連接強度更新的重要法則,即兩個彼此相連的神經元同時激活或同時抑制,都能增加神經元間的連接強度,后人稱此為Hebb法則[4]。然而,MP模型和Hebb法則都不能構成真正意義**上的神經網絡模型,雖然,MP模型已經具備將多個神經元連接起來,形成網絡的雛形,但是由于不同單元間的連接強度相等,且恒定不可變化,MP模型不具備人工神經網絡的基本特征――學習性;而Hebb雖然提出了權重變化的一條有效法則,但卻未將其應用到人工神經網絡中來。真正將神經元連接成網絡的思想與借助于權重更新使網絡具有學習性的思想綜合在一起的要屬Rosenblatt。
Rosenblatt(1958)提出了第一個真正意義上的人工神經網絡模型――感知器(Perceptron)[5]。其基本工作原理為:整個感知器由多個不同層次的加工單元組成,每個加工單元的功能類似于單個神經元或一組神經元,它能接收來自前一層的幾個加工單元的激活,并綜合這些激活,對此進行簡單運算(例如:判斷總激活量是否達到某一閾限),然后將運算的結果傳遞給下一層的加工單元。第一層單元的激活模式反映了外部刺激狀態,即模型的輸入,而最后一層單元的激活模式則為模型的輸出反應。某個單元對下一層的另一個單元的影響取決于兩個單元之間連接的強度(權重)。為了在給定輸入的情況下,使模型獲得類似于人類被試的輸出反應,必須不停地調節單元與單元間的連接權重。所以,在構建合適的人工神經網絡模型時,研究者往往會先設置一系列初始權重,然后不斷地給予模型不同的輸入模式,在每個特定輸入后,比較模型輸出與正確輸出間的差異,并據此調整單元間的連接權重,這一過程不斷進行,直到模型輸出和正確輸出間的差異達到最小值,此時,模型便完成了整個學習過程。圖1為一個典型感知器的例子,它旨在判斷呈現于視網膜的光條是垂直的還是水平的。整個感知器由3個加工單元層組成,第一層為網膜層,即將整個視網膜分割為10×10的網格,用每個網膜單元對應于一個網格,共100個單元,當光條落
圖1 感知器例子(資料來源:文獻[3])
在視網膜的某幾個網格上時,這些網格所對應的網膜單元被激活。第二層為聯系層,其中的每個單元總是和某些網膜單元間存在興奮或抑制連接,不論興奮還是抑制連接,強度都是恒定的1或-1,當與聯系單元連接的網膜單元的總激活量達到聯系單元的激活閾限時,聯系單元被激活,例如圖1,Aj的接收到的總激活量為1+1+1-1=2,如果Aj的閾限為2,那么2=2,Aj被激活。第三層為反應層,其中只包括一個反應單元,它與所有的聯系單元連接,連接權重為Wj,其中,j表示第j個聯系單元。反應單元將綜合來自聯系單元的激活信息,即將每個聯系單元的激活量乘以它們之間的連接權重,然后簡單求和,得出總激活量,并判斷激活是否達到閾限,公式表示如下:
aR為反應單元的激活水平,aj為聯系單元的激活水平,θ為閾限值。如果,總激活量達到反應單元的閾限,反應單元被激活(激活量為1),感知器決定光條為垂直,否則,反應單元不被激活(激活量為0),感知器反應光條為水平。當然,感知器必須經過一個漫長的學習階段,才能完成這一簡單的判斷任務。在學習階段,感知器接受各種不同的水平和垂直光條刺激,并一一做出反應,當反應正確時,連接權重不做任何調整,一旦反應錯誤,感知器會自動調整聯系單元與反應單元間的權重,比如:當反應單元的激活量為0時,而實際光條為垂直,說明反應單元所接收到的總激活量小于閾限,此時,則應增大那些被激活的聯系單元與反應單元間的連接權重,以提高總激活量,使其更有可能達到閾限,致使在下次刺激呈現時,感知器更易做出正確反應。當然,Rosenblatt的感知器除了能調整權重外,還會調整反應單元閾限。這種通過逐步調整連接權重和閾限,以減少感知器反應和正確反應間的差距的方法就是著名的感知器收斂法則(perceptron convergence rule)。不過,調整閾限的方法對于擁有多個反應單元的模型來說過于復雜,所以未被以后的人工神經網絡模型采納。
可見,Rosenblatt的貢獻是卓越的,他給出了人工神經網絡的基本工作原理,基于感知器收斂法則發展而來的delta法則與斜率遞減(gradient descent)法已成為如今人工神經網絡最主要的算法,本文第3點中將對此做詳細介紹。然而,值得注意的一點是感知器僅在聯系層和反應層間使用了權重概念,學習過程也僅發生在這兩層之間,所以從本質上講,感知器只屬于包含一個輸入層和一個輸出層的單層網絡(single layer network),這種單層網絡在解決某些實際問題時,遇到了障礙。Minsky等(1969)指出感知器甚至無法模擬諸如XOR(異或)等簡單運算[3]。因此,在接下來的將近20年中,人工神經網絡的發展一度進入低迷期。直到80年代中期,逆向傳導法(back propagation)[6]、自動聯系者(atuoassociator)[7]、循環模型(recurrent model)[8,9]一一提出,多層網絡廣泛應用智能模擬任務中,人工神經網絡才得以迅速發展。然而,這些算法和模型的基本工作原理與最初的感知器卻并無兩樣。
2.2 人工神經網絡模型研究內隱學習的適用性
如上述,人工神經網絡的工作原理為通過調整權重逐步學會正確反應。那么,這些基于調整權重來學習正確反應的人工神經網絡模型是否適于研究內隱學習呢?內隱學習這一概念強調的是兩個特征:第一,它是學習的一種形式;第二,這種學習是內隱的、無需意識努力的。人工神經網絡的工作原理極好地匹配了這兩個特征。首先,要建立針對某一心理活動的合適的網絡模型,必須要經過長期的訓練和學習過程,即向模型呈現許多刺激,要求其做出反應,并將模型反應與要求的正確反應進行比較,據此逐步調整內部結構,使模型在以后的刺激情景中,更易做出正確反應。這種學習過程和人類的學習有著驚人的相似,人類在幼年時,雖然腦神經已發展完全,但是他們仍然不能執行各種認知任務,這時候的人腦就好比初始狀態的神經網絡模型,雖然,已對模型基本結構做了設定(比如,模型由幾個加工單元層組成,每層有幾個單元,哪些單元和哪些單元間存在聯系),但是由于所有的連接權重都是隨機設置的,模型不知道刺激與反應間的聯系,常常會給出錯誤反應,而當經過幾年的學習之后,人類嬰孩不斷地從外界接收刺激,做出反應,并接收來自外界的反饋,將之與自己的反應做比較,逐步通過內部結構的改變,來調整自己的行為,從而能夠知覺事物、理解言語、控制自身的機體運動,這就好比初始狀態的網絡模型,能夠通過調整權重,達到穩定狀態,對刺激模式做出正確反應。可見,人工神經網絡模型很好地匹配了內隱學習地第一個特征――兩者都是學習過程。其次,內隱學習強調學習是內隱地進行的。由于無法直接探索學習過程是否是內隱的,研究者往往通過驗證學習中所獲得的知識是內隱的來間接推斷學習過程是內隱的,當被試在分類或選擇任務中的表現高于隨機,卻不知道自己是依據何種知識做出正確判斷時,習得的知識被認為是內隱的,從而進一步推斷學習過程也是內隱的[10~12]。人工神經網絡模型也一樣,從根據輸出結構來調整權重的過程來看,根本無法判斷學習過程是否是內隱的,而類似的,人工神經網絡的知識表征形式顯示神經網絡模型所獲得的知識很有可能是內隱的。當人工神經網絡能做到正確反應時,指導模型該如何反應的知識似乎是存在于單元的組織結構和他們之間的連接權重上,根本無法直接從這種無序而雜亂的結構和權重上看出什么規則,例如:上述判斷光條垂直和水平的感知器,我們并無法從直觀上判斷哪些單元表征垂直光條,哪些單元表征水平光條,這種知識表征形式很有可能是內隱的。這種知識的表征形式被稱為分布式表征(distributed representation),它和傳統的局部表征(local representation)很不一樣,局部表征中,每個用不同的單元表征不同的事物,例如:單元1表征事物1,單元2表征事物2……,在知識提取時,就好比查字典一樣,根據不同的事物,找到表征的位置,便可以獲悉有關事物的各種知識。而分布表征可以將不同的事物表征在同一組單元中,比如垂直光條和水平光條,在知識提取時,往往只需輸入新刺激的內容,比如光條激活了視網膜的哪些區域,便能根據內容找到合適的反應。
3 廣泛應用于內隱學習領域的兩種人工神經網絡模型
人工神經網絡模型很好地匹配內隱學習的兩大基本特征。因此,許多研究者針對不同的內隱學習任務,選擇不同的人工神經網絡模型來擬合內隱學習過程,以探討內隱學習的本質和機制[13~17]。
縱觀近40年來的內隱學習研究,雖然不同的研究者開發了許多不同的任務形式,獲得了許多可喜的研究成果,但是這些任務都離不開兩種根本的任務形式――人工語法學習和序列學習。相應地,根據兩個任務的不同特點,研究者選擇了兩種不同的模型――自動聯系者和簡單循環網絡(simple recurrent network,簡稱SRN)――分別對之加以模擬。
3.1 人工語法學習與自動聯系者
人工語法學習任務通常是:在學習階段,要求被試在不知道內在規則的情況下記憶一大堆合法字符串,然后,在測試階段,向被試呈現一批新的合法和非法字符串,并告知前面學習的字符串是一類符合語法規則的合法字符串,要求被試根據前面的學習,判斷新的字符串是否合法[10]。從測試階段的要求、學習階段的要求和所學習的知識這三個不同的角度來看,人工語法學習具有三個主要特征:
第一,測試階段要求被試進行的是一項典型的分類任務。相應地,檢索1943年以來,人工神經網絡模型發展的這段歷史,便可以發現只有模式聯系者(pattern associator)是專門針對模式識別和分類而開發出來的模型。模式聯系者的誕生源自于條件反射的思想,即建立刺激和反應間的聯系。用模式聯系者的話說,就是對于特定的輸入刺激模式,給出相應的反應模式。有趣的是,當用一組單元表示輸入模式,另一組單元表示輸出模式,它們兩兩連接在一起(如圖2),并使用Hebb法則Wij=εαiαi更新權重時(其中,ΔWij為輸入單元j和輸出單元i之間權重的變化量,ε為學習速率,是常數,aWi為輸出單元的激活量,aWj為輸入單元的激活量),模式聯系者便能在同一個模型中存儲不同的輸入模式,將反應模式相同的輸入模式歸于同一類,并且當模式中的某些量缺失時,比如某個輸入單元損壞,模型仍能正常運行[3]。可見,模式聯系者能夠有效地模擬分類任務,甚至是某些腦神經受損病人(相當于某些輸入或輸出單元受損)的分類活動。然而,人工語法學習并不僅是單純的分類任務,它還具有其他特征,因此,只模擬測試階段的分類任務是遠遠不夠的。
第二,人工語法學習的另一個特征是,學習階段要求被試在沒有任何指導(反饋)的情況下學習字符串,即并沒有在被試學習某一字符串的同時,告訴他們這一字符串屬于哪一類,合法還是非法。投射到模式聯系者中,就是在學習對特定刺激模式的分類時,不伴隨相應的反應模式,即沒有輸出單元。事實上,人類的許多學習過程都是在沒有外部指導的情況下進行的。比方說,當孩子看到麻雀和燕子(刺激模式)時,家長告訴他這是鳥(反應模式),但很多時候,家長并不在身邊,比如,當孩子看到鴿子時,沒有外在反應模式指導,孩子仍能反應為鳥,人類似乎能夠在沒有外在的反應模式引導教育的情況下,學會分類。人工語法學習也是一樣,雖然在學習時,沒有被告知哪些合法,哪些不合法,但是被試仍能學會分類規則。這些事實提示研究者:必須開發一種沒有外在引導者的自適應模型。于是,McClelland 和Rumelhart(1985)在對模式聯系者稍做調整的基礎上,提出了模式聯系者的一個自適應特例――自動聯系者[7]。由于沒有外部引導,任何自適應模型必須具備自我反饋的功能,自動聯系者也一樣,如圖3所示,每個單元除了接收外部輸入(e)以外,還必須接收來自其他單元的內部輸入(i),這種存在內部反饋的模型被稱為循環模型。為了達到分類的目的,自動聯系者旨在再現單元的外部輸入模式,就好像人工語法學
圖3 含有8個單元的自動聯系者(資料來源:文獻[7])
習中,記憶字符串一樣。而為了達到這一點,必須調節連接權重,使單元的內部輸入能匹配外部輸入,用公式表示為:
aWj為單元j的激活量。雖然,自動聯系者模型沒有可比對的反應模式,但是,上述算法的核心仍是用內部狀態去匹配外部狀態,盡量減少兩者間的差異,因此,上述公式仍可看成delta法則*的變式。當然,除了使用delta法則來訓練自動聯系者外,也有研究者(例如,文獻[14])使用類似模式聯系者的Hebb法則訓練該模型。和模式聯系者一樣,自動聯系者也能習得不同的外部輸入模式,并對此做出分類。可見,自動聯系者能夠很好地模擬人工語法學習任務學習和測試階段的表面屬性――無外部引導的分類學習任務。然而,它是否能模擬語法學習這一內部屬性呢?
第三,人工語法學習的本質特征在于所獲得的是有關語法的知識。雖然,如前所述,自動聯系者獲得的是一種無法外顯的分布性表征的知識,但是,有意思的是這種表征似乎代表了某一類別的原型。而原型或許就好比語法的抽象表示方法。McClelland 和Rumelhart(1985)曾構建了一個由24個單元組成的自動聯系者,將一些有關狗的信息輸入這24個單元[7],其中前8個單元輸入的是狗的名字信息,后16個單元輸入的是狗的外貌信息,結果發現經過訓練后,模型的權重矩陣呈現出特殊的構造,即前8個單元之間及前3個單元與后16個單元間的權重處于隨機水平,而后16個單元間的權重卻出現某種固定的模式,McClelland和Rumelhart認為這種固定的模式就是狗視覺表象的原型。雖然,無法從這種固定的權重模式中,看出典型的狗應該具有哪些特征,但是至少可以認為,如果兩個單元間的連接權重比較大,那么當這兩個單元同時被激活時,模型有可能將目標判斷為狗。也就是說,原型所表征的是每個視覺特征間的聯系。這就好比,人工語法學習中的語法知識,語法或許是由字母間的聯系所表征的。所以,從這點意義上來,自動聯系者習得的原型或許就是語法知識。
3.2 序列學習和簡單循環網絡
序列學習任務要求被試對一系列規則序列進行選擇反應,其假設為:如果被試習得了序列間存在的固定規則,則他們可以依據前面呈現的序列來預測下一個項目是什么,成功的預測將會縮短被試的反應時[11]。序列學習和人工語法學習之間的本質區別在于:它是一項預測任務,而非分類任務,被試對某一項目的反應依賴于前面的項目。
1990年,Elman開發了簡單循環網絡,專門用來模擬這類預測任務[9]。簡單循環網絡的目的是根據當前輸入的項目來預測下一個項目,它的基本結構如圖4所示,由4個加工單元層組成,它們分別是輸入單元層、隱含單元層、上下文單元層和輸出單元層。輸入單元層用于表征當前輸入的項目,輸出單元層用于表征模型所預測的項目,上下文單元層用于表征在當前項目之前出現的項目序列,而隱含單元層負責在輸入、輸出和上下文單元層間的信息傳遞。簡單循環網絡的工作原理為:在接收第一
圖4 簡單循環網絡的基本結構(資料來源:文獻[16])
個項目時,輸入層中的某些單元被激活,并將激活傳遞給隱含層中的單元,隱含層除了將激活進一步傳遞給輸出層,由輸出層預測第二個項目外,還將自己的激活水平復制于上下文層,當接收第二個項目時,隱含層除了收到來自輸入層的激活外,還將收到來自上下文層的激活,因此,它向輸出層傳遞的激活則包含了第一和第二兩個項目的信息,依此類推,輸出層所做出的預測是基于包含當前項目之內的所有項目的信息。當然,和其他許多人工神經網絡模型一樣,簡單循環模型依據delta法則來調整權重的,即將模型給出的預測與真實出現的后續項目進行比較,來調整權重。不過,簡單循環網絡所使用的delta法則和自動聯系者有兩點差異:(1)權重調整是通過斜率遞減法進行的,即尋求預測反應和真實項目之間誤差方差的最小值,用公式表示為:
其中,tout為真實的正確輸出,aout為模型的預測輸出;(2)不同于自動聯系者,簡單循環網絡是多層模型,當調整輸出層單元和隱含層單元間的權重時,計算預測和真實項目間的誤差方差是可以直接計算獲得的,然而當要調整隱含層單元與輸入層單元或上下文層單元間的權重時,由于不存在真實的正確反應,誤差方差則無從計算,所以Rumelhart和McClelland(1986)提出可以用輸出層單元的誤差來估計隱含層單元的誤差,即某一隱含單元的誤差為所有與之連接的輸出層單元的誤差與它們之間權重乘積求和的函數[6]
然后,同樣用斜率遞減法求出權重的變化量,這種誤差計算的法則和簡單循環網絡中原有的信息流方向正好相反,所以又被稱為逆向推導。
簡單循環網絡能有效地模擬序列學習中的預測機制,因此,它剛提出不久,就被用于模擬內隱序列學習,用來研究序列學習的抽象性等問題[13,15,16]。
總之,針對不同的內隱學習任務,為了得到更佳的模擬效果,研究者往往傾向于選擇不同人工神經網絡模型加以模擬。然而,就像是任務之間的劃分并不絕對一樣(比如:Cleeremans等就曾將人工語法和序列學習結合在同一個任務中),神經網絡模型和內隱學習任務間的匹配也并不絕對,比如:Boucher等(2003)就層用簡單循環網絡來模擬序列學習[17]。
4 小結
基于權重調整來學習正確反應的人工神經網絡模型和內隱學習的兩大本質特征間有著極優的匹配,人工神經網絡模型在內隱學習領域的適用性毋庸置疑。在這樣的背景下,出于深入探討內隱學習的目的,研究者紛紛根據不同的內隱學習任務,選用不同的人工神經網絡模型對之加以模擬[18]。到目前為止,針對兩種較為普遍的內隱學習任務,也相應地出現了兩種使用較為廣泛的神經網絡模型――自動聯系者和簡單循環網絡。在實際研究中,合理地使用這兩個模型,必將為內隱學習的理論和人工模擬提供更有力的證據。
參考文獻
[1] Cleeremans A. Mechanisms of Implicit Learning: Connectionist Models of Sequence Processing. In: Jeffrey L E ed. Neural Network Modeling and Connectionism. London: MIT Press, 1993
[2] Dienes Z, Perner J. Implicit knowledge in people and connectionist networks. In: Underwood G.. Implicit cognition. Oxford: Oxford University Press, 1996
[3] McLeod P, Plunkett K, Rolls E T. Introduction to Connectionist Modelling of Cognitive Processes. Oxford: Oxford University Press, 1998
[4] Milner P. A Brief History of the Hebbian Learning Rule. Canadian Psychology, 2003, 44(1): 5~9
[5] Rosenblatt F. The perceptron: A probabilistic model for information storage and organization in the brain. Psychological Reviews, 1958, 65: 386~408
[6] Rumelhart D, McClelland J. Parallel distributed processing (vol. 1). Cambridge: MIT press, 1986a
[7] McClelland J, Rumelhart D. Distributed Memory and the Represantation of General and Specific Information. Journal of Experimental Psychology: General, 1985, 114(2): 159~188
[8] Jordan M. An introduction to linear algebra in parallel distributed processing. In: Rumelhart D, McClelland J ed. Parallel distributed processing (vol. 1). Cambridge: MIT press, 1986a. 365~422
[9] Elman J. Finding structure in time. Cognitive Science, 1990, 14(2): 179~212
[10] Reber A S. Implicit learning of artificial grammars. Journal of Verbal Learning and Verbal Behavior, 1967, 6(2): 317~327
[11] Nissen M J, Bullemer P. Attentional requirement of learning: Evidence from performance measures. Cognitive Psychology, 1987, 19(1): 1~32
[13] 郭秀艷, 鄒玉梅, 李強等. 中學生顏色內隱學習特征的實驗研究. 心理與行為研究, 2003, 1(2): 122~127
[14] Cleeremans A, McClelland J L. Learning the Structure of Event Sequence. Journal of Experimental Psychology: General, 1991, 120(3): 235~253
[15] Dienes Z. Connectionist and Memory-Array Models of Artificial Grammar Learning. Cognitive Science, 1992, 16(1): 41~79
[16] Jiménez L, Méndez C, Cleeremans A. Comparing Direct and Indirect Measures of Sequence Learning. Journal of Experimental Psychology: Learning, Memory, and Cognition, 1996, 22(4): 948~969
[17] Dienes Z, Altmann G, Gao S J. Mapping across Domains Without Feedback: A Neural Network Model of Transfer of Implicit Knowledge. Cognitive Science, 1999, 23(1): 53~82
關鍵詞:供需平衡;可持續發展;BP神經網絡
中圖分類號:F2
文獻標識碼:A
文章編號:1672.3198(2013)04.0060.02
人與自然的矛盾,發展與限制的矛盾逐漸被人們所認識,現已經成為研究的熱點。可持續發展的概念就是在這樣的背景下提出的。我國的房地產業正逐漸發展成為國民經濟支柱產業之一,因此研究房地產經濟的可持續發展問題具有非常重要的戰略意義。
1問題分析
住房需求與住房供給,二者之間相關制約、相互關聯,它們是房地產行業的兩大基本特征。住房需求和供給都是眾多影響因素共同作用的結果,需求量和供給量僅僅是其外在體現。同時,他們的主要影響因素不完全一致,即使對于相同因素,其影響的方向和程度也不盡相同。因此,需求與供給各自孤立的發展,可能就會導致住房的供不應求或者供過于求現象,這都會影響房地產行業的穩定。
因此,本文將住房需求和供給的合理匹配與協調,視為房地產行業可持續發展的基本條件。需求和供給的協調程度的度量(簡稱協調度)定義如下:
式中,ρ(t)為第t期住房供需協調度;D(t)為第t期的需求,S(t)為第t期的供給。
顯然,供需協調協調度為無量綱。特別地,當D(t)=0或S(t)=0時,ρ(t)=0;當D(t)=S(t)時,ρ(t)=1。該系數的取值范圍為,且絕對值越大,意味著供需越協調。
基于以上分析,房地產行業的可持續發展問題可以描述為:通過控制住房需求影響因素以及住房供給影響因素的變化,達到需求和供給在一定容許范圍內協調。換句話說,原問題轉化為經典的控制問題。本文的控制策略調是單因素控制,也即是每次僅控制一個輸入,保持其他輸入不變。
2 模型建立
2.1 BP網絡模型
人工神經網絡是許多具有非線性映射能力的神經元組成,神經元之間通過權系數相連接,信息分布式存儲于這些連接權系數中,使得網絡具有很高的魯棒性和容錯性,能夠解決噪聲干擾等影響。本文建立基于神經網絡的房地產行業可持續發展模型。
房地產行業可持續發展神經網絡模型,本文選擇反饋型的Hopfield網絡結構,如圖1所示,包含一個輸入層、一個隱含層和一個輸出層。其中:
(1)輸入層神經元:需求影響因素和供給影響因素,共N個(相同影響因素算為一個),神經元分別記為{Z1,Z2,…,ZN};
(2)輸出層神經元:實際代表協調度,僅一個;
(3)隱含層神經元:個數為M,神經元記為{H1,H2,…,HM}。
3 模型求解
3.1輸入層神經元的確定
根據文獻[2]分析,選取城鎮總人口數、商品房銷售價格、城鎮家庭恩格爾系數三項因素作為四川省住房需求影響因素;根據文獻[3]分析,選取城市人均住宅建筑面積和城鎮家庭恩格爾系數兩項作為供給影響因素。因此,BP神經網絡的輸入層神經元為:城鎮總人口數;商品房銷售價格;城鎮家庭恩格爾系數;城市人均住宅建筑面積,共四個。
3.2訓練樣本的確定
由于1998年我國取消福利分房推行住房分配貨幣化,本文將研究時段取為1998-2010年,具體為國家統計局網站上查詢的年度數據。
對應的的輸出,按照式(1)計算協調度。經計算,2008年的協調度最小。以該樣本作為模型的測試樣本,設定協調度閾值為0.85。每次僅控制一個輸入,保持其他輸入不變。經編程,分別計算四個輸入的調整量,分別為:-3346、-295、-2.94、1.71。
4 結語
本文研究了房地產行業的可持續發展問題。研究思路為:將住房需求和供給的合理匹配與協調,視為房地產行業可持續發展的基本條件,并引入需求和供給的協調度概念,在此基礎上,將該問題轉化為控制問題:通過控制住房需求影響因素以及住房供給影響因素的變化,滿足協調度在一定容許范圍內。基于BP神經網絡,建立需求供給因素的反饋控制模型。實例計算驗證了模型的可行性。
參考文獻
[1]邊肇慶,張學工.模式識別[M].北京:清華大學出版社,2000.
[2]張莉莉.四川省住房需求逐步回歸模型研究[J].現代商貿工業,2012,(13):56.57.
關鍵詞:自主角色; 神經網絡; 遺傳算法
中圖分類號: TP183
文獻標識碼:A
0引言
隨著計算機圖形學和硬件技術的高速發展,計算機游戲近十幾年也取得了很大的發展,游戲軟件已成為軟件產業中非常重要的內容。游戲的類型主要包括FPS(第一人稱射擊)、RPG(角色扮演類型)和RTS(即時戰略游戲)等幾種類型,這些不同類型的游戲都要求游戲控制的角色(NPC)與玩家控制的角色(PLAYER)要有行為的交互,交互的方式直接影響玩家對游戲的興趣度。因此,對NPC與PLAYER之間的角色交互行為方式的研究已經成為游戲軟件中的一個非常重要的研究課題。
目前大多數游戲中的角色行為的交互方式采用的是確定型的交互行為,其特征主要表現在角色的行為都是預先確定的,這種類型的行為實現起來較為簡單,也是目前大多數游戲所采用的交互方式。像這種確定性的行為往往體現不出角色的自主性,而且還會導致角色行動單調乏味,其行動很容易被玩家所預測,降低游戲的可玩性。為此,我們需要在游戲軟件中設計和實現這樣的NPC角色,它能夠根據當前環境的變化以及以往的經驗知識來動態地改變對PLAYER的行為。具有這種能力的角色,我們稱之為自主角色,也稱為自適應角色。具有自主和自適應特點的角色可具有推理能力和自適應能力,在游戲環境下可更受玩家的歡迎。
一款擁有自主角色的游戲能夠牢牢地吸引玩家的注意力,從而延長這款游戲的生命周期,因此促使游戲開發人員花更多的時間來研究自主角色的實現。一些公司已經開始嘗試從人工智能領域發展出更加高級的技術,如采用決策樹或者強化學習來實現角色的自主性,也有的像著名的游戲Colin McRae Rally2則采用了學習系統和神經網絡來實現角色的自主性。
有關自主角色行為的論文已經有很多做出了卓有成效的成績,如在Reynolds的文獻[1]中,對自主角色的群體行為進行了描述。Blumberg和Galyean[2]中引入更多的行為控制機制,并考慮了行為學習這樣一個令人感興趣的問題。對于自主角色的更高層次的認知能力方面,John David Fungc[3]中指出,認知模型是用于創建虛擬世界的模型“金字塔”的頂層,底層的行為模型作為認知模型和物理學模型之間的緩沖區,并將情景演算(situation calculus)[4]用于高度動態的虛擬世界。
但是,上述各種方法因為側重點不同,各有優缺點,且相互之間較為獨立,因此本文結合上述一些方法的優點,在此基礎上提出了基于認知角色建模,采用神經網絡和遺傳算法相結合的游戲自主角色的設計思路。基于此,各小節安排如下:
第一節確定了基于認知建模方法的游戲自主角色模型;第二節介紹了神經網絡在實現自主角色中的應用;第三節說明了遺傳算法對神經網絡的優化;第四節對自主角色的實驗進行了分析。
1基于認知建模的角色自主性模型
由于認知建模方法能夠采用精確的數學方式來定義自主角色的行為和學習模式,因此本文采用認知建模方法來對游戲角色的自主性進行建模。這里將游戲中存在的非玩家控制的角色簡稱為NPC,通過認知建模方法研究NPC的高級行為規劃,指導NPC,提高NPC的智能水平能力,使NPC能夠對環境作出判斷,并根據當前的狀態進行推理,進而完成相應的行動序列,有利于創建聰明自主的智能體――具有認知能力的自主的角色。
在計算機游戲中,我們將游戲角色關于他所在世界的內部模型稱“認知模型”(Cognitive Model)。認知模型可以用于游戲中,控制一類自主的角色。通過認知模型支配游戲角色對其所在環境的了解程度,如何獲取知識,以及如何利用知識選擇行動。
NPC的行為分為“預定義的”和“非確定性的”兩種,建立的認知模型也各不相同。建立預定義行為的認知模型比較簡單,只要將事先定義好的NPC所在環境的領域知識賦予NPC系統,NPC就可以根據人們的要求采取某種行動。而非確定性的行為不容易控制。為了實現人為的控制,我們采取一種折中的方法,即將領域知識和人的指導賦予NPC,使NPC主動地向人們希望它達到的目標發展。可由下面的公式表示:
知識+指導=行為
領域知識能夠用來規劃目標,而指導對如何達到目標提供一種框架計劃。
當然NPC在決定采取什么樣的行動時并不需要整個虛擬世界的知識。所以,我們認為NPC的認知模型是角色對其虛擬世界的一種內部簡化模型〔simplified model〕。
為此我們在現有游戲系統之上營造一個通過認知模型定義的高級行為規劃器來實現對NPC的行為指導。規劃器模型設計如圖1所示。
NPC的預定義行為和非確定行為都可以形式化為認知模型,通過認知模型來指導NPC高級行為規劃器,由于神經網絡在非確定中的強大的學習作用,因此本項目通過神經網絡來實現NPC高級行為規劃器的三個方面:目標引導、行為協調、約束滿足。
2基于人工神經網絡的角色自主系統
這里,我們采用的是神經網絡中的BP網絡作為NPC的感知系統。BP算法是一種用于多層前向網絡的學習算法,它包括輸入層、輸出層和隱含層,隱含層可以是多層結構。BP網絡的學習過程包括兩個階段:第一階段計算前向輸出;第二階段從反向調整連接權矩陣。
在前向傳播過程中,輸入信息從輸入層經隱含層逐層處理,并傳向輸出層,每一層神經元的輸出作為上層神經元的輸入.如果在輸出層,實際輸出值與期望輸出值有誤差時,則以反向將誤差信號逐層修改連接權系數并且反復迭代,最后使實際輸出值與期望值的均方差為最小。在修正連接權系數時,通常采用梯度下降算法。
BP神經網絡使用的是指導式的學習方法,即在學習過程中,向網絡提供有明確輸入和輸出目標的樣本對。BP學習算法是基于最小二乘法LMS 算法,運用梯度下降方法,使網絡的實際輸出與期望輸出的均方差最小。網絡的學習過程是一種誤差邊向后傳播邊修正連接權的過程。因為BP網絡對以分類為主要目的的學習非常有效,所以,我們采用B P網絡進行NPC分類的自學習。需要輸入NPC自主系統中BP網絡的特征參數主要是NPC的生命值,NPC的攻擊力,NPC的防御力,NPC的情感值等,玩家虛擬角色的生命值,玩家虛擬角色的攻擊力,玩家虛擬角色的防御力,玩家虛擬角色的情感值等。
NPC在虛擬游戲環境下,在與玩家的不斷交互中刺激著感知系統,在外界環境發生變化時產生認知模型指導下的自主行為,通過神經網絡最終演化成具有自主性的行為系統,同時,利用遺傳算法使適應度有一定程度的增加,使NPC更適應外界環境的變化。關于NPC的感知系統的設置如下:
1) 輸入參數的確定
NPC的感知系統由人工神經網絡構成,虛擬游戲環境的特征參數作為輸入送入神經網絡進行學習。在我們的游戲項目中,輸入主要包括三種類型:布爾類型、枚舉類型和連續類型三種,但是這三種類型都需要轉化成神經網絡所認可的實數類型。
2) 權重的確定
權重有些類似于生物神經網絡的樹突聯結,權重影響了輸出變量的值,并且定義了神經網絡的行為,實際上訓練或者演化神經網絡的主要目標就是確定NPC神經網絡的權重。為了確定每個輸入參數的權重,需要確定激活函數。
3) 激活函數的確定
激活函數確定了輸入與輸出參數之間的映射關系,針對NPC自主角色的神經網絡,我們采用的是非線性激活函數,具體采用的是S型激活函數。
3基于遺傳算法的神經網絡優化
神經網絡的基本特征是大規模并行處理、容錯性、自適應性和自組織性,適合處理直覺和形象思維信息。神經網絡與遺傳算法的結合使神經網絡的訓練有了一個嶄新的面貌,目標函數既不要求連續,也不要求可微,僅要求該問題可計算,而且它的搜索始終遍及整個解空間,因此容易得到全局最優解。用遺傳算法優化神經網絡,可以使得神經網絡具有自進化、自適應能力,從而構造出進化的神經網絡(ENN)[5]。
研究NPC的進化,要建立NPC在虛擬環境中進行的各種行為模型。另外,同虛擬環境本身也會發生競爭。由于適應度是NPC競爭力大小的直接反映,為了建立NPC的競爭機制,首先要建立NPC的適應度函數。
首先,NPC的適應度函數和NPC的種類相關。在同一環境下,不同NPC的適應度肯定是不相同的[6]。同時,為了表現NPC自學習對進化的影響,有了學習能力的同種NPC適應度的取值也有所不同。其次,NPC的適應度還與其所處的不同階段有關。適應度取值在其不同階段中不是一成不變的。
在環境不發生變化時,NPC的適應度函數F(t)可以用此函數表示:
其中,參數a表示NPC的生命力值;參數k表示NPC的類型,不同的NPC對同一游戲環境的適應性是不一樣的,當k取不同的值時,會得到適應度不同的各種NPC。接著按照以下工作步驟操作:
1) 從NPC神經網絡中提取權重向量;
2) 用遺傳算法演化出一個新的網絡權重群體;
3) 把新的權重插入到NPC神經網絡;
4) 轉到第一步進行重復,直至獲得理想的性能。
4試驗分析
我們的實驗測試場景如下:
在一個仿真的三維游戲環境下,游弋著若干個NPC角色和一個玩家控制的虛擬角色,主角可以漫游整個游戲場景,這些NPC當遇到主角后,可能會對主角采取不同的行為,比如攻擊行為,逃避行為,團隊作戰行為,對話行為等,所有這些行為的決策都取自于神經網絡的訓練。
在采用神經網絡算法之前,所有的NPC無論強弱,都會主動向玩家角色發起攻擊,而在采用神經網絡算法之后,這些NPC都具有了一個人工大腦,每個NPC在與玩家角色的交互過程不斷地學習,不斷地演化,最終變成自主角色,具體表現在:NPC根據以往與玩家角色交互過程中的經驗,從而產生較為理智的行為,比如當NPC感覺玩家的綜合實力要高于自己時,它可能會采取逃避的行為,而當NPC感覺其綜合實力要高于玩家時,它往往會主動攻擊玩家。
表1和表2列舉了應用神經網絡算法前后的測試數據。
應用神經網絡算法所采取的實驗方案如下:
(1) 對于NPC感知系統的輸入,包括與虛擬玩家角色的距離, 虛擬玩家的攻擊力,防御力,生命力,魔法力,信譽度,NPC自身的攻擊力,防御力,生命力,魔法力,信譽度。并將參數歸一化,使最終的參數范圍位于[-1, 1]之間;
(2) 對于NPC感知系統的輸出,包括躲避,單獨攻擊,潛伏,召喚同伴,團隊攻擊等行為。即將神經元的輸出元設計成五個,這些行為通過一些標志符來確定,例如, 如果代表攻擊的輸出位為1,則其他位為零。
通過對比兩組測試試驗,可以發現后一組試驗中,NPC能夠根據自己的實力和玩家的實力對比,理智的采取一些行為(比如退避,呼喚同伴協同作戰)而不是一味盲目攻擊, NPC的存活率顯然就很高,因此也顯得較為智能。
關鍵詞:電力系統;自動化控制;技術;應用
中圖分類號:TM73文獻標識碼: A 文章編號:
1.引言
目前狀況下,我國的經濟發展十分迅速,各種新科學、新技術層出不窮,這為電力系統的發展提供了良好的外部環境。而我國的電力系統也是不斷吸取新的科技,將之與電力系統相結合,取得了進一步的發展與完善。新興智能技術永遠都是電力系統發展的新鮮血液,它可以對電力系統結構方面的問題進行有效的解決。在這些技術當中,自動化控制技術的表現尤為突出,在電力系統的運行之中也有著十分重要的地位與作用。通過對自動化控制技術進行有效的利用,電力部門可以對自身的管理水平以及管理效率進行較大程度上的提高。電力與人們的生活息息相關,在人們的生產、生活當中有著十分廣泛的應用。而隨著人民生活水平的提高,對電能的穩定性、有效性提出了更高的要求。這就要求在電力系統之中不斷引入新技術,進一步提高其自動化水平。所以,對電力系統自動化控制技術及其進行研究與分析,可以對人力資本的投入進行一定程度的減小,同時又有效的提高了電力系統運行的效率,具有十分重要的現實意義。
2.電力系統的自動化控制技術
2.1 電力系統自動化的基本內容
對于電力系統自動化來說,它主要指的是先進的系統運行理念以及自動化程度較高的電力系統運行方法,其主要內容是電工的二次系統。換句話說,也就是指對各種裝置、信號系統以及數據傳輸系統進行有效的利用,一次來對電力系統之中的部分元件、局部系統或者是全部系統進行一定程度上的監視、協調以及控制,在這一過程中保證了高度的自動化水平。值得一提的是,在對系統進行監視、協調以及控制的過程之中,發揮作用的裝置具有三項基本功能,分別是自動檢測、自主決策以及自我控制。這樣一來,就可以對電力系統運行的安全性、穩定性進行有效的保證。
2.2 電力自動化系統的基本組成要素
電力系統在長期的發展過程當中,不斷對已有技術進行發展與更新,同時又引入新的技術,為其注入新鮮血液,當這種發展達到了一定階段,就形成了電力自動化系統。對于電力系統的自動化控制來說,它所涉及的內容較為廣泛,主要包含以下幾個方面的內容:首先是系統調度的自動化。在經濟迅速發展以及科學技術水平不斷提高的大環境之下,電力系統的自動化一直保持較高的優越性,而系統調度的自動化是其最為突出的表現,其功能主要是對與電力系統具有較大關聯的數據進行有效的采集與監控。除了系統調度自動化以外,它還包含了電力系統經濟運行與調度、電力市場運營與可靠性、發電廠運營決策、變電站綜合自動化等內容。電力自動化系統存在著多個方面、多個環節的自動化控制,而在這些自動化控制當中,調度的自動化是電力系統自動化當中的一項核心技術,具有基礎性地位,它可以對自動化系統運行的穩定性進行有效的保證。
2.3 變電站相關的自動化技術
在變電站的自動化技術之中,融合了多項先進技術,主要包含了計算機技術、現代電子技術、通信技術以及相應的現代信息處理技術。這些技術有機結合,融合成一個整體,有效的實現了對于變電站的二次設備的各種功能的重新優化與組合。對于這些二次設備來說,主要包含有繼電保護設備、控制設備、測量設備以及其他各種自動裝置等。通過對這些裝置進行有效的設置與優化,能夠對變電站的具體情況進行一定程度上的監視以及測量。除此之外,在發現存在異常情況時,可以及時的對其進行控制與調節。綜上所述:變電站的自動化系統具有較強的綜合性,可以對變電站設備的運行情況進行有效的監視、測量、控制與協調。
3.電力系統的自動化控制的各項基本技術
當前狀況下,我國經濟發展迅速,而且科學技術水平也取得了一定程度上的提高。相關的電力企業應當抓住機遇,引進新興技術,進一步對電力系統的運行質量以及運行效率進行有效的提高,以滿足人們對電力更高更嚴格的要求。下面我們對電力系統的自動化控制的各項基本技術進行一一闡述。
3.1 基于神經網絡控制基本原理的控制技術
從理論的角度來看,神經網絡控制存在著三項基本特征,它具有一定的非線性、并行處理性以及魯棒性。除了這三項基本特征之外,神經網絡控制還存在著一個十分顯著的特點,即自組織學習能力。神經網絡控制的這些特征與特點也正是其優點所在。其連接機理主要如下:將具有較大數量的神經元按照特定的方式進行有效的連接,這樣一來,在連接的權值之上就會隱含了大量的有效信息。然后,只需要通過相應的算法對權值進行一定程度上的調節。這樣一來,就可以實現神經網絡的復雜映射,主要是從一個維度的空間向另一維度的空間進行映射,而且這種映射是非線性的。
3.2 專家系統的基本控制技術
對于專家系統來說,它是電力系統之中使用范圍最廣的系統之一。它所涉及到的內容十分廣泛。它不僅包含了對處于警告狀態或者緊急狀態等特殊狀態下的辨別能力,同時在專家系統之中,還包含了對突發事件的緊急處理的能力、系統重新恢復控制的能力以及狀態的分析與轉換等。即使專家系統的應用已經十分廣泛,但它還是存在著一定的問題與弊端,具有較大的局限性,例如:無法進行對于電力專家創造性的有效模仿。
3.3 模糊邏輯控制的基本技術
這種模糊邏輯控制的基本技術主要是基于模糊方法理論之上的,相對于其他控制方法,它具有一定的簡易性,十分容易對其進行有效的掌握。然而,簡單并不意味著落后,它的先進性也是顯而易見,正因為如此,它在實踐之中有著十分廣泛的應用。
3.4 綜合智能控制技術
這種控制技術的最大特點表現在綜合性之上,它將智能控制技術、現代控制技術、自動化控制技術的相關理論以及基本方法進行有機的結合。這樣一來,將幾種先進的技術與先進的理念進行綜合,使其達到有效的合力,使得控制能力更強、效率更高。神經網絡與專家系統的結合,專家系統與模糊控制的結合,神經網絡與模糊控制的結合,神經網絡、模糊控制與自適應控制的結合是在電力系統中應用較為廣泛的基本方法。
4.結束語
本文主要針對電力系統的自動化控制技術與應用進行研究與分析。首先從電力系統自動化的基本內容、電力自動化系統的基本組成要素以及變電站相關的自動化技術三個方面介紹了電力系統的自動化控制技術。然后在此基礎之上,重點分析了電力系統的自動化控制的各項基本技術,主要有基于神經網絡控制基本原理的控制技術、專家系統的基本控制技術、模糊邏輯控制的基本技術、綜合智能控制技術。經過實踐證明,在電力系統之中運用自動化控制技術,可以有效的提高電力系統的穩定性、安全性以及高效性。希望我們的研究能夠給讀者提供參考并帶來幫助。
參考文獻:
[1] 李小燕,跖拓等. 電力系統自動化控制中的智能技術應用研究[J]. 華章,2011,(16).
[2] 唐亮. 論電力系統自動化中智能技術的應用[J]. 硅谷, 2008,(02).
[3] 夏永平,唐建春. 淺議電力系統自動化[J]. 硅谷, 2010,(06).
關鍵詞: 人工智能 足球機器人 人工神經網絡 智能控制
引言
足球機器人系統是一個典型的多智能體系統和分布式人工智能系統,涉及機器人學、計算機視覺[1]、模式識別、多智能體系統[2]、人工神經網絡[3]等領域,而且它為人工智能理論研究及多種技術的集成應用提供了良好的實驗平臺。機器人球隊與人類足球一樣,它的勝負不但取決于機器人本身的性能,而且取決于比賽策略,只有將可靠的硬件與先進的策略結合才能取勝。人工智能技術在足球機器人的平臺上有著重要的作用。從機器人的外觀到機器人最重要的核心部分——控制、決策,都無不起著重要的作用。專家系統[4]、人工神經網絡在機器人的路徑規劃[5]上得到充分的應用。
1.人工智能研究現狀
人工智能[6-8]是一門研究人類智能機理,以及如何用計算機模擬人類智能活動的學科,該領域的研究包括機器人、語言識別[9]、圖像識別、自然語言處理和專家系統等,涉及數理邏輯、語言學、醫學和哲學等多門學科。人工智能學科研究的主要內容包括:知識表示[10][11]、自動推理和搜索方法、機器學習和知識獲取、知識處理系統、自然語言理解、計算機視覺、智能機器人、自動程序設計等方面。
幾乎所有的編程語言均可用于解決人工智能算法,但從編程的便捷性和運行效率考慮,最好選用“人工智能語言”[12]。常用的人工智能語言有傳統的函數型語言Lisp、邏輯型語言Prolog及面向對象語言Smalltalk、VC++及VB等,Math-Works公司推出的高性能數值計算可視化軟件Matlab中包含神經網絡工具箱,提供了許多Matlab函數。另外,還有多種系統工具用于開發特定領域的專家系統,如INSIGHT、GURU、CLIPS、ART等。這些實用工具為開發人工智能應用程序提供了便利條件,使人工智能越來越方便地運用于各種領域。
智能機器人是信息技術和人工智能等學科的綜合試驗場,可以全面檢驗信息技術和人工智能等各領域的成果,以及它們之間的相互關系。人工智能技術中的視覺、傳感融合、行為決策、知識處理等技術,需要使無線通訊、智能控制、機電儀一體化、計算機仿真等許多關鍵技術有機、高效地集成統一。人們在很多領域都成功地實現了人工智能:自主規劃和調度、博弈、自主控制、診斷、后勤規劃、機器人技術、語言理解和問題求解等。
2.人工智能主要研究領域
人工智能的研究領域非常廣泛,而且涉及的學科非常多。目前,人工智能的主要研究領域包括:專家系統、機器學習、模式識別、自然語言理解、自動定理證明、自動程序設計、機器人學、智能決策支持系統及人工神經網絡等。下面主要介紹在足球機器人設計、制造、控制等過程中常用的人工智能技術[13]。
2.1專家系統
專家系統是一個智能計算機程序系統,是一個具有大量專門知識與經驗的程序系統,它應用人工智能技術和計算機技術,根據某領域一個或多個專家提供的知識和經驗,進行推理和判斷,模擬人類專家的決策過程,以便解決那些需要人類專家處理的復雜問題。專家系統一般具有如下基本特征:具有專家水平的專門知識;能進行有效的推理;具有獲取知識的能力;具有靈活性;具有透明性;具有交互性;具有實用性;具有一定的復雜性及難度。
2.2人工神經網絡
人工神經網絡是由大量處理單元互聯組成的非線性、自適應信息處理系統,采用了與傳統人工智能和信息處理技術完全不同的機理,克服了傳統的基于邏輯符號的人工智能在處理直覺、非結構化信息方面的缺陷,具有自適應、自組織和實時學習的特點。神經網絡在很多領域已得到了很好的應用,但其需要研究的方面還很多。其中,具有分布存儲、并行處理、自學習、自組織和非線性映射等優點的神經網絡與其他技術的結合,以及由此而來的混合方法和混合系統,已經成為一大研究熱點。由于其他方法也有優點,因此將神經網絡與其他方法相結合,取長補短,可以達到更好的應用效果。目前這方面工作有神經網絡與模糊邏輯、專家系統、遺傳算法、小波分析、混沌、粗集理論、分形理論、證據理論和灰色系統等的融合。
2.3圖像處理
圖像處理是用計算機對圖像進行分析,達到所需結果,又稱影像處理。圖像處理技術主要包括圖像壓縮,增強和復原,匹配、描述和識別三個部分。常見的處理有圖像數字化、圖像編碼、圖像增強、圖像復原、圖像分割和圖像分析等。數字圖像處理中的模式識別技術,可以對人眼無法識別的圖像進行分類處理,可以快速準確地檢索、匹配和識別出各種東西,在日常生活各方面和軍事上用途較大。
3.人工智能在足球機器人中的應用
3.1基于專家系統的足球機器人規劃
路徑規劃或避碰問題是足球機器人比賽中的一個重要環節。根據工作環境,路徑規劃模型可分為基于模型的全局路徑規劃和基于傳感器的局部路徑規劃。全局路徑規劃的主要方法有:可視圖法、自由空間法、最優控制法、柵格法、拓撲法、切線圖法、神經網絡法等。局部路徑規劃的主要方法有:人工勢場法、模糊邏輯算法、神經網絡法、遺傳算法[14]等。機器人規劃專家系統是用專家系統的結構和技術建立起來的機器人規劃系統。大多數成功的專家系統都是以基于規則系統的結構來模仿人類的綜合機理的。它由五部分組成:知識庫、控制策略、推理機、知識獲取、解釋與說明。隨著人工智能計算智能與進化算法研究的逐步發展,遺傳算法、蟻群算法等的提出,機器人路徑規劃問題得到了相應發展。尤其是通過遺傳算法在路徑規劃中的應用,機器人更加智能化,其運行路徑更加逼近理想的優化要求。以動態、未知環境下的機器人路徑規劃為研究背景,利用遺傳算法采用了基于路點坐標值的可變長染色體編碼方式,構造了包含障礙物排斥子函數項的代價函數,使得路徑規劃中的地圖信息被成功引入到了遺傳操作的實現過程中。同時針對路徑規劃問題的具體應用,改進了交叉和變異兩種遺傳算子,獲得了較為理想的路徑搜索效率,達到了較好的移動機器人路徑規劃效果。
3.2人工神經網絡在機器人定導航中的應用
人工神經網絡是一種仿效生物神經系統的信息處理方法,其優點主要體現在它可以處理難以用模型或規則描述的過程和系統;對非線性系統具有統一的描述;有較強的信息融合能力。因此在移動機器人定位與導航方面,基于神經網絡的多傳感器信息融合正是利用了神經網絡的這些特性,將機器人外部傳感器的傳感數據信息作為神經網絡的輸入處理對象,從而獲得移動機器人自身位置與對障礙物比較精確的估計,實現移動機器人的避障與自定位。
結語
隨著人工智能技術的進一步研究,足球機器人競賽水平將不斷提高。但就目前情況來看,在現有的基礎上擴大應用的范圍,增強應用的效果,還應主要在人工智能技術上做進一步的研究。專家系統在專家知識的總結、表述及不確定的情況下推理是目前專家系統的瓶頸所在。制造生產的多變復雜性及操作的人工經驗性,使人工智能的應用受到限制。此外,一些工藝參數的定量化實現也不易。隨著技術的飛速發展,人工智能技術也在進一步完善,如多種方法混合技術、多專家系統技術、機器學習方法、并行分布處理技術等。隨著新型人工智能技術的出現,制造業將會更加光明,性能更加優越的足球機器人也不再遙遠。
參考文獻:
[1]鄭南寧.計算機視覺與模式識別[M].北京-國防工業出版社,1998.3.
[2]Wang Hongbing Fan Zhihua She Chundong Formal Specification of Role Assignment for Open Multi Agent System Chinese of Journal Electronics[J].2007,16(2):212-216.
[3]LIMING ZHANG AND FANJI GU NEURAL INFORMATION PROCESSING VOLUME 1[M]Fudan University Press, 2001.
[4]Cai Zixing,King-Sun Fu. Expert-System-Based Robot Planning ?Control Theory & Applications[J] .1988(2): 35-42.
[5]張銳,吳成東.機器人智能控制研究進展[J].沈陽建筑工程學院學報(自然科學版),2003,19(1):61-64.
[6]蔡自興,徐光祐.人工智能機器應用(第三版)清華大學出版社,2004.
[7]艾輝.謝康寧,謝百治.談人工智能技術[J]中國醫學教育技術,2004,18(2):78-80.
[8]Nilsson NJ.Artificial Intelligence:A New Synthesis[M].Beijing:China Machine Press,2006:72-95.
[9]Han Jiqing Gao Wen Robust Speech Recognition Method Based on Discriminative Environment Feature Extraction Journal of Computer Science and Technology[J]. 2001;16(5):458-464.
[10]Tang Zhijie Yang Baoan Zhang Kejing Design of Multi-attribute Knowledge Base Based on Hybrid Knowledge Representation Journal of Donghua University 2006,23(6):62-66.
[11]Hu Xiangpei Wang Xuyin Knowledge representation and rule——based solution system for dynamic programming model Journal of Harbin Institute of Technology 2003,10(2):190-194.
[12]姚根.人工智能的概況及實現方法[J] .2009,28(3):108.
關鍵詞:認知雷達;發展前景
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2014)20-4720-02
Introduction to Cognitive Radar
ZHANG Qi-wen, LIU Zhong-yi
(Radar Department of Navy Submarine Academy, Qingdao 266042,China)
Abstract: Cognitive radar is a new concept of radar, in this paper the development of cognitive radar, definitions, and the development direction of the future are expounded.
Key words: Cognitive radar; development trend
大腦視覺是一個強大的并行化信息處理機,具有完成某些任務如高可靠的目標檢測和高精度的目標跟蹤、其運行速度遠超任何傳統雷達系統的內在能力。盡管大腦視覺和傳統雷達之間存在許多不同之處,但他們共享同一特征:他們都是外部世界(環境)的觀察者,雷達是一個通過發射探測信號給環境的主動感知器,然后基于雷達回波進行決策處理得到環境場景[1]。作為一個主動感知器,雷達用于認知雷達回波,并據此發射相應的雷達探測信號。關鍵問題是:我們如何學腦視覺來顯著地增強傳統雷達的信息處理能力這個基本問題的答案在于認知,因此認知雷達(CR)的創新理念源于蝙蝠回波定位系統。注意力集中在大腦視覺己有大量地神經科學方面的視覺系統的文獻[2]。
1 發展歷程
從傳統雷達到認知雷達(CR),最初的進化過程的描述是Kershaw和Evans[4]。在這篇論文中, 增加了從接收機到發射機的鏈接,雖然是離線方式,則系統轉變為一個閉環雷達反饋系統,此后這種雷達看成一類提前主動雷達(FAR)[3]。
由此雷達可以分為三類:
傳統主動雷達(TAR), 工作在前饋方式;TAR包括接收機中使用自適應濾波器(卡爾曼濾波器) 進行迭代狀態估計,及與發射波形匹配的接收處理。
提前―主動雷達(FAR), 區別在于使用了連接接收機到發射機的反饋鏈路, 在雷達文獻中, 這種雷達定義為完全自適應, 它的全局反饋, 包括環境在內的反饋環路, FAR包括接收機中使用自適應濾波器和發射機中自適應波束形成。在控制理論方面, 反饋便于智能化;因此也可以認為完全自適應雷達是一個受限的智能系統, 它是向認知雷達邁出的切實可行的第一步。
認知雷達(CR),它既不同于TAR, 也不同于FAR。主要表現在它能從與環境反復作用所獲取的經驗中進行自組織的學習能力,該能力必將發揮重要的作用。
有表1可以看出,大型腦網絡的認知,人類認知傳統觀點,人腦看成模塊化范式,被認定為執行各個專門功能的獨立處理器。然而,認知神經科學發現了大腦區域的功能是相互作用的,它以一種大型網絡的方式工作在一起。大腦皮層在認知的信息處理中發揮關鍵的作用, 皮層微柱是皮層的基本功能單元, 感知的任務是在整個皮層區域完成的。Fuster 提出了大腦皮層中用于知識表示的“認知”的概念,此外, 進一步提出了認知的抽象模型,即感知、記憶、注意力、智力和語言。后來,Sporns 等考慮到涉及多個學科的腦網絡的復雜性, 擴展了腦區的功能的新范式。這里涉及的學科從生物到物理、社會學到信息學[6]。基于此,強調了如何研究復雜網絡的結構和動力學才會有助于理解大腦和認知功能, 并嘗試確定未來的信息處理領域實驗與理論探討。
控制論是研究調節系統的基礎結構,主要是信息、控制和系統方面的理論,適用于閉環反饋調節系統,其因果循環關系是控制論的基本特征。1948年,維納對控制論進行了描述,主要研究動物(人)和機器方面的控制和通信。McCulloch發展了控制論,1953年,提出了人工神經網絡。Walter實現了初期的自適應機器人,能簡單地模仿動物和人的大部分基本行為。
人工神經網絡,長期與外部世界相互作用中進行學習的能力是大腦的一個鮮明特征。為了建立模仿人的學習模型,一種常用的方法是訓練一個人工神經網絡,它是由一組稱之為神經元的計算單元組成。對于給定的神經網絡,利用監督學習或無監督學習,算法上模仿其學習過程。
受大腦視覺啟發,我們提出了一種新的將認知可控的傳感引入雷達系統的途徑。認知雷達的構建是基于感知―執行周期,它是認知的初始階段。感知部分基于貝葉斯濾波器和尋求貝葉斯最優性;執行部分基于貝爾曼動態規劃下的最佳控制器。將記憶和注意力加入到感知―執行周期中,雷達能夠達到的性能水平可以理解為真正意義上體現了智能行為。
2 認知雷達的定義
具有感知周圍環境能力的智能、動態閉環系統。其通過先驗知識以及對環境的交互學習來感知環境,在此基礎上,實時的調整發射機和接收機適應環境的變化,以有效地、可靠地、穩健地達到預定的目標。其主要包括三個基本要素:
1) 智能信息處理。它的主要任務是通過與環境的不斷交互,獲得并提高雷達對環境的認知;
2) 接收機到發射機的信息反饋。接收機截獲雷達信號,經智能信息處理得到目標信息,然后將其反饋給發射機,使得發射機能夠自適應調整發射信號,以期望提高整機性能;
3) 雷達回波數據的存儲。通過更多雷達回波的積累效果,以提高雷達認知環境的精確程度。
3 認知雷達的未來發展方向
盡管對認知雷達的研究取得了一定的進展但至今還沒有認知雷達的問世,編者認為網絡化是未來雷達發展的重要方向。多部雷達互相合作可實現遠程感知能力。認知雷達網絡、可采用分布式(每部雷達都有認知功能)或集中式(設有中心基站,只有該中心基站具有認知功能),將認知雷達和傳統雷達組網概念結合,即可充分利用傳統雷達組成網絡的節點,提高雷達系統的綜合能力的同時降低了成本,而網絡節點上的單部雷達可以是傳統雷達,也可以是具有接收系統的被動雷達[5]。
參考文獻:
[1] B. R. Frieden, Science From Fisher Information: A Unification. Cambridge, U.K.: Cambridge Univ. Press, 2004.
[2] S. Haykin, Cognitive radar: A way of the future, IEEE Signal Process. Mag., vol. 23, no. 1, pp. 30-40, Jan. 2006.
[3] S. Haykin, New generation of radar systems enabled with cognition, presented at the IEEE Radar Conf., Arlington, VA, May 2010, Keynote Lecture.