前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的神經網絡提取特征主題范文,僅供參考,歡迎閱讀并收藏。
關鍵詞:圖像分類;深度學習;Caffe框架;卷積神經網絡
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2016)35-0209-03
Research and Implementation of Image Classification Based on Convolution Neural Network
WANG Chao
(Information Engineering Institute,East China University of Technology, Nanchang 330013, China)
Abstract: The problem of image classification has been the core problem in computer vision. A good solution is developed by further study which can solve the problem of extracting image features in image classification. In order to learn image features efficiently, constructing the machine learning model with hidden layer as well as training a large number of image data will eventually promote the accuracy of image classification or prediction. This paper is intended as an in-depth Caffe learning framework to construct a small image data-base. The convolutional neural network provided by Caffe framework will make a training analysis of the data set and then extract the information of target image features. These can be used for the final prediction of the target image. Compared with the traditional image classification algorithm, the accuracy of the prediction will be greatly improved.
Key words: image classification; deep learning; Caffe framework; Convolutional Neural Network
S著計算機與互聯(lián)網技術的快速發(fā)展,我們已經進入了一個以圖像構建的世界。但是面臨有海量圖像信息卻找不到所需要的數據的困境,因而圖像分類技術應運而生。通過各種機器學習算法使計算機自動將各類圖像進行有效管理和分類,但是由于圖像內容包含著大量復雜且難以描述的信息,圖像特征提取和相識度匹配技術也存在一定的難題,要使得計算機能夠像人類一樣進行分類還是有很大的困難。
深度學習是近十年來人工智能領域取得的重要突破,在圖像識別中的應用取得了巨大的進步,傳統(tǒng)的機器學習模型屬于神經網絡模型,神經網絡有大量的參數,經常會出現過擬合問題,因而對目標檢測準確率上比較低。本文采用卷積神經網絡框架,圖像特征是從大數據中自動學習得到,而且神經網絡的結構深由很多層組成,通過重復利用中間層的計算單元來減少參數,在特征匯聚階段引入圖像中目標的顯著信信息,增強了圖像的特征表達能力。通過在圖像層次稀疏表示中引入圖像顯著信息,加強了圖像特征的語義信息,得到圖像顯著特征表示,通過實驗測試,效果比傳統(tǒng)的圖像分類算法預測的準確度有明顯的提升。
1 基于卷積神經網絡的圖像分類方法
1.1 人工神經網絡
人工神經網絡(Artificial Neural Network, ANN)是描述生物神經網絡運行機理和工作過程的抽象和簡化了的數學物理模型,使用路徑權值的有向圖來表示模型中的人工神經元節(jié)點和神經元之間的連接關系,之后通過硬件或軟件程序實現上述有向圖的運行[1]。目前最典型的人工神經網絡算法包括:目前最典型的人工神經網絡有BP網絡 [2]Hopfield網絡[3]Boltzmann機[4]SOFM網絡[5]以及ART網絡人工神經網絡[6],算法流程圖如圖1所示[7]。
1.2 卷積神經網絡框架的架構
Caffe是Convolutional Architecture for Fast Feature Embedding的縮寫[8],意為快速特征嵌入的卷積結構,包含最先進的深度學習算法以及一系列的參考模型,圖2表示的是卷積神經網絡結構圖。Caffe深度學習框架主要依賴CUDA,IntelMKL,OpenCV,glog軟件以及caffe文件。本文使用的各個軟件版本說明,如表1所示。
Caffe深度學習框架提供了多個經典的卷積神經網絡模型,卷積神經網絡是一種多層的監(jiān)督學習神經網絡,利用隱含層的卷積層和池采樣層是實現卷積神經網絡特征提取功能,卷積神經網絡模型通過采取梯度下降法最小化損失函數對網絡中的權重參數逐層反向調節(jié),通過頻繁的迭代訓練來提高網絡的精度。卷積神經網絡使用權值共享,這一結構類似于生物神經網絡,從而使網絡的復雜程度明顯降低,并且權值的數量也有大幅度的減少,本文使用這些模型直接進行訓練,和傳統(tǒng)的圖像分類算法對比,性能有很大的提升,框架系統(tǒng)訓練識別基本流程如圖3表示。
1.3 圖像分類特征提取
卷積神經網絡的結構層次相比傳統(tǒng)的淺層的神經網絡來說,要復雜得多,每兩層的神經元使用了局部連接的方式進行連接、神經元共享連接權重以及時間或空間上使用降采樣充分利用數據本身的特征,因此決定了卷積神經網絡與傳統(tǒng)神經網絡相比維度大幅度降低,從而降低計算時間的復雜度。卷積神經網絡主要分為兩個過程,分為卷積和采樣,分別的對上層數據進行提取抽象和對數據進行降維的作用。
本文以Caffe深度學習框架中的 CIFAR-10數據集的貓的網絡模型為例,如圖4所示,對卷積神經網絡模型進行訓練。CIFAR-10是一個標準圖像圖像訓練集,由六萬張圖像組成,共有10類(分為飛機,小汽車,鳥,貓,鹿,狗,青蛙,馬,船,卡車),每個圖片都是32×32像素的RGB彩色圖像。通過對數據進行提取和降維的方法來提取圖像數據的特征。
2 實驗分析
將貓的圖像訓練集放在train的文件夾下,并統(tǒng)一修改成256×256像素大小,并對貓的圖像訓練集進行標記,標簽為1,運行選擇cpu進行訓練,每進行10次迭代進行一次測試,測試間隔為10次,初始化學習率為0.001,每20次迭代顯示一次信息,最大迭代次數為200次,網絡訓練的動量為0.9,權重衰退為0.0005,5000次進行一次當前狀態(tài)的記錄,記錄顯示如下圖5所示,預測的準度在98%以上。而相比傳統(tǒng)的圖像分類算法BP神經網絡網絡的收斂性慢,訓練時間長的,網絡的學習和記憶具有不穩(wěn)定性,因而卷e神經網絡框架在訓練時間和預測準度上具有非常大的優(yōu)勢。
3 結束語
本文使用Caffe深度學習框架,以CIFAR-10數據集中貓的網絡模型為例,構建小型貓的數據集,提取貓的圖象特征信息,最后和目標貓圖像進行預測,并和傳統(tǒng)的圖像分類算法進行對比,預測的準確率有很大的提升。
參考文獻:
[1] 楊錚, 吳陳沭, 劉云浩. 位置計算: 無線網絡定位與可定位性[M]. 北京: 清華大學出版社, 2014.
[2] 丁士折. 人工神經網絡基礎[M]. 哈爾濱: 哈爾濱工程大學出版社, 2008.
[3] McClelland J L, Rumelhart D E, PDP Research Group. Parallel distributedprocessing[J]. Explorations in the microstructure of cognition, 1986, 2.
[4] Hopfield J J. Neural networks and physical systems with emergent collectivecomputational abilities[J]. Proceedings of the national academy of sciences, 1982, 79(8): 2554-2558.
[5] Ackley D H, Hinton G E, Sejnowski T J. A learning algorithm for boltzmannmachines[J]. Cognitive science, 1985, 9(1): 147-169.
[6] Kohonenmaps T. Self-Organized Formation of Topologically Correct Feature Maps[J]. Biological Cybernetics,1982, 43(1): 59-69.
關鍵詞:乳腺癌;計算機輔助診斷;腫瘤;B 神經網絡
中圖分類號:TB
文獻標識碼:A
doi:10.19311/ki.16723198.2016.26.149
1 研究背景
乳腺癌在初期常無明顯臨床癥狀,或者僅僅表征為輕微的疼痛。至今為止,乳腺癌發(fā)病的確切原因還不明確,雖然已知遺傳因素、環(huán)境因素和生活方式對乳腺癌的發(fā)病有一定影響,但60%以上的乳腺癌并不存在明顯的危險因素。目前還沒有有效的預防乳腺癌方法,而且中、晚期乳腺癌患者的愈后效果很差,任何干預都很難見效。因此,早發(fā)現、早診斷仍是當前提高乳腺癌治愈率和降低死亡率的最有效途徑。
腫瘤是乳腺癌的直接病理征象,也是乳腺癌的主要診斷依據,但盡管腫瘤是乳腺癌的一個重要早期跡象,但是醫(yī)師用肉眼很難將它們與正常的乳腺組織區(qū)分開來。但計算機輔助診斷(CAD)技術可以幫助醫(yī)師有效地進行對乳腺異常的檢測。
近些年來,隨著B 神經網絡理論的飛速發(fā)展和高度成熟,B 神經網絡在醫(yī)學領域得到了廣泛應用,如趙炳讓利用B 神經網對冠心病進行來輔助診斷,取得了很好的效果。EI-Solh用B 神經網絡對活動性肺結核進行輔助診斷,實驗結果顯示正確診斷肺結核的靈敏度為100%,其表明了B 神經網絡在診斷活動性肺結核的應用效果上高于臨床醫(yī)生的主觀評價,具備廣泛的推廣價值。Monica DiLuca等人通過基于B 神經網絡的仿真實驗對早期阿爾茨海默病進行了輔助診斷。
2 基于B 神經網絡的乳腺腫瘤計算機輔助診斷方法
2.1 提取ROI
本文實驗對象為選自DDSM數據庫中的乳腺圖像,首先將ROI從實驗樣本圖像中提取出。
2.2 提取特征
特征的提取是所有工作中關鍵的一環(huán),是模式識別和專家自動診斷系統(tǒng)的關鍵技術之一。其基本流程是:在對實驗圖像進行預處理(包括圖像定向、圖像去噪和圖像增強等)后,進行圖像的分割以提取出所需的ROI,最后對ROI進行特征提取。經過以上步驟提取出的特征被用于對乳腺腫瘤良惡性的診斷,從而為醫(yī)師提供醫(yī)療建議。
對2.1節(jié)實驗中所得到的ROI進行特征提取,提取到基于不變矩、基于圖像內容等的79維特征。
2.3 輔助診斷
將2.2節(jié)實驗所得的79維特征值進行歸一化處理,再將經過處理的79個特征數據作為B 神經網絡的79個輸入。將良性乳腺腫瘤和惡性乳腺腫瘤這兩個不同的乳腺腫瘤類別作為B 神經網絡的期望輸出。
下面通過仿真實驗,記錄其迭代次數、程序運行時間和診斷準確率,并取其平均值,以完成對網絡性能的評價。
將樣本數據隨機排序并編號后,采用5-折交叉法將其分為5組。每次實驗所使用的訓練樣本數據和測試樣本數據如表1所示。
平均迭代次數為10.2次,乳腺腫瘤診斷準確率平均值為94.41434%,并且每次仿真的迭代次數和準確率都非常的接近,網絡的性能優(yōu)良。這說明,使用B 神經網絡對乳腺腫瘤進行輔助診斷是可行的且取得了良好的診斷效果。
3 總結
本文在B 神經網絡方法的基礎上,對實驗所用的乳腺圖像樣本進行了輔助診斷。主要工作為:
(1)分割出樣本圖像的ROI;
(2)提取了樣本圖像ROI的79維特征;
(3)使用B 神經網絡方法對樣本數據進行輔助診斷,仿真結果顯示將B 神經網絡用于檢測乳腺腫瘤的良惡性時,網絡的性能優(yōu)良且有很好的診斷準確率。
參考文獻
[1]胡永升.現代乳腺影像診斷學[M].北京:科學出版社,2001.
[2]劉君,方志沂.乳腺癌的早期診斷.中國全科醫(yī)學,2002,5(6):431432.
[3]郝欣,曹穎,夏順仁.基于醫(yī)學圖像內容檢索的計算機輔助乳腺x線影像診斷技術.中國生物醫(yī)學工程學報,2009,28(6):922930.
[4]高雋.人工神經網絡原理及仿真實例[M].北京:機械工業(yè)出版社,2007.
[5]趙炳讓,胡北來,秦勤.人工神經網絡在冠心病診斷中的應用.天津醫(yī)藥,2002,30(9):575576.
[6]Ali A,EI-Solh,Chiu-Bin Hsiao,Susan Goodnough,et al. redicting active pulmonary tuberculosis using an artificial network.Chest,2009,(116):968973.
關鍵詞:神經網絡;模糊邏輯;模式識別;具體應用
現階段人工智能領域正在開展關于多種智能識別方法的融合應用來改善識別效果,基于模糊邏輯與神經網絡而成的模糊神經網絡對于真正智能模擬的實現有著極為重要的作用。
1.模式識別概述
模式在本質上是一個內涵十分豐富的概念,其主要是指人類可以利用感官直接或間接接受的外界信息,Watanabe等人在研究中將模式定義為:凡是可以給出一個名字的便可以稱為“模式”,并且其在定義過程中將某些具有共同特性的模式集合統(tǒng)稱為“模式類”?!澳J阶R別”在本質上是識別特定事物或模式相同點與相似點的過程,所以在研究過程中主要是利用自動技術來實現這一過程,在該類技術的支撐下計算機可以自動地將待識別模式分配到各自的模式類中,在這個過程中用到的技術統(tǒng)稱為模式識別技術,尤其是在計算機技術的支撐下使其發(fā)展形成一種模擬人的識別方法,所以對于模式識別的概念應該定義為自動判別和分類的過程。模式識別的過程為研究對象、數據采集、數據預處理、測量空間、特征選擇與提出、特征空間比對、模式分類、儲存至類型空間等,對于整個模式識別過程來說數據采集、數據預處理、特征提取以及特征選擇是其重點。在模式識別中,數據預處理后所獲取的原始數據所在空間則被稱為測量空間,將模式進行分類的空間則稱為特征空間。模式識別系統(tǒng)在設計過程中主要由學習模塊與測試模塊兩個核心模塊組成,并且整個系統(tǒng)在運行過程中具備訓練模式樣本特征數據輸入、制定分類判決規(guī)則、錯誤率檢測、模式樣本特征選擇和正特提取方法調整等多項功能。
2.模式識別系統(tǒng)分析
模式識別系統(tǒng)在運行中的學習模塊與測試模塊中都設計了數據預處理的功能,其可以根據用戶需求將感興趣的模式從背景中進行分離處理,并且可以避免噪聲信號對整個系統(tǒng)的運行產生影響,還可以根據用戶的實際需求來建立標準化模式樣本等。學習模塊在運行中會將已知的樣本模式進行數值化處理后輸入計算機,這個過程被稱為訓練模式樣本特征數據的輸入,系統(tǒng)可以對輸入的樣本進行分析并排除無效或容易出現混淆的特征,對于一些對分類判別有效的數據特征則可以進行界定并保留,這個過程被稱為模式識別系統(tǒng)在運行階段的特征選擇。
模式識別系統(tǒng)在運行過程中還需要將一些變換技術作為支撐,這是因為通過變換技術的應用可以得出比原來數目少的綜合性特征作為分類用,這一過程被稱為特征維數壓縮或特征提取,系統(tǒng)會按照設想的分類判決數學模型對樣本模式進行訓練來得出分類的判決規(guī)則。模式識別系統(tǒng)在獲取判決規(guī)則后便可以開始整個識別過程,其需要將未知模式特征數據進行采集、選擇與提取,然后根據已有的判決規(guī)則對輸入的模式進行分類,最后便可以根據用戶需求來輸入整個模式識別的結果。系統(tǒng)還可以將已識別的分類結果與已知分類輸入模式進行對比,以便于對判決規(guī)則與特征選擇、提取方法進行不斷的優(yōu)化,系統(tǒng)只有在該種模式下才能制定出錯誤率最小的判決規(guī)則與特征選擇、提取策略,對于模式識別系統(tǒng)來說,這一過程被稱為再學習的過程。
3.神經網絡在模式識別中的具體應用
國內在較早階段便開始了神經網絡在模式識別中應用的相關研究,但是學者所提出的研究成果并沒有得到廣泛應用。在20世紀80年代末期,我國一些專家對模式識別在地震特征提取等方面的應用進行了優(yōu)化與改進,并結合不同地區(qū)不同地質條件開展了一系列試驗研究,先后取得了很多效果十分顯著的成果,并且在這個基礎上為整個系統(tǒng)增加了人機交互功能,改進后的模式識別系統(tǒng)開始在國內相關領域中得到了廣泛應用。我國部分領域所使用的模式識別系統(tǒng)在最初以統(tǒng)計識別策略為主,在最近幾年才將神經網絡識別策略應用于模式識別系統(tǒng)中。20世紀80年代后期,世界上關于人工神經網絡的研究開始進入一個熱潮,這是因為在該階段由Rumelhart等人在研究中提出了反向傳播學習算法,對于神經網絡來說其可以有效解決前饋反向神經網絡學習訓練的問題,所以對于整個神經網絡研究領域來說開辟了一條新的途徑。前饋反向神經網絡學習問題的有效解決使神經網絡的各項優(yōu)勢充分彰顯出來,而前饋反向神經網絡模式識別則成為模式識別中的一個核心發(fā)展方向,并且開始被廣泛應用于生物、醫(yī)學、地質以及化工等產品檢測領域中,本文認為關于神經網絡在模式識別中的應用將會給社會帶來巨大變革,同時也意味著基于神經網絡的模式識別技術將成為網絡數字化時代的一項核心技術。
4.結語
現階段前饋反向神經網絡模式識別已經開始在社會各領域進行實踐應用,雖然在該技術體系中還存在一些不足與缺陷,但是在現代科技的支持下其勢必會迎來一個新的發(fā)展時期,對于我國社會各生產領域來說有著極為重要的推動作用。
參考文獻:
[1]汪烈軍.一種改進的結構自適應自組織神經網絡算法[J].微電子學與計算機,2007(01).
[2]趙菊敏,程海青,張立毅.基于動量項前饋神經網絡盲均衡算法[J].太原理工大學學報,2007(03).
【關鍵詞】人工神經網絡;故障診斷;模式識別;Matlab軟件
一、人工神經網絡綜述
BP神經網絡是目前應用最為廣泛和成功的神經網絡之一,它是由一個輸入層,一個或多個隱層以及一個輸出層組成,上下層之間實現全連接,而每層神經元之間沒有連接。網絡的學習過程包括信號正向傳播和誤差反向傳播。在正向傳播進程中,輸入信息從輸入層經隱層加權處理傳向輸出層,經功能函數運算后得到的輸出值與期望值進行比較,若有誤差,則誤差反向傳播,沿原先的連接通道返回,通過逐層修改各層的權重系數,減小誤差。隨著這種誤差逆向傳播修正的不斷進行,網絡對輸入模式響應的正確率也不斷上升。
二、人工神經網絡的識別、診斷過程
滾動軸承在設備中是比較典型的,本文以滾動軸承的故障識別、診斷為例。進行模式識別的大體步驟為:首先對經過零均值化后的振動信號數據進行時域、頻域分析,將篩選后的有效時域、頻域特征值作為人工神經網絡輸入層的輸入,經Matlab軟件進行神經網絡的訓練,最后可得出一個可以識別軸承工作狀態(tài)的神經網絡,進而可以對滾動軸承進行模式識別??梢姴捎谜駝有盘枡z測法對機器設備進行故障診斷的過程包含信號采集、特征提取、狀態(tài)識別、故障分析和決策干預等五個基本環(huán)節(jié),在滾動軸承故障診斷中,振動信號的采集是關鍵,保證信號采集的準確性、合理性和實時性是正確實現故障診斷的前提。(1)信號采集。每臺機器設備都有自身的固有頻率,若設備發(fā)生故障,其頻率變化,其振動信號也會發(fā)生變化。因此,振動信號可以作為故障診斷的一個重要標準。在信號采集中主要用到加速度傳感器、電荷放大器、帶濾波的A/D轉換器。先通過壓電式加速度傳感器對振動信號進行拾取,然后經過電荷放大器及通過帶濾波的A/D轉換電路得到微機可以識別的數字信號,從而實現振動信號的采集。(2)特征值提取。為了便于觀察,要把采樣點的值分布在0附近,故先對采集的采樣點值進行零均值化。用matlab對零均值化后的的采樣點進行時域、頻域分析。時域分析是計算振動信號的在時域范圍內的特征參數,包括:平均值、方差、均方根、峰值峰值因子、峭度系數等參數。頻域分析是對零均值化后數據進行傅里葉變換,繪制頻譜圖,對不同樣本故障軸承和正常軸承的頻譜圖進行對比,找出幅值差別比較明顯的幾組,作為頻域分析的特征值。由于各個特征值的幅值大小不一致,不便于比較同一特征值在不同樣本之間的差異,所以對所有有效特征值進行歸一化,歸一化后的結果可以作為神經網絡的輸入值。(3)模式識別和故障分析。在狀態(tài)檢測過程中,樣本數據來源于實驗數據分析后提取的有效特征值,這些有效的特征值作為神經網絡的輸入。神經網絡的輸出為軸承狀態(tài),分為正常軸承和故障軸承(也可以把故障具體分,比如內圈、外圈、滾動體故障等),可以用(0 1)表示正常軸承,(1 1)表示故障軸承,因此網絡中設計2個輸出神經元表示這2個狀態(tài)。對軸承的不同狀態(tài)進行識別,建立神經網絡對它進行訓練,可以用公式(其中是輸入層神經元數,是隱層神經元數)大體的計算出隱層神經元層數。我們設計一個隱層可以隨意改變的BP神經網絡,通過誤差對比確定隱層數目。設定神經網絡的隱含層神經元的傳遞函數為tansig,輸出層神經元的傳遞函數為logsig,目標誤差為0.001,最大訓練步數為1000。由以上設計寫出網絡訓練代碼,經Matlab運行,找出網絡誤差最小所對應層數,該層數作為神經網絡的隱層。
確定神經網絡的隱層后便可確定神經網絡的最終結構,下一步就要對網絡進行訓練,使人工神經網絡所產生的網絡誤差小于目標誤差,對神經網絡訓練好以后,接下來就是對軸承的測試,神經網絡測試代碼為:y=sim(net,測試數據)。把正常軸承和故障軸承的測試數據導入Matlab程序中,結果整理后可得(以實驗室中的一組實驗數據為例):
用均值表示結果為:
把預先設定好的狀態(tài)值和測試后的結果進行比較,很清楚的可以辨別出正常軸承和故障軸承??梢姡瑢C器設備或者系統(tǒng)的故障診斷實質是一個模式識別過程。利用神經網絡的模式識別能力,直接識別系統(tǒng)的當前模式,實現正常模式和故障模式之間、以及不同故障模式或不同故障程度之間的區(qū)分。
參 考 文 獻
關鍵詞:手勢動作識別 PNN 傳播率 識別率
中圖分類號:TP183 文獻標識碼:A 文章編號:1672-3791(2013)07(a)-0217-01
表面肌電信號(sEMG)是從皮膚表面由電極引導記錄下來的一種重要的生物電信號。表面肌電信號使用方便,對人體無損傷,被廣大的手勢動作識別研究中應用,同時也是智能假肢理想的控制信號源。目前,在手勢動作識別方面國內外學者取得了有效的成果。例如K.Englehart等對四種手勢動作進行識別,識別率為90%。2004年Kiguchi.K等人提出的識別方法大致可分為統(tǒng)計識別方法、句法識別、集成識別方法、神經網絡識別方法等。本文采用改進的PNN神經網絡方法進行識別,該方法結構簡單、訓練時間短且識別率較高不僅克服了傳統(tǒng)BP神經網絡識別率低、訓練時間長的缺點同時也克服了傳統(tǒng)PNN網絡傳播率系數需要手動設置的不足,較好的改善了識別率。本文采用改進的PNN神經網絡對造型“C”、食指伸展、伸腕、向下曲腕、握拳、向側曲腕、手掌伸展7種手勢動作進行模式識別。
1 sEMG的特征提取與特征選擇
表面肌電信號的特征提取對手勢動作的識別率有直接影響。本文采用時域、頻域及時頻域的特征作為不同手勢動作的特征。但是,特征太多會給計算帶來困難,而且會造成分類效果的惡化。因此本文采用K-W檢驗的方法對時域、頻域及時頻域的單個特征進行評價,選擇最具有分離度的特征。本文將提取的特征作為改進PNN神經網絡的輸入信息對7種手勢動作識別分類,并與傳統(tǒng)的神經網絡進行識別率對比分析。
2 改進PNN神經網絡模型
PNN神經網絡是1990年由Specht提出的一種徑向基函數(RBF)網絡的重要變形。它的訓練學習過程是一個完全正向的過程這一點與傳統(tǒng)神經網絡不同,大大減少了訓練時間。不僅如此該網絡不易陷入局部極小值點,非常適合模式識別研究。在進行仿真實驗時,傳播率的改變對識別結果的影響明顯,總會有一個值能使識別率最高,但是在概率神經網絡中該參數一般是手工設定,增加了訓練時間,為了提高效率本文通過仿真實驗,在多次試驗中找使結果最好的取值。粒子群優(yōu)化算法被廣泛應用與優(yōu)化數值的求解,本文采用該方法選取最優(yōu)的傳播率參數。
3 仿真實驗及結果分析
將本文的改進算法統(tǒng)傳統(tǒng)的算法進行比較分析,改進PNN神經網絡算法記為P1算法,傳統(tǒng)BP神經網絡算法記為P2算法。對于P1算法:設計的PNN網絡的結構為:輸入層有4個神經元,輸出層有7個神經元,中間層的傳遞函數為高斯函數,輸出層的傳遞函數為線性函數。將第1通道均值、第2通道均值、第1通道功率譜密度、第2通道功率譜密度作為輸入特征,進行仿真實驗研究。
4 結論
傳統(tǒng)的神經網絡訓練時間長且易陷入局部極小值,在手勢動作識別研究中正確識別率也并不高,本文針對這些問題提出的改進PNN神經網絡有效克服了這些不足,識別率提高到90%左右,并且訓練時間也縮短了一半。有效的改善了手勢動作識別效果。
改進PNN神經網絡的提出為手勢動作識別分類提供了理論基礎,為智能假肢的研究提高的科學依據,但是,為了將手勢動作的識別算法應用于智能假肢,改進的概率神經網絡識別算法的識別率仍有待提高。因此,尋找更有效的識別算法,提高手勢動作的識別準確率是今后的研究熱點問題。
參考文獻
[1] JIN D W,WANG R CH.Artificial lntelligent prosthesis[J].Chinese J. Clinical Rehabilitation,2002,5(20):2994-2995.
[2] Paclik P,Novovicova J,Pudil P.Road sign classification using Laplace classifier[J].Pattern Recognition Letters,2000,21(13-14):1165-1173.
[3] Sueteus P,Fua P, Hanson A putational strategies for object recognition[J].ACM Computing Surveys,1992,24(1):5-61.
[4] Specht D.Probabilistic neural network[J].Neural Networks,1990,3(1):109-118.
[5] McDuff R J,Simpson P K.An Investigation of Neural Networks for F-16 Fault Dignosis:II.System Performance[C]//SPIE 1294 Application of Artificial Neural Networks.1990:42-45.
關鍵字:木材表面缺陷,神經網絡,BP網絡
Abstract: from now neural network in pattern recognition of the development perspective, in large network structure optimization problem and network learning problems is still open to solve and improve. Therefore, to study various neural network in the wood surface defect recognition of the practicability and accuracy, wood surface defect recognition to promote the study of the method, has very important practical significance.
Key word: wood surface defect, neural network, and BP network
中圖分類號:F762.4 文獻標識碼:A 文章編號:
隨著科學技術的發(fā)展,神經網絡理論作為一門新興學科,近年來被廣泛應用于木材表面缺陷的識別分類中,以達到神經網絡具有的實時性、容錯性以及學習性等特點。然而,由于木材表面缺陷種類繁多,隨機性比較強,這些都給分類器提出了很高的要求。現階段,人們普遍采用都是基于誤差逆?zhèn)鞑ニ惴ǎ˙P)的神經網絡,然而BP網絡的缺點是對干擾量非常敏感、隱含層節(jié)點數需要經過多次嘗試、學習速度慢且易陷入局部極小點。
1.誤差逆?zhèn)鞑ド窠浘W絡(BP網絡)
按照誤差逆?zhèn)鞑W習算法進行訓練的多階層神經網絡被直接稱為誤差逆?zhèn)鞑ド窠浘W絡,即BP網絡。BP網絡是一種具有三層神經元的階層神經網絡,不同階層神經元之間實現權重連接,而每層內各個神經元之間不連接。
2.木材缺陷特征提取
⑴ 劃分缺陷區(qū)域并確定缺陷的尺寸和位置
在二值化圖像中,相互連接的黑像素的集合稱為一個區(qū)域。在這部分程序設計中,通過對圖像內每個區(qū)域進行標記操作(標號),求得這樣區(qū)域的數目(也就是在這幅二值圖像中存在的缺陷數),進而計算每個缺陷的邊界,再按照求得條件進行區(qū)域劃分,把每個缺陷均劃在一個區(qū)域中,使一幅圖像分成多幅圖像。然后分別對每個小幅圖像進行計算,確定缺陷的位置及尺寸。
⑵ 根據缺陷位置及尺寸提取灰度特征
根據M[][]數組中的缺陷位置數據,從二值化前的灰度圖像中提取缺陷的灰度特征,由此依次地得到缺陷特征數組BB[Rmax-Rmin][Lmax-Lmin]。其中缺陷部分為具體的灰度值,其它均為0。
3.BP網絡設計
BP神經網絡是目前所有神經網絡中算法最為成熟,應用最為廣泛的一種神經網絡,且具有簡單、易于實現等特點。
⑴ 輸入層和輸出層的設計
BP神經網絡的輸入,輸出層維數完全根據使用者的要求來設計。本實驗研究對象為木材缺陷圖像,輸入為表征木材圖像缺陷特征的特征向量,在圖像處理過程中,我們提取了缺陷的3個特征數據:缺陷灰度均值、缺陷灰度方差和缺陷形狀。
如果把它們作為網絡的輸入,則網絡的輸入層的單元個數便確定為3個,根據所達到的識別要求,對木材的十種缺陷進行有效識別,選擇輸出層單元的個數十個,即每個單元的輸出代表一種缺陷類型,這樣便確定了網絡的輸入和輸出層單元數目,再根據這兩個數據確定中間層(隱層)單元數。
⑵ 隱層的設計
1989年,RobertHeeht-Nielson證明了對于任意在閉區(qū)間內的一個連續(xù)函數都可以用含一個隱層的BP神經網絡來逼近,因而一個單隱層的BP神經網絡可以完成任意的n維空間到m維空間的映射,隱層神經元數目選擇是一個十分復雜的問題,往往需要根據設計者的經驗和多次試驗來確定,不存在一個理想的解析式來計算。
⑶ 初始值的選取
由于系統(tǒng)是非線性的,初始值對于學習能否達到局部最小和是否能夠收斂的結果關系很大。一個重要的要求是:初始值在輸入累加時使每個神經元的狀態(tài)值接近于零,權值一般取隨機數,要比較小。輸入樣本也同樣希望進行歸一化處理,使那些比較大的輸入仍落在傳遞函數梯度大的地方。
⑷ 傳遞函數的選擇
BP神經網絡傳遞函數必須是可微的,根據網絡的要求和所要達到的網絡輸出目的,選擇網絡中間層的傳遞函數為s形函數,它主要根據值的大小作出運算和判斷,它的輸出性質與所要求的網絡輸出具有相同的性質。
⑸ 網絡學習算法的構成
木材缺陷的識別應用BP神經網絡模型,網絡訓練采用梯度下降法,使輸出誤差最小,直到滿足給定的精度要求。利用圖像處理模塊部分構成網絡的輸入特征量,即把缺陷的灰度均值、灰度方差和形狀的長寬比作為輸入向量{xl、x2、x3)選擇值。這一步也就是向神經網絡輸入的待識別圖像的數字特征通過計算機利用一定的算法對這些數字化特征進行分類。當神經元的非線性函數是s型時,由神經元組成的前傳型網絡的傳遞函數是連續(xù)可微的,故誤差反向傳播算法可以用LMS法則進行。
⑹識別網絡的系統(tǒng)模型及構成
板材表面特征通常是表現為存在表面缺陷和無表面缺陷兩種情況,所以適合選用兩級神經網絡板材表面缺陷檢測模型。一級神經網絡用于檢測圖像是否存在缺陷,如果存在缺陷,則圖像存入緩沖區(qū),利用二級神經網絡對緩沖區(qū)的圖像進行分析處理,如果沒有缺陷,則不保存圖像,直接輸出檢測結果;二級神經網絡根據缺陷圖像特征參數對缺陷進行分類,確定圖像中每個缺陷的位置。
將人工神經網終與有效的特征提取結合起來,有可能獲得更為滿意的識別效果。根據圖像處理模塊分析提取反映缺陷形態(tài)的特征向量,這些特征向量既可直接輸入神經網絡的輸入節(jié)點,作為網絡訓練或形態(tài)識別的參數,也可導入形態(tài)識別特征數據庫。另外,為了提高網絡的自適應性,進一步完善識別診斷模型,還可在原有的訓練的網絡基礎上,對神經網絡模型進行再學習。
4.識別結果與討論
訓練后的BP網絡是否滿足需要,必須經過檢驗才能確定。驗證網絡的正確性一般采用與實際樣本數據相比較的方法,即先把驗證樣本的數據經初始化后輸入模型號,經BP網絡模型計算,輸出相應數據,然后將對照樣本的實際值與網絡輸出值相比較,若誤差在允講范圍內,此網絡是可用的,否則要重新訓練。
5.結束語
神經網絡算法識別給傳統(tǒng)模式識別法帶來了巨大的挑戰(zhàn)。它具有記憶、學習和算法多樣等功能,在識別中能夠得到非常準確的識別結果,所以神經網絡識別在對于板材表面缺陷識別這一方面具有可行性和應用價值。由于實驗尚處于對神經網絡開發(fā)的初級階段,所選擇的網絡算法((BP算法)是神經網絡算法中比較成熟的算法,它具有構造、學習等比較容易的優(yōu)點,但它的一些不可克服的缺點卻影響了它在應用中效果。但是這些缺點是可以克服的,神經網絡識別的強大優(yōu)勢和識別效果是非常吸引人的。應用一些新型的網絡算法,在多次實驗研究的基礎上,可以根據對板材表面缺陷識別的一些特有的要求來構造有利于這一識別的新型網絡,那么神經網絡方法對表面缺陷的識別即可達到優(yōu)于其它傳統(tǒng)識別方法的性能。所以,神經網絡算法上的改進是今后研究木材表面缺陷神經網絡識別首先解決的工作。
參考文獻:
[1]王業(yè)琴等 計算機視覺木材表面色差檢測的研究[J] 林業(yè)科技 2005
[2]趙茂程等 基于BP網絡的樹形識別系統(tǒng)研究[J] 林業(yè)科學 2004
關鍵詞:徑向基,神經網絡,特征提取,有價證券識別
中圖分類號:G64 文獻標識碼:A 文章編號:1672-3791(2015)05(c)-0000-00
1引言
隨著我國經濟快速發(fā)展,有價證券在日常經濟活動中的流通也更加頻繁,如何對有價證券進行快速鑒偽越來越重要。每張有價證券都具有獨一無二的序列號,是每張有價證券的“身份證”,金融領域常采用有價證券序列號來進行有價證券的鑒偽,因此,如何對有價證券序列號進行快速識別是有價證券鑒偽工作的關鍵,也成為圖像識別與人工智能領域研究的熱點問題[1]。
傳統(tǒng)的有價證券序列號主要采取人工識別,人工識別不但浪費大量的人力成本,而且識別效率低,已經不能適應快速發(fā)展的經濟活動需求。隨著計算機技術與自動驗鈔技術的發(fā)展,有價證券序列號自動識別系統(tǒng)引起了廣大學者的廣泛關注,新的算法與技術不斷涌現出來。有價證券序列號識別主要為序列號圖像特征的提取與分類兩個階段,其中分類器算法的設計是整個識別過程的關鍵。目前分類器算法主要采取模式匹配法。模式匹配算法是一種數字統(tǒng)計方法,在識別過程中由于有價證券自身的殘缺、特征提取不夠明顯的前提下,會出現錯識別現象,影響了整個系統(tǒng)的識別精度。同時模式匹配算法也缺乏智能性,無法適應整個清分系統(tǒng)的發(fā)展需求[2]。近年隨著人工智能算法的不斷發(fā)展,在不同領域得到了廣泛應用,其中人工神經網絡更是在模式識別算法中得到了重要應用,也為有價證券序列號識別提供了新的解決思路。
本文基于人工神經網絡算法,提出了一種快速的有價證券序列號模式識別算法,并運用模擬仿真與模式識別算法進行了對比分析。
2 有價證券序列號碼識別流程
有價證券序列號識別系統(tǒng)通常有硬件部分與軟件部分組成。硬件部分包括計算機、光學圖像傳感器與數字信號處理單元,軟件部分包括圖像預處理、序列號特征提取與序列號識別等[3]。本文算法主演研究軟件部分,識別系統(tǒng)如圖1所示。
圖1 有價證券序列號識別流程圖
3 有價證券圖像預處理與序列號特征提取
3.1有價證券圖像預處理
圖像預處理是機器視覺實際應用中非常重要的一個環(huán)節(jié),能有效提高有價證券序列號的識別準確率。預處理包括對圖像進行噪聲抑制、信號增強及目標提取等。
有價證券放入驗鈔機后,通過CIS采集序列號正反兩面圖像,通常序列號的透射圖像與反射圖像位置信息基本一致,但由于有價證券在流通過程中會不可避免出現磨損、污染、缺損等現象,加上圖像傳感器本身存在的噪聲源,因此圖像采集過程中噪聲會加載到原始圖像上而影響后期處理。抑制噪聲通常采用濾波操作,本文采用中值濾波法去除圖像噪聲。中值濾波法是基于鄰域的算法,不僅可以有效清除脈沖噪聲,同時能較好地保護圖像邊沿。其核心思想是為待處理像素點選取一個鄰域,然后將鄰域中所有的像素點按灰度級排序,再取中間值作為該點輸出的像素。中值濾波的效果通常由鄰域的空間范圍和中值計算中所涉及的像素個數決定。去噪后的圖像采用基于占空比的二值化方法對序列號圖像進行二值化,同時利用Hough變換對序列號碼圖像進行了傾斜校正[4]。
基于有價證券圖像特征,采用垂直投影法對字符上下邊界及左右邊界進行了準確定位與切分。切分好的序列號圖像采用線性歸一化方法,通過最近鄰域插值法縮放成32x48的字符圖像。
3.2有價證券序列號特征提取
特征提取是整個字符識別系統(tǒng)中十分重要的步驟,其基本任務是從原始數據中找到最能代表同類數據的特征及同類數據中的差異,從而有效提高識別率[5]。通過對比分析,本文采用基于網格的八方向梯度特征作為序列號字符的識別特征,網格特征能有效降低圖像的維度并具有較好地區(qū)分性能,而梯度信息能反映出圖像的輪廓信息。
4基于BP神經網絡的有價證券序列號識別
人工神經網絡是由許多神經元的節(jié)點相互連接構成,通常采用基本的BP(Back Propagation)神經網絡或其衍生網絡。BP神經網絡是單向傳播的多層前饋網絡,第一層為輸入節(jié)點,最后一層為輸出節(jié)點,中間有一層或多層隱藏節(jié)點。一般中間層采用Sigmoid傳遞函數,而輸出層一般采用線性變換函數。BP神經網絡的特點是各神經元僅與相鄰層神經元有連接而與本層神經元無連接,如圖2所示。
圖2 BP神經網絡結構圖
根據BP神經網絡的特性,其初始值與激勵函數對模型的識別性能有較大的影響。初始值選取不當可能造成神經網絡的早熟或不收斂。本文采用遺傳算法確定BP神經網絡初值,激勵函數采用經典Sigmoid函數,其模型如下式:
其中為閾值,T為網絡溫度常數。
本文針對有價證券序列號包含字符與數字的特征,采用的神經網絡結構如表1所示,識別基本步驟如下:
1) 按照3.1所示方法對有價證券圖像進行預處理;
2) 按照3.2所示方法對有價證券序列號圖像進行字符分割與特征提??;
3) 對特征向量采取BP神經網絡進行訓練,建立有價證券序列號識別模型;
4) 對待識別有價證券序列號模型進行識別,輸出結果。
5仿真分析
為驗證BP神經網絡在有價證券序列號識別中的有效性,選擇了500張有價證券進行仿真測試,其中450張用于學習建模,50張用于測試,檢驗模型性能,運行結果表明,該方法能夠很好對有價證券進行識別。該仿真采用PC機配置為:CPU PⅣ 2.4G,內存為2G,操作系統(tǒng)為Windows XP,編程語言Matlab,調用Matlab人工神經網絡工具箱。同時以識別率和耗時最為指標對識別模型進行評估,并與模式匹配算法和向量機作為對比算法[6],樣本測試結果如表2所示。
從表2結果分析,采用BP神經網絡算法正確率達到96%,高于其他兩種算法的識別效果,識別速度也有較大的提升,更加符合有價證券序列號的在線、實時識別,結果表明了算法的有效性。
6 結論
本文以圖像處理技術為基礎,提出了一種基于BP神經網絡的有價證券序列號識別算法。首先通過中值濾波降噪、二值化等技術對圖像預處理,然后采用基于網格的八方向梯度特征對序列號進行特征提取,最后采用BP神經網絡對其進行識別,并運用MATLAB進行仿真分析。仿真結果表明,本文算法具有識別準確率高,識別速度快的優(yōu)點,驗證了算法的有效性。
參考文獻
[1]胡學娟阮雙琛等.基于改進梯度方向直方圖的有價證券識別.深圳大學學報理工版.2014(9)Vol.31
[2]涂豫.神經網絡的有價證券序列號識別算法.計算機仿真.2011(12)
[3]劉洋.有價證券紙幣號碼識別算法的研究.遼寧工程技術大學.2012
[4]朱雪嬌.圖像清分的有價證券序列號碼識別關鍵技術研究.南京理工大學2014
關鍵詞:卷積神經網絡 人體行為識別 Dropout
中圖分類號:TP391.41 文獻標識碼:A 文章編號:1672-3791(2017)04(c)-0028-02
該文采用隨機Dropout卷積神經網絡,筆者將此法的優(yōu)點大致概況為將繁瑣雜亂的前期圖像處理簡易化,原來的圖像不可以直接輸入,現在的原始圖像即可實現直輸功能,因其特性得到廣泛研究與應用。另外,卷積神經網絡在圖像的處理中能夠將指定的姿勢、陽光的照射反應、遮避、平面移動、縮小與放大等其他形式的扭曲達到魯棒性,從而達到良好的容錯能力,進而可以發(fā)現其在自適應能力方面也非常強大。因為卷積神經網絡在之前建立網絡模型時,樣本庫為訓練階段提供的樣本,數量有限,品質上也很難滿足要求,致使網絡權值參數不能夠完成實時有效的調度與整理。
1 卷積神經網絡
據調查卷積神經網絡由K.Fukushima在80年代提出,那時候它被稱為神經認知機,這一認知成為當時的第一個網絡,后來網絡算法發(fā)生了規(guī)模性變革,由LeCun為代表提出了第一個手寫數字識別模型,并成功投入到商業(yè)用途中。LeNet被業(yè)界冠以卷積神經網絡的代表模型,這類系統(tǒng)在很多方面都起到了不容小趨的作用,它多數應用于各類不同的識別圖像及處理中,在這些層面上取得了重要成果。
筆者經查閱資料發(fā)現卷積神經網絡其實是由兩個種類組合而來,它們分別是特征提取、分類器,這種組成我們可以看到特征提取類可由一定數量的卷積層以及子采樣層相互重疊組合而成,全部都連接起來的1層或者2層神經網絡,就是由分類器來進行安排的。卷積神經網絡中的局部區(qū)域得到的感覺、權值的參數及子采樣等可以說是重要網絡結構特征。
1.1 基本CNN網絡結構
圖1中就是最為經典的LeNet-5網絡模型結構圖。通過圖1中我們可以獲悉,該模型有輸入輸出層,除這兩層外還有6層,其征提取可在前4層中體現,后兩層體現的是分類器。
在特征提取部分,6個卷積核通過卷積,是圖像經尺寸為32×32的輸入而得見表1,運算過程如式(1):
(1)
式中:卷積后的圖像與一個偏置組合起來,使函數得到激活,因此特征圖變誕生了,通過輸出得到了6個尺寸的特征圖,這6個尺寸均為28×28,近而得到了第一層的卷積,以下筆者把它簡要稱為c1;那么c1層中的6個同尺寸圖再經由下面的子采樣2×2尺寸,再演變成特征圖,數量還是6個,尺寸卻變成了14×14,具體運算如公式(2):
通過表2我們可以使xi生成的和與采樣系數0.25相乘,那么采樣層的生成也就是由加上了一個偏置,從而使函數被激活形成了采樣層的第1個層次,以下我們簡要稱為s1;這種過程我們可反復運用,從而呈現出卷積層中的第2層,可以簡要稱之為c2,第2層簡稱s2;到目前為止,我們對特征的提取告一段落。
神經網絡的識別,我們可以看到它是由激活函數而形成的一個狀態(tài),這一狀態(tài)是由每個單元的輸出而得;那么分類器在這里起到的作用是將卷積層全部連接起來,這種通過連接而使1層與上面1層所有特征圖進行了串連,簡要稱之為c5;因而2層得到了退變與簡化效應,從而使該神經網絡成為經典,簡要稱之為F6,向量及權值是由F6 輸送,然后由點積加上偏置得到結果的有效判定。
1.2 改進的隨機DropoutCNN網絡
1.2.1 基本Dropout方法
神經網絡泛化能力能夠得到提升,是基于Dropout方法的深入學習。固定關系中存在著節(jié)點的隱含,為使權值不再依附于這種關系,上述方法可隨機提取部分神經元,這一特性是通過利用Dropout在網絡訓練階段中隨機性而得,對于取值能夠有效的存儲及保護存留,這一特性在輸出設定方面一定要注重為0,這些被選擇的神經元隨然這次被抽中應用,但并不影響下次訓練的過程,并具還可以恢復之前保留的取值,那么每兩個神經元同時產生作用的規(guī)避,可以通過重復下次隨機選擇部分神經元的過程來解決;我們通過這種方法,使網絡結構在每次訓練階段中都能呈現不同變化,使一些受限制的特征,不再受到干擾,使其真正能展現自身的優(yōu)點,在基于Dropout方法中,我們可以將一些神經元的一半設為0來進行輸出,隨機神經元的百分比可控制在50%,有效的避免了特征的過度相似與穩(wěn)合。
1.2.2 隨機Dropout方法
Dropout方法就是隨機輸出為0的設定,它將一定比例神經元作為決定的因素,其定義網絡在構建模型時得到廣泛采用。神經元基于隨機Dropout的方法是該文的重要網絡輸出途徑,通過設定輸出為0,使其在網絡中得到變。圖2是隨機Dropout的加入神經元連接示意圖,其在圖中可知兩類神經元:一類是分類器的神經元,這一階段的神經元可分榱講悖渙硪煥嗌窬元是由輸出而形成的層次。模型在首次訓練的階段會使神經元隨機形成凍結狀態(tài),這一狀態(tài)所占的百分比為40%、60%,我們還可以看到30%及50%的神經元可能在網絡隨機被凍結,那么這次凍結可以發(fā)生在模型第二次訓練,那么第三次神經元的凍結可從圖示中得出70%及40%,還可以通過變化用人工設置,其范圍值宜為35%~65%,那么網絡神經元連接次序的多樣化,也因此更為突出與精進,網絡模型的泛化能力也得到了跨越勢的提高。
2 實驗及結果分析
2.1 實驗方法
卷積神經網絡通過實驗,通過輸入層呈現一灰色圖像,該圖像尺寸被設定成28×28的PNG格式,這里我們以圖像框架圖得到雙線性差值,用來處理圖像及原視頻中的影像,將框架圖的卷積核設定為5×5的尺寸,子采樣系數控制值為0.25,采用SGD迭代200次,樣本數量50個進行設定,一次誤差反向傳播實現批量處理,進行權值調整。實驗采用交叉驗證留一法,前四層為特征提取層,C1-S1-C2-S2按順序排列,6-6-12-12個數是相應特征,通過下階段加入隨機Dropout,這階段為雙層也就是兩層,進行連接,連接層為全體,從而可知結果由分類得出,又從輸出層輸出。
2.2 實驗結果分析
識別錯誤率可通過卷積神經網絡模型,及訓練過程與檢測過程中可查看到的。在訓練階段中,我們可以將Dropout的網絡中融入200次訓練,在將沒有使用該方法的網絡進行相互比較分析,我可以得知,后者訓練時的識別錯誤率稍高于前者,前者與后的相比較所得的差異不是很大,進而我們可知使用Dropout方法,對卷積神經網絡在泛化能力上得到有效的提升,從而有效的防止擬合。
3 結語
筆者基于Dropout卷積神經網絡,人體行為識別在視頻中進行, 通過Weizmann數據集檢測實驗結果,隨機Dropout在分類器中加入。通過實驗可以得知:隨機Dropout的加入,使卷積神經構建了完美網絡模型,并且使其在人體行為識別中的效率贏得了大幅度的提升,近而使泛化能力可以通過此類方法得到提高,可以防止擬合。
參考文獻
[1] 其它計算機理論與技術[J].電子科技文摘,2002(6).
關鍵詞:神經網絡;預測;剩余油氣;模式識別;訓練
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2015)09-0200-02
Abstract: The paper is aimed at the problem of traditional exploration methods can not predict the remaining oil and gas accurately, the methods of fuzzy theory and self-organizing map are approached. It takes the advantage of Fuzzy neural network system converging faster and higher prediction accuracy, as well as the unsupervised competitive learning mechanism of self-organizing map, it achieves the goal of predicting the remaining oil and gas. The method of neural network improve the precision of remaining oil and gas, it obtains better effect of prediction.
Key words: neural network; predict; remaining oil and gas; pattern recognition; train
石油是國家經濟發(fā)展的命脈,油氣勘探開發(fā)則是石油工業(yè)的基礎,在國民經濟的地位舉足輕重。隨著地震勘探理論方法日趨成熟,我國各大油氣田勘探程度相繼提高,油氣田已經被大幅度開采。然而我國的石油平均采收率并不高,約為30%多一點,還有近70%的油氣并未采收,傳統(tǒng)的油氣勘探方法已經不能滿足增加石油的采收率。當前我國各大油田的地質勘探工作已經進入中后期,迫切需要一些新的方法研究方法和技術,對油氣田剩余油氣的分布和變化趨勢做出預測,以便在尋找新的勘探開發(fā)領域,同時也能繼續(xù)對老油氣田進行挖掘,從而提高油氣產量。
近些年來,隨著神經網絡技術[1]的日趨成熟,基于模式識別的各類方法技術,如統(tǒng)計模式識別、神經網絡、模糊判別等技術和理論在剩余油氣預測方面都得到了較多的應用,也取得了較好的結果。其中模糊理論具有很強的表達能力并且容易被人理解,神經網絡的自適應學習能力很強。由于模糊理論和人工神經網絡各自的優(yōu)點,常常被單獨或者是組合起來運用到實踐中,本文主要介紹神經網絡的方法運用于預測剩余油氣的工作中。
1 模糊理論
1.1 發(fā)展歷程
1965年美國加州大學伯里克分校的扎德教授首先創(chuàng)立了模糊集合的數學理論,隨后P.N.Marions也開始從事相關研究,于1966年發(fā)表了一份關于模糊邏輯的研究報告。1974年扎德教授作了模糊推理的研究報告,同年英國的E.H.Mamdanl運用模糊邏輯和模糊推理首次實現了蒸汽機的實驗性控制,從此模糊理論的雛形形成了,隨后模糊理論[2]掀起了一波熱潮。
1.2 在剩余油氣預測中的應用
在預測剩余油氣[3]的實踐中,首先對地震資料做初步的特征提取,然后將提取的樣本用模糊理論的聚類方法進行訓練,對訓練樣本進行幾類。每類都有各自對應的神經網絡,用專屬于每類的樣本依次訓練各自對應的神經網絡。具體步驟如下:
1)流體屬性的提取
流體屬性數據是三維數據,屬性的提取方法依賴于具體的物理問題與數據網格的劃分。三維數據場屬性邊界的提取所采用的方法是求出網格點的梯度,特征區(qū)域一般是梯度模值較大的區(qū)域。對于均勻的三維網格,估計其梯度的方法可采用三維差分。為得到網格點上的梯度值,簡單的方法是利用前、后、左、右、上、下六個鄰近點的場值進行簡單的差分估計。在計算流體力學問題中,采用的網格大都是結構化網格,為計算網格點上的梯度,需將網格變換為均勻規(guī)則正交網格。設三維網格交換為[x=T1(ξ,η,?)],[y=T2(ξ,η,?)],[z=T3(ξ,η,?)],在點(m,n,p),其場值梯度在兩種網格上的關系式為:
[?f?ξ?f?η?f??=?f?x?f?y?f?z?x?ξ?x?η?x???y?ξ?y?η?y???z?ξ?z?η?z??]
2)模糊系統(tǒng)處理流體屬性
確定輸入輸出的學習樣本[(αK,βK,γk)],k為樣本個數。利用模糊聚類的方法將輸入樣本分成N類,N類樣本對應N條神經網絡。利用各自的樣本訓練各自的神經網絡,選擇合適的學習樣本,系統(tǒng)經過多次樣本訓練和樣本學習之后,優(yōu)化出一部分識別精度高的樣本,優(yōu)選的樣本到達能辨別精度后,將該樣本輸出,這樣就可以被識別了。
2 自組織神經網絡
2.1 結構與工作過程
自組織神經網絡是上世紀80年代芬蘭Helsink大學的Kohonen在Willshaw與Von der Malsberg在的工作上,結合對自然界中的生物神經系統(tǒng)的理解,創(chuàng)建Kohonen模型,又稱Kohonen網絡。自組織神經網絡[4]的特征映射是基于生物的大腦神經系統(tǒng),模擬它的自組織特征映射機制,在樣本訓練中有很強大學習能力,在組織學習中不需要監(jiān)控,是一種無監(jiān)督競爭式學習的前饋網絡。自組織神經網絡通過學習,從而提取某組數據中的某種重要特征或內在規(guī)律,按離散時間的方式進行分類。網絡可以把任意高維的輸入作為輸入神經元,映射到低維空間得到輸出神經元,并且使得輸入神經元內部的某些相似性質表現為幾何上鄰近的特征映射,這就是人們常說的降維處理。這樣輸出神經元會聚集成一個輸出層,輸出層就可以繪制成一維或二維離散幾何圖形,并且其拓撲結構保持不變。此分類反映了樣本集之間的本質區(qū)別,大幅度降低了一致性準則中的人為因素。
如圖1所示,SOM網絡是一種比較簡單的雙層網絡, 由若干輸入神經元和輸出神經元組成。輸入層與輸出層各神經元之間實現了全部互相直接或間接的連接方式,每個輸出神經元可通過可變連接權與所有輸入神經元相連, 且輸出神經元間存在局部相互連接。每個連接都具有對應的連接權值,用于表示該連接的強度。各個神經元的連接權值均具有一定的分布,每個輸入神經元與輸出神經元之間的聯(lián)系通過連接權來傳達。輸出層的神經元之間實行側向連接,相鄰的神經元相互激勵,距離較遠的神經元則相互抑制,然而超過了一定的距離的神經元又具有較弱的激勵作用,最后剩下的一個神經元或一組神經元,則反映該類樣本的屬性。
2.2 預測剩余油氣的步驟
1)根據勘探數據體提取流體屬性[5],并對其進行預處理。
2)優(yōu)選出所要了解的流體屬性,對其進行降維壓縮,將壓縮集作為模式識別的輸入,以統(tǒng)計的油氣儲層參數作為輸出來訓練組組織神經網絡。
3)利用模式識別[6]參數和降維壓縮集對儲層的油氣進行預測,從而得到如今的剩余油氣的分布。
3 結束語
本文針對傳統(tǒng)油氣勘探的方法難以滿足預測油氣田剩余油的難題,著重介紹了模糊理論和自組織神經網絡的方法,這兩種神經網絡的方法各有優(yōu)勢。其中模糊神經網絡的系統(tǒng)訓練和學習速度快,收斂較快,預測的精度高。自組織神經網絡的競爭模式起到了快速優(yōu)選的作用,神經元之間的協(xié)作模式在某種意義上則縮短了整個流程的工作時間??偠灾窠浘W絡的技術與方法在預測油氣田的剩余油氣的實踐中取得了不錯的成果。
參考文獻:
[1] 汪鐳,周國興,吳啟迪.人工神經網絡理論在控制領域中的應用綜述[J].同濟大學學報:自然科學版,2001,03:357-361.
[2] 王曉軍,楊海峰,邱志平,等.基于測量數據的不確定性結構分析的模糊理論[J].北京航空航天大學學報,2010,08:887-891.
[3] 熊艷,包吉山,肖慈.模糊神經網絡預測儲層及油氣[J].石油地球物理勘探,2000,02:222-227.
[4] 易榮慶,李文輝,王鐸.基于自組織神經網絡的特征識別[J].吉林大學學報:工學版,2009,01:148-153.