前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的模式識別技術主題范文,僅供參考,歡迎閱讀并收藏。
關鍵詞:模式識別;語音識別;交互式語音應答;司法社區矯正
中圖分類號:TP391.41 文獻標識碼:A
Abstract:Systematic research was done on the specific algorithm for speech recognition in using genetic algorithm to train continuous hidden Markov mode. Then the detailed design of Voiceprint Recognition System of Community Correction Objects in the Shenzhen City Bureau of Justice has been done based on the speech recognition technology. The system running results show that the recognition rate of recognition algorithm using genetic algorithm to train continuous hidden Markov model is faster and has a higher rate of recognition. Construction of voiceprint recognition system of judicial community correction objects based on pattern recognition is still in the junior stage in our judicial system, and promotion and the construction of voiceprint recognition system of judicial community correction objects have the important practical significance.
Key words:pattern recognition;speech recognition;interactive voice response;judicial community correction
1 利用基因算法訓練連續隱馬爾柯夫模型的語音識別以及具體算法
作為模式識別重要應用之一的語音識別技術所涉及的領域包括信號處理、模式識別、概率論和信息論、發聲機理和聽覺機理、人工智能等等。近年來,在生物識別技術領域中,聲紋識別技術以其獨特的方便性、經濟性和準確性等優勢受到世人矚目,并日益成為人們日常生活和工作中重要且普及的安全驗證方式。
隱馬爾柯夫模型(Hidden Markov Model,HMM)方法是二十世紀70年代引入語音識別理論的,它的出現使得自然語音識別系統取得了實質性的突破,現已成為語音識別的主流技術[1-4] ,該方法在語音識別時識別速度較快,也有較高的識別率。目前大多數大詞匯量、連續語音的非特定人語音識別系統都是基于HMM模型的。HMM是對語音信號的時間序列結構建立統計模型,將之看作一個數學上的雙重隨機過程:一個是用具有有限狀態數的Markov鏈來模擬語音信號統計特性變化的隱含的隨機過程,另一個是與Markov鏈的每一個狀態相關聯的觀測序列的隨機過程。前者通過后者表現出來,但前者的具體參數是不可測的。人的言語過程實際上就是一個雙重隨機過程,語音信號本身是一個可觀測的時變序列,是由大腦根據語法知識和言語需要(不可觀測的狀態)發出的音素的參數流。可見HMM合理地模仿了這一過程,很好地描述了語音信號的整體非平穩性和局部平穩性,是較為理想的一種語音模型。
在HMM(隱馬爾柯夫模型)中,分為離散HMM(DHMM)和連續HMM(CHMM)。由于CHMM直接以幀語音特征向量本身為觀測序列,而不是像DHMM那樣先將語音特征向量經矢量量化為觀測符號,因此CHMM有優于DHMM的識別精度。然而,由于CHMM參數多,傳統的訓練方法采用迭代法,先假設初始值,用語音信號的觀測序列對該初始值進行訓練,也即按照一定的方法對這些估值進行提純,對提純了的估值要接著進一步的提純,直到再沒有改進的余地,達到某個局部最佳值為止。傳統的訓練方法不保證訓練得到全域最優解,而且訓練所需要的時間非常巨大。
本文側重地研究了基因算法[5],并按照CHMM的特點構造染色體,用基因算法對CHMM進行訓練。基因算法自身的特點使得訓練結果趨向于全域最優解。同時,由于只需要用Viterbi算法計算語音的觀測序列對某一CHMM模型的相關概率,用作基因算法的適應函數,故該算法可以提高CHMM的訓練速度。
基因是生物學概念,之所以將基因算法引入HMM的訓練中,是因為HMM的訓練過程實際上是一個在特定范圍內將HMM模型進行一次次的迭代提純,選擇最優模型的過程。將基因算法引入CHMM的訓練,就是基于將CHMM看作在特定域的有約束的尋找最佳匹配點的問題。CHMM的狀態轉移矩陣A和輸出概率密度函數中的混合系數c矩陣的每一行向量之和為1.0,可看作是優化問題的約束條件。如果在選取CHMM的初始值時,不是選取一個初始值,而是選取一組分布于不同區域的初始值,以某一種特定的訓練方法,使其趨向于全域最優解,那么最終也同樣可以完成對CHMM的訓練。
根據待優化問題的數學模型,定義適合函數F(ai)。其中ai是某一條染色體,則適合函數F(ai)就是該染色體與目標函數的距離,或是判斷該染色體優劣的依據。對每一代基因,計算所有染色體的適合函數,進行排序選擇一定數目較優秀的染色體,作為生成下一代基因的父代樣本。自然界中染色體成對出現,時一對染色體分離、重組。多點交叉在實現時,可以設定交叉概率門限為ρc。染色體的長度為L,對于隨機數0≤rj≤1 (j=1,2,…,L),如果rj≥ρc,那么下一個變量屬于另一條基因,否則下一個變量與前一個變量屬于同一條基因。
最佳基因是在一代一代的基因重組和基因突變中形成的,是在選擇的作用下最適應的個體。基因突變有利于從局部最佳處跳出,防止算法的過早收斂。設定突變概率門限為ρm,對于隨機數0≤rj≤1 (j=1,2,…,L),如果rj≤ρm,那么染色體中第j個變量有突變現象發生;否則,復制原染色體的第j個變量。
基因算法的具體實現步驟參考文獻[5]。
HMM是用一個有限狀態系統作為語音特征參數的生成模型,每個狀態能產生連續的輸出特征。HMM實際上是一個特征參數發生器,依據其產生的參數與觀察到的語音參數的比較,從而識別語音。在識別時的判決依據是HMM模型的生成概率。
在將基因算法引入CHMM訓練的過程中,首先要解決的是染色體的構造問題。將CHMM模型的所有關鍵特征參數排列成一串,構成染色體。對于語音識別,采用自左向右的HMM模型,本文中為5狀態自左向右只含一階跳轉的CHMM模型。CHMM模型中參數由初始狀態向量π,狀態轉移矩陣A和每個狀態的輸出概率密度函數組成。
在CHMM模型中,染色體前一部分的行向量之和均為1。也就要求在產生染色體時,需對其進行一定的控制。在生成每一代染色體時,對這一部分行向量所對應的每一段染色體進行歸一化,則可以滿足CHMM的約束條件。
Viterbi算法在通常的CHMM語音識別中是作為識別算法的,換句話說,使觀測序列與CHMM模型經Viterbi算法的運算結果最大即為優化目標。基于這樣的思想,基因算法的適合函數為:所有該CHMM對應的觀測序列用Viterbi算法求其觀測概率之和,運算結果越大,則該染色體越優秀。
在實驗中染色體的前一部分依概率進行二點或多點交叉,而后一部分染色體只進行多點交叉,多點交叉概率ρc=0.8。染色體前一段的基因突變概率ρm=0.1;而對于染色體的后一部分,取ρm1=0.01,對應于以一個參數為單位發生基因突變;ρm2=0.08,以行向量為單位發生基因突變。經基因交叉或基因突變后,對染色體的前一部分需要進行各行向量的歸一化處理。每一代基因的數目為300,從中選出60條優秀的染色體作為新的父代基因,經基因重組和基因突變生成240條染色體,共同組成新一代染色體。CHMM模型的訓練問題現已轉化為求其對觀測序列適應概率最大值的問題,用基因算法求解。
訓練數據取自博域通訊一體化呼叫中心平臺產品BYICC2.0的IVR服務器在實際商業運行中產生的WAV錄音文件2000個。
2 利用基因算法訓練連續隱馬爾柯夫模型的語音識別技術在深圳市司法局社區矯正聲紋識別系統中的應用介紹
2.1 司法社區矯正的需求背景以及存在問題
司法社區矯正,是指將社區矯正對象置于社區內,由專門的國家機關負責并組織社會力量對其采取監督管理、教育、幫助措施,矯正其犯罪心理和行為惡習,促進其順利回歸社會的非監禁刑罰執行活動。盡管目前我國社區矯正工作中較普遍地應用了信息化管理手段,根據社區矯正的刑罰執行性質和非監禁特征,各地積極探索運用手機定位等現代科技手段加強對社區矯正人員的實時監管,具體的監管手段包含:手機實時定位監控、電子地圖越界告警、人機分離抽查等。現階段,很多司法社區矯正工作中應用到了諸如手機實時定位監控等高科技手段來實現對社區矯正人員的監控,但在具體操作中仍然存在一些問題和障礙,主要在現有手機定位監控的技術下,難以有效控制人為出現的“人機分離”現象。現有“人機分離”抽查手段主要有:電話抽查、短信抽查、拍照抽查等。雖然一定程度上降低了矯正對象“人機分離”的風險,但這些抽查手段皆無法確保是否為矯正對象本人,有脫管、漏管的可能性。
正是基于以上原因,博域通訊推出的社區矯正聲紋識別系統的主要功能是通過遠程電話錄音來對社區矯正人員進行身份認證,結合手機定位監控系統,促進社區矯正工作向合理化、人性化、智能化、效率化方向發展,推動社區矯正信息化建設,并有效破解移動定位監管“人機分離”的難題。
2.2 深圳市司法局社區矯正聲紋識別系統設計
2.2.1 系統應用體系架構
社區矯正聲紋識別方案中,包括聲紋識別系統、IVR自動語音服務系統并結合現有的手機定位系統以及后臺管理系統,同時,聲紋識別服務也涉及到了數據庫服務器之間的數據通信。
2.2.2 系統網絡架構
被矯正人員通過撥打固定電話號碼接入社區矯正聲紋識別系統,由內置電話語音板卡的IVR服務器將采集到的客戶語音,并通過調用聲紋服務器提供的接口函數與聲紋識別服務器進行交互。聲紋服務器將識別的結果反饋給IVR服務器以便進行相應的IVR語音流程控制,同時,社區矯正聲紋識別系統將被矯正人員的聲紋身份識別結果反饋給手機定位系統。其網絡拓撲結構圖如圖3所示。
2.2.3 系統業務流程
深圳市司法局社區矯正聲紋識別系統與現有手機定位系統結合后的主要業務流程如下圖:
2.2.4 系統運行結果主要指標
利用基因算法訓練連續隱馬爾柯夫模型的語音識別的司法社區矯正聲紋識別系統已于2014年1月在深圳市司法局上線投入運行。
聲紋識別技術在實際應用中,會根據說話人識別內容的不同分為文本相關驗證和文本無關驗證。深圳市司法局社區矯正聲紋識別系統,支持這兩種方式的驗證,根據實際工作和業務的需要,用戶可以選擇適合自己的聲紋驗證方式。
同時,與手機實時定位監控、電子地圖越界告警、電話抽查、短信抽查等傳統監管手段相比較,語音識別技術有效地控制了司法社區矯正中人為出現的“人機分離”現象。
3 結束語
模式識別從20世紀20年展至今,人們的一種普遍看法是不存在對所有模式識別問題都適用的單一模型和解決識別問題的單一技術,我們現在擁有的只是一個工具袋,所要做的是結合具體問題把統計的和句法的識別結合起來,把統計模式識別或句法模式識別與人工智能中的啟發式搜索結合起來,把統計模式識別或句法模式識別與支持向量機的機器學習結合起來,把人工神經元網絡與各種已有技術以及人工智能中的專家系統、不確定推理方法結合起來,深入掌握各種工具的效能和應有的可能性,互相取長補短,開創模式識別應用的新局面。基于模式識別技術的司法社區矯正聲紋識別系統能夠有效地破解移動定位監管“人機分離”的難題,其建設工作在我國司法系統目前尚處于起步階段,推廣和建設司法社區矯正聲紋識別系統具有重要的現實意義。
參考文獻
[1] 劉伯高.化工過程推斷估計的若干問題研究[D].華東理工大學博士論文.華東理工大學圖書館,2000.
[2] 王嵐,陳晶,王睿,等.幾種模式識別方法在生物信息中的應用[J]. 計算機與應用化學,2007,(1):8-12.
[3] 楊海峰,張德祥.模式識別理論和技術在語音識別研究中的應用[J].合肥學院學報:自然科學版, 2009,(1):40-46.
船舶運動模式的提取是軌跡數據分析的重要任務,它可以為船舶異常行為的檢測提供參考依據,同時也可以作為航路規劃和定線制設計的技術指標.針對現存的聚類算法大多為了追求效率而忽略了運動軌跡特征的問題,對聚類算法中的軌跡結構距離進行改進,將其作為軌跡相似度的評價標準.采用無監督DBSCAN聚類算法實現船舶運動模式的提取.利用瓊州海峽船舶自動識別系統(AutomaticIdentificationSystem,AIS)數據,對該水域的船舶運動模式進行提取,獲得行駛于該水域的船舶運動軌跡分布以及各類軌跡中轉向區域的分布,其中船舶運動軌跡包括從瓊州海峽東峽口向西航行的船舶軌跡,從瓊州海峽西峽口向東航行的船舶軌跡,從秀英港前往海安港的船舶軌跡,從海安港前往秀英港的船舶軌跡和從瓊州海峽東峽口前往海口港的船舶軌跡.將最終的聚類結果應用于電子海圖顯示與信息系統(ElectronicChartDisplayandInformationSystem,ECDIS)上,實現了對船舶的動態監控仿真.
關鍵詞:
船舶自動識別系統(AIS);模式識別;聚類分析;電子海圖顯示與信息系統(ECDIS);瓊州海峽
中圖分類號:U697.33
文獻標志碼:A 收稿日期:20150907 修回日期:20151102
0引言
隨著全球船舶自動識別系統(AutomaticIdentificationSystem,AIS)岸站的建立和不斷完善,各地海事主管機關時刻都能接收到大量有關船舶信息的數據.對這些數據的研究可以幫助我們提取船舶運動模式,分析船舶行為,從而進一步挖掘不同航線船舶、不同類型船舶的運動特點.例如:在一些運量較大的港口附近,對船舶運動軌跡進行分類能夠幫助監控人員識別異常行為;根據漁船運動的無規律性和貨船運動的周期性,利用聚類結果區分船舶種類,判斷運動特征是否與船舶類型相符,是否需要進一步的監控和調查.此外,船舶運動軌跡的聚類分析能夠為航路規劃和定線制的設計提供理論依據,有利于加強船舶動態監控,提高海事監管的效率.
目前國內外學者提出了諸多從目標對象的軌跡中獲取運動模式的方法.SHU等[1]利用自組織映射網絡作為預處理技術標記行人的運動特征,然后采用后向算法建立馬爾科夫模型,實現了對人行為模式的提取;胡宏宇等[2]以改進的Hausdorff距離作為相似度標準,采用譜聚類算法實現了對車輛軌跡空間分布的提取;聞佳等[3]利用加權的Hausdorff距離和周分割算法實現了車輛軌跡的聚類;RISTIC等[4]基于港口信息,采用核密度估計的方法對船舶軌跡進行分類;ETIENNE等[5]提出了一種基于統計學和圖論的軌跡聚類分析方法,該方法將船舶的起訖港作為節點,將相似軌跡歸一化為特定的有向路徑;AARSETHER等[6]采用圖像匹配的方法對船舶軌跡進行聚類;GERBEN等[7]對提取船舶運動模式的兩種主要的相似度對比的方法進行了分析,總結出二者中更適合于船舶軌跡聚類的方法;ANDERS等[8]將軌跡聚類應用于近海監控系統來識別船舶的異常行為;LAXHAMMAR等[9]通過高斯混合模型和核密度估計的方法對船舶運動進行統計分析,獲得有異常行為的船舶數據.此外,神經網絡和以K均值為代表的無監督聚類方法也被廣泛應用于軌跡聚類,如JONHSON等[10]建立自組織特征映射網絡學習軌跡分布模式,ATEV等[11]則利用K均值算法完成對軌跡的聚類.
海上交通與陸路交通有一定的相似性.道路被劃分為單行道、雙行道等,而航路也被劃分為單向航路和雙向航路.雖然海上交通的航行范圍廣闊,但在某些特定水域(港口、通航分道、狹水道)船舶密度較大,軌跡分布較密集.鑒于此特點,應用在陸路交通上的一些方法也可以應用到海上交通,以提高海上交通的監管力度和效率.
1AIS數據的預處理
由船舶交通管理中心(VesselTrafficServicecenter,VTS)提供的AIS數據通常具有較高的可信度,但是AIS數據中的船舶位置、船舶速度等信息會由于設備以及信號漂移等原因發生較大的改變,如AIS數據顯示船舶位于陸地上,顯示航速為35kn甚至更高[12].
為保證數據的可用,需要對數據做預處理,具體方法如下.
2軌跡聚類
移動目標軌跡的聚類能否取得良好的效果,在于軌跡間的相似性度量是否合理.當前主要的相似性度量的方法有基于歐氏距離的算法、基于公共子序列的算法、基于動態時間彎曲距離的方法和基于Hausdorff距離的方法,其中基于歐氏距離的算法通常用于計算等長的船舶軌跡相似性,其他的幾種方法可以用于不同長度的船舶軌跡相似性計算.以上方法都僅從距離方面反映相似度,而基于軌跡結構距離的相似性度量方法的優點在于能夠刻畫每條子軌跡變化的趨勢.因此,為便于度量船舶軌跡的變化,需要將整條軌跡劃分成若干條子軌跡.
2.1軌跡分割
船舶軌跡的劃分是通過設置船舶轉向角的閾值實現的.船舶軌跡轉向角是指相鄰兩個子軌跡段的航跡向之差,見圖1.
圖1中,a,b為軌跡中的兩條子軌跡段,其航跡向的夾角為θ1,即為這兩條子軌跡的轉向角.鑒于AIS數據的位置坐標采用的是WGS84坐標系,利用恒向線直接反解算法[13]求得兩條子軌跡段的航跡向,根據其航跡向的差值可以獲得船舶子軌跡間的轉向角.
恒向線直接反解算法的步驟如下.
2.2軌跡結構相似性度量
船舶子軌跡段相似性計算從子軌跡段的航跡向和兩條子軌跡段間的距離兩個方面進行.對兩方面的度量結果賦以一定的權重求和,形成軌跡的結構距離.
(1)船舶航跡向的比較.
如圖2所示,Li,Lj表示兩條航跡線,θ表示航跡段的方向夾角,J表示Lj相對于Li的偏轉程度.
航跡向對比方法為
通過上式不難發現:當夾角為0°時為最佳狀態,即兩條子軌跡方向完全一致;當夾角大于90°時可以認為兩條軌跡基本反向,將兩條軌跡的距離設置為無窮大,這樣有利于區分航向相反船舶的軌跡.
(2)位置的比較.
本文在兩條子軌跡段間距離的度量方面所采用的相似性度量方法為基于Hausdorff距離的方法:
式中:P(Li,Lj)為兩軌跡間的位置距離;h(Li,Lj)為兩軌跡間的直接Hausdorff距離;d(a,b)為a與b之間的歐氏距離.
船舶軌跡結構是指船舶軌跡所具有的屬性的集合,這些屬性刻畫了船舶軌跡的特性和狀態.船舶軌跡結構通常包含船舶運動信息,如:船舶的航跡向、船舶的位置.同時,在實際應用中還可以加入速度以及波動性的度量.進行軌跡相似性的比較時,充分考慮這些因素可以提高聚類的精度[14].依照式(8)和(9)可以求得子軌跡航跡向以及子軌跡間距離相似度.為計算軌跡結構的相似性,還需設定他們在軌跡結構中所占的權重W=(WT,WP),其中WT表示角度距離權重,WP表示位置距離權重.各權重值設定應滿足:權重值之和應為1;各權重值應為非負,同時不能大于1.通常情況下采用的是將結構距離中的權重平均分配.式(11)和(12)分別為結構距離和相似度計算方法.
2.3聚類算法
基于軌跡結構距離的聚類算法是以DBSCAN算法為框架的,即從子軌跡集合中任取一條軌跡并判斷在其鄰域半徑內是否包含滿足要求的最小實體數.如果滿足以上述條件,則認為是核實體,并搜索該實體的密度可達對象,標記為一類,直至子軌跡集合全部掃描完畢,未被標記的子軌跡則是孤立軌跡.具體的實現方法如下.
步驟1設定權重W,轉向角閾值ω,近鄰閾值η,近鄰的數目ε.
步驟2根據ω將軌跡T分割成若干個子軌跡Ti.
步驟3對子軌跡段Ti,計算其與未標記的子軌跡段的D和N,若滿足D和N條件的軌跡數目大于ε則將該子軌跡段標記為核心子軌跡段.
步驟4將Ti子軌跡段距離范圍D內滿足N條件的子軌跡段Tj與Ti聚為一類.
步驟5對Tj重復步驟3和4,將滿足條件的子軌跡段繼續歸為一類,如果Tj不再滿足上述條件,則重新從子軌跡集合中選取未被聚類的子軌跡段重復步驟3和4.直至軌跡集合全部掃描完畢.
3瓊州海峽應用實例與應用
瓊州海峽位于雷州半島與海南島之間,寬10~20nmile,長50~60nmile,是廣州港、湛江港等港口與北部灣各港口海上交通的捷徑.瓊州海峽主要可分為3部分,分別為:瓊州海峽東口,包括外羅水道、北水道、中水道和南水道;瓊州海峽西口,包括燈樓角與臨高角聯線以西、兵馬角所在經度線以東水域,該水域是來往于瓊州海峽駛往八所港、三亞港等地的轉向點,也是往北部灣各港口的轉向點;瓊州海峽中部,包括山狗吼燈塔經度線以西、燈樓角與臨高角聯線以東水域,該水域的水較深(20~118m),礙航物較少.
算例采用32位WIN7系統、2GRAM,在VS2010編譯條件下提取750條船舶運動軌跡進行聚類,獲得了5類結果,見圖3.A類結果為從瓊州海峽東峽口向西行駛于通航分道內的船舶的航行軌跡分布、B類結果為從瓊州海峽西峽口向東行駛于反向航道的船舶的航行軌跡分布、C類結果為從海安港到秀英港的船舶的航行軌跡分布、D類結果為從秀英港到海安港的船舶的航行軌跡分布、E類結果為瓊州海峽東峽口向西行駛進入海口港的船舶的航行軌跡分布.
3.1算法分析
為比較算法的優劣,將基于軌跡結構距離的DBSCAN算法與傳統的DBSCAN算法進行對比,結果見表2.
表2算法對比結果
從表2中可以看出,基于軌跡結構距離的DBSCAN算法在運行時間方面劣于傳統的DBSCAN算法,但是在分類結果和準確度方面皆優于傳統的DBSCAN算法.這是因為:基于軌跡結構距離的DBSCAN算法需要進行軌跡的分割、角度的度量、歸一化等操作,增加了計算復雜度;該算法以軌跡特征為參考,從多方面計算軌跡相似度,易發現比較隱蔽的軌跡群,使其聚類效果優于傳統的DBSCAN算法的聚類效果.
3.2聚類應用
將上述所獲得的船舶軌跡聚類的結果應用到船舶監控、異常檢測上,能夠大幅度提高海上安全保障能力,防止海上交通事故的發生[15].
3.2.1速度監控
速度監控是利用監控水域的AIS信息,對聚類結果中的船舶速度進行統計,獲得船速分布圖.根據實際工作中的經驗和需要,確定行駛于該監控水域的船舶速度監控范圍.圖4是對從瓊州海峽東峽口航行至海口港的船舶速度統計.對于該監控水域,本文以80%船舶運營速度(9~14kn)為標準.
圖5為監控系統的速度報警,可以看出編號為A的船超速,說明該船航速不在監控航速范圍內,予以報警.
3.2.2位置監控
位置監控主要是對航行于聚類結果區域的船舶進行船位的實時監控,如果船舶偏離監控水域,本船和監控系統應給予報警和提示,提醒監控人員和船舶駕駛員關注船舶動向.圖6a為本船的位置報警示意圖,圖6b為監控系統的位置報警示意圖.
3.2.3航向監控
航向監控主要利用AIS數據對聚類結果中船舶航向進行統計,獲得船舶的航向分布,以此作為監控依據.圖7a是對從瓊州海峽東峽口到海口港的聚類結果中船舶轉向后的航向統計結果.圖7b和7c為本船和監控系統的航向報警示意圖.
綜上所述,可以得到船舶監控的實現流程圖(圖8),首先對進入監控水域的船舶進行位置監控(若偏離監控水域則報警),然后進行速度監控(判斷速度是否超出規定范圍,如果超出則進行速度報警),接著進行航向的監控直至船舶駛離監控水域.
4結論
本文利用軌跡結構距離作為相似性的度量標準,對軌跡段間的相似性進行評價,采用無監督的DBSCAN算法將相似性接近的船舶軌跡歸為一類,實現了對船舶運動模式的提取.以瓊州海峽為例,利用預處理過的部分瓊州海峽AIS數據,將航行于該水域的船舶軌跡分為5類,分別為從瓊州海峽東峽口向西航行的船舶軌跡、從瓊州海峽西峽口向東航行的船舶軌跡、從海安港到秀英港的船舶軌跡、從秀英港到海安港的船舶軌跡以及從瓊州海峽東峽口向西航行進入海口港的船舶軌跡.從瓊州海峽東峽口向西航行的船舶軌跡位于(20°14′25″N,110°26′20″E)與(20°09′05″N,110°01′24″E)之間的通航分道內;從瓊州海峽西峽口向東航行的船舶軌跡分布于(20°13′N,110°26′20″E)與(20°06′45″N,110°01′24″E)之間的通航分道內;從瓊州海峽東峽口向西航行進入海口港的船舶軌跡,其轉向位置大約發生在以(20°10′16″N,110°14′08″E)為圓心,半徑為0.5nmile的水域范圍內.將聚類的結果與ECDIS模擬器相結合,從船舶位置、速度、航向等3個方面實現了船舶動態監控的仿真.實驗證明船舶運動模式識別能夠有效地應用于船舶動態監控,進而保障航行安全,增強海上安全保障能力.
參考文獻:
[1]SHUHM,KATSU.TraininghiddenMarkovmodelstructurewithgeneticalgorithmforhumanmotionpatternclassification[C]//SCIICASEInternationalJointConference.Busan:IEEEPress,2006:618622.
[2]胡宏宇,王慶年,曲昭偉,等.運動目標空間模式識別與異常行為檢測[J].吉林大學學報,2011,41(6):15981602.
[3]聞佳,崔維.實時視頻中的車輛運動軌跡的提取和聚類[J].計算機工程與應用,2010,46(11):155157.
[4]RISTICB,SCALARL.StatisticalanalysisofmotionpatterninAISdata:anomalydetectionandmotionprediciton[C]//11thInternationalConferenceonInformaiton.Fusion,Cologne:IEEEPress,2008:17.
[5]ETIENNEL,DEVOGELET.Similarityanalysisofmobileobjectstrajectoriesfollowingthesameitinerary[J].IngenierieDesSystemesD’information,2009,14(5):85106.
[6]AARSETHERKG,TORGEIRM.EstimatingnavigationpatternsfromAIS[J].JournalofNavigaiton,2009,65(4):587607.
[7]GERBENKDV,MAARTENVS.Ananalysisofalignmentandintegralbasedkernelsformachinelearningfromvesseltrajectoris[J].ExpertSystemswithApplications,2014,41(2):75967607.
[8]ANDERSD,LARSN.Trajectoryclusteringforcoastalsurveillance[C]//10thInternationalConferenceonInformationFusion.Quebec:IEEEPress,2007:18.
[9]LAXHAMMARR,FALKMANG,SVIESTINSE.AnomalydetectioninseatrafficacomparisionoftheGaussianmixturemodelandthekerneldensityesimator[C]//12thInternationalConferenceonInformaitonFusion.Seattle:IEEEPress,2009:756763.
[10]JOHNSONN,HOGGD.Learningthedistributionofobjecttrajectoriesforeventrecognition[J].ImageandVisionComputing,1996,14(8):609615.
[11]ATEVS,MASOUDO,PAPANIKOLOPOULOSN.Learningtrafficpatternsatintersectionsbyspectralclusteringofmotiontrajectories[C]//IEEEInternationalConferenceonIntelligentRobotsandSystems.Beijing:IEEEPress,2006:48514856.
[12]QUXB,MENGQ,LISY.ShipcollisionriskassessmentfortheSingaporestrait[J].AccidentAnalysisPrevention,2011,43(3):20302036.
[13]史國友,朱公志,賈傳熒,等.恒向線主題直接正反解的高精度算法[J].大連海事大學學報,2009,35(2):59.
一、3G用戶細分體系架構
用戶細分是3G業務開發及市場營銷的基礎,用戶細分能夠使差異化成為可能,使運營商提供的3G產品和服務能夠更有針對性。3G用戶細分方法的選擇直接決定了相關用戶細分結果的準確性及實用性。對于3G用戶細分的體系搭建的思路是: 采用3 個緯度進行用戶的細分,首先按照用戶價值緯度進行用戶細分,然后再結合消費行為緯度和消費心理緯度細分用戶群。在3G用戶細分的體系架構中,3個緯度的用戶細分依據、方法及應用價值如表1 所示。
二、客戶識別分類模型
(一)數據抽取
本案例數據來源于某電信運營公司,該數據總量為26000條。每一條對應一個客戶近六個月的統計信息。其中已知分類(2G、3G)的為18000條,未知分類8000 條。其中包括客戶年齡,月平均消費額,月平均通話時長等屬性250 個(包括客戶類型)。本例利用26000條已知分類的數據進行分類模型的建立,隨機抽取訓練數據10000條,測試數據8000條。
(二)數據預處理
上述采集的數據有數據多、數據取值范圍廣和數據取值類型多樣的特點,因此必須在建模前對數據進行預處理,如采集的樣本數據存在一些屬性值缺省或空值,如果不做處理,將直接影響后續算法的挖掘效果,嚴重時甚至得到錯誤的結果。數據預處理包含數據清洗、屬性篩選、數據平衡、數據歸一化和離散化五個步驟。數據清洗分為類型轉換和缺失數據填補兩部分;屬性篩選分為人工篩選和通過相關系數分析實現屬性選擇兩部分;由于作為訓練的18000條數據只有少數是3G用戶,這樣會導致模型輸出結果偏向判別為2G 客戶,因此必須通過數據平衡實現2、3G用戶數量達到1:1;為了提高BP 神經網絡的性能,需要對數據進行歸一化;對于決策樹算法,需要對數據進行離散化,否則生產的決策樹將會過于茂盛,以至于無法分析。
三、客戶數據分類識別過程
本文分別采用BP 神經網絡和決策樹進行建模,實現對3G 客戶的分類識別。本案例運用TipDM 數據挖掘在線建模平臺中的性分析進行數據探索,再運用BP 神經網絡和C4.5 決策樹進行客戶識別。(一)模型輸入。本案例中,模型數據涉及客戶年齡、月平均通話時長和月平均消費額等240多個屬性(包含客戶類型),模型輸入需將客戶識別樣本屬性表導入建模平臺中即可。(二)仿真識別過程。建模仿真過程說明如下:1.登錄TipDM 平臺,在方案管理頁面中,新建方案或者打開一個已建方案;2.切換到數據管理頁面,上傳經預處理后的專家樣本數據文件;3.選擇相關性分析功能,導入樣本數據進行相關性分析;4.分別選擇BP 神經網絡算法和C4.5 決策樹算法,進行模型構建;5.對比BP 神經網絡和C4.5 決策樹的建模結果,并選擇最優算法;6.用最優法對測試樣本進行3G 客戶識別。(三)仿真結果分析。1.基于BP 神經網絡的模型構建。由于神經網絡算法輸出結果受到訓練次數影響,并伴隨一定的隨機性,多次實驗得到的分類正確率如下表所示。
四、總結與建議
決策樹與BP神經網絡對于3G客戶的識別正確率都接近80%,說明本用例建立的分類模型對3G客戶的敏感度比較高,基本能識別出3G用戶,能達到預期目標。但是只看3G客戶的識別正確率是不科學的,還要看2G 客戶的識別正確率和總體識別正確率。從總體正確率看,BP 神經網絡的正確率仍然比決策樹高近10%,BP神經網絡無論是總體性能還是對局部分類的敏感度都表現不錯,而決策樹分類模型性能還有待提高。
雖然本例的客戶識別未能達到百分百地準確,但從另外一個角度看,一味追求正確率并沒有太多意義。因為本來運營商對各個用戶的類別就已經作了登記,反而,我們或許能從客戶的誤識別中獲得更多信息。
關鍵詞:環境激勵 模態參數識別
中圖分類號:N945.14
隨著我國大型土木工程結構的大量建設,結構的監測評估越來越受到重視,但由于其結構的復雜性,傳統的模態測試方法實施難度大、成本高,已不能滿足工程需要。基于環境激勵的模態參數識別方法具有不影響結構正常使用、僅需結構的輸出響應便可識別結構的模態參數等優點越來越受到國內外的關注。近年來
基于環境激勵的態參數識別方法又有了新的發展,本文參考國內外最新研究成果對其進行了詳細的綜述,并在此基礎上指出其存在的關鍵問題和研究發展方向。
1. 模態參數識別方法:
1.1 峰值法
峰值法是一種最簡單的模態參數識別方法。最初是基于結構自振頻率響應函數上會出現峰值,成為特征頻率的良好估計[2]。Bao和Ko[3], Lin和 Nikaeen[4],Luz[5]等率先利用功率譜峰值法提取模態參數,用這種方法得到自振頻率并用半功率帶寬法計算阻尼,最后用各響應點和參考點的互譜密度函數值和自譜密度函數值確定振型方向和振型分量比值得出振型。在此基礎上,進而產生了頻域分解法、聯合時域分析法[6].近來應用實踐中,王睿等[7]提出了一種基于峰值法及穩定圖原理的鋼結構塔模態參數識別方法,利用穩定圖原理處理的一階段處理圖在三維坐標中進行呈現,并進行二次處理,得到了良好的效果。
1.2 自然激勵技術(NExT)
由美國SADIA國家實驗室的James和Carne提出,用來獲取模態識別所需的自由響應數據[8-9]韓建平等[10]基于Hilbert-Huang 變換和自然激勵技術,提出了一種新的模態參數識別方法,首先通過經驗模態分解和Hilbert 變換提取信號的瞬時特性,進而利用自然激勵技術和模態分析的基本理論識別結構的模態頻率和模態阻尼比。李萬潤[11]基于傳遞函數提出了一種基于ARX(Auto Regressive model with exogenous input)模型建立偽傳遞函數(Pseudo-Transfer Function)的損傷定位方法,并結合自然激勵技術對其進行了改進,可將該方法應用于環境激勵下結構的損傷識別。
1.3 時間序列法
時間序列法是一種利用參數模型對有序的隨機采樣數據進行處理,從而進行模態參數識別的方法。用到得參數模型有:AR模型、MA模型、ARMA模型和ARMAX模型 [12-15].各種模型參數估計的算法有最小二乘法、Levinson法、Burg法、先后估計法和長自回歸白噪法。1969年,Akaile[16]首次利用自回歸滑動均值模型進行白噪聲激勵下的模態參數識別。
1.4 隨機減量法
隨機減量法[17-19]的步驟為:
(1)將響應信號分成若干相等長度的段,并對其進行疊加,得到自由衰減的振動信號。
(2)結合其他模態識別方法識別模態數據。Y.Jann N[20]等人闡述了隨機減量法的數學基礎;Ibrahim把隨機減量法運用到了多通道信號領域。此方法僅適用于白噪聲激勵的情況。
1.5 隨機子空間法
隨機子空間法是目前比較先進的識別方法,但是處理數據時間長。近年來,同濟大學的常軍、張啟偉、孫利民[21,22,23]等人對其計算效率進行了改進。這種方法的步驟為:
(1)采集環境激勵下結構的動力響應數據。
(2)對動力響應數據進行預處理,并求得結構的系統矩陣。
(3)根據根據結構的系統矩陣提取結構的模態參數(固有頻率、阻尼比、振型等)。
(4)對模態參數的識別結構進行分析,作出穩定圖[24]。根據加權方法的不同有三種算法:UPC算法、CVA算法、PC算法,從計算結果看,PC算法的精度較高[25].
1.6 特征系統實現算法(ERA)
特征值實現算法通過構建hankel矩陣求得系統的特征值和特征向量,從而得到模態參數,且其主要難點在于準確確定hankel矩陣。Pappa[26]等對其進行了持續的研究。祁泉泉等[27]在此算法基礎上引入觀測馬科夫(Observer Markov)參數,推導并提出了擴展特征系統實現算法(EERA)。
1.7 時頻分析方法
時頻分析方法分為線性時頻分析方法和雙線性時頻分析方法。作為一種新的參數識別方法,越來越受到人們的關注。近年來其熱點主要包括:魏格納分布( WVD)、短時傅里葉變換(STFT)、時變ARMA參數化模型[28-31]、小波變換(WT)、Hiber-黃變換(HHT)。
2 存在的關鍵問題及研究發展方向
現有的基于環境激勵模態參數的識別方法雖然有了很大的發展,但是由于噪聲的干擾、非穩態激勵的存在、結構外部環境的變化,使其在實際工程中遇到了許多問題。其研究發展趨勢主要有:
(1)信號降噪處理目前仍為研究的熱點。
(2)研究具有自主產權的實驗模態分析系統。
(3)對非穩態環境激勵下的模態參數識別問題研究。
(4)溫度、風力等環境因素影響是模態參數識別的一個重要問題。
(5)真實模態與虛假模態參數識別具有遠大的發展前景。
參考文獻:
[1] 任偉新. 環境振動系統識別方法的比較分析. 福州大學學報(自然科學版),2001,29(6):80-86.
[2] 王睿,劉曉平,張鵬. 一種基于峰值法及穩定圖原理的鋼結構塔模態參數識別方法[J].信息通信,2012,121(5):77-78.
[3] 韓建平,李達文. 基于 HILBERT-Huang 變換和自然激勵技術的模態參數識別[J]. 工程力學,2010,27(8):54-59.
[4] 李萬潤. 基于模型修正與時序分析的結構損傷識別方法研究[D].蘭州理工大學 2013.
[5] 趙永輝,鄒經湘.利用ARMAX模型識別結構模態參數[J].振動與沖擊.2000,19(1):34-36.
[6] 劉齊茂.用隨機減量技術及ITD法識別工作模態參數[J].廣西工學院學報.2002,13(04):23-26.
[7] 黃方林,何旭輝,陳政清等.隨機減量法在斜拉橋索模態參數識別中的應用[J].機械強度.2002,24(03):331-334.
[8] 常軍,孫利民,張啟偉.基于兩階段穩定圖的隨機子空間識別結構模態參數[J].地震工程與工程振動,2008,28(3):47-51.
[9] 常軍.隨機子空間方法在橋梁模態參數識別中的應用研究[D].博士學位論文.上海:同濟大學,2006.
關鍵詞 可變樣本 BP網絡 模式識別
Abstract Mean shifts in production process could be detected quicker by the application of variable sampling rate (VSP)control charts。In this paper, a framework which using the integration of Variable sample sizes and sampling intervals(VSSI) and back-propagation(BP) networks for process controlling and non-normal patterns recognition was proposed, and the sampling rate groups and BP networks group model were designed.
Keywords: Variable sampling BP Networks patterns recognition
引言
統計過程控制(SPC)在生產過程中的應用主要是為了維持特定質量特性的穩定性和可接受性,其中,休哈特控制圖作為SPC的重要工具之一,也是最常采用的手段。控制圖呈現的狀態可以反映生產過程是否受控,當出現非受控情形,需要對其異常模式進行識別并進行相應的調整。在控制圖異常模式識別的研究中主要集中于人工神經網絡(ANNs)D T Pham和E Oztemel[1]采用學習矢量量化(LVQ)網絡組建立了一個控制圖異常模式識別系統,并討論了提高識別器精度方法;S K Gauri和S Chakraborty[2]采用經由反向傳播算法訓練的多層感知神經網絡構建了異常模式識別器,并對其進行了評估。C S Cheng和C A Tzeng使用反向傳播網絡進行了控制圖異常模式識別的研究[3]。本文中采用BP神經網絡來進行控制圖異常模式識別。
另一方面,傳統的休哈特控制圖采用固定樣本容量和抽樣區間的方式進行樣本組的抽取。近些年來對可變樣本參數控制圖的研究表明可變樣本容量(VSS)與可變抽樣區間(VSI)的控制圖能夠更快地發現生產過程中存在的微小變化。A F B Costa[4]對可變樣本參數的控制圖進行了深入研究,提出了可變警告限的方法并通過與CUSUM和EWMA的對比,證明了該方法可以獲得更高的靈敏度;Y C Lin與C Y Chou[5]采用Burr分布,針對非正態分布的情況下設計了可變樣本容量與區間(VSSI)的均值圖,并通過對比驗證其具有更高的精確性和魯棒性。
本文結合VSSI的均值-極差控制圖,提出一種采用BP網絡進行過程控制,以及控制圖異常模式識別的系統框架。
1 系統實現框架
系統的主要功能包括模式識別與樣本參數組控制兩大方面,在系統的應用過程中,需要綜合考慮異常模式識別與樣本參數選擇和控制圖數據之間的相互關系。經過對系統的分析,確定系統包括三個模塊,分別是:傳遞模塊、異常模式識別模塊、樣本參數反饋模塊。系統的總體框架如圖1所示:
圖1 系統總體框架圖
(1)傳遞模塊 該模塊的主要作用是接收生產過程中采集的質量數據,并初步判斷是否超出控制限,若超出控制限則將數據只傳遞至異常模式識別模塊,同時自行生成樣本參數調整信號,反之傳遞至異常模式識別模塊與樣本參數反饋模塊;此外,該模塊接受異常模式識別模塊反饋的模式識別結果,并反饋至生產過程決策端以供誤差識別與調整使用,同時接受樣本參數模塊的反饋結果,并傳遞是否調整樣本參數的信號至生產過程的信號采集端。該模塊即為系統的中轉站。
(2)異常模式識別模塊 該模塊的主要作用是根據傳遞模塊所傳送的生產過程數據,通過內置神經網絡,對其進行模式識別,并將模式識別的結果反饋至傳遞模塊。
(3)樣本參數反饋模塊 該模塊的主要作用是根據經由傳遞模塊轉達的過程數據,通過當前內置控制圖參數進行判斷是否需要更改控制圖參數,將判斷結果以選擇信號的形式反饋至傳遞模塊。
系統工作的流程圖如圖2所示:
圖2 系統流程圖
為了實現基于可變樣本參數與神經網絡的控制圖異常模式識別系統,使其能夠滿足控制圖異常模式識別和控制圖參數可變的需求,系統需要解決兩個方面的問題, 分別為可變參數控制圖樣本參數的選取和異常模式識別模塊的設計,本文其后將詳細探討這兩個方面。
2 可變樣本參數控制圖的主要原理
可變樣本容量與抽樣區間控制圖是近些年來興起的應用方向,與傳統的休哈特控制圖不 同的是,可變樣本容量與抽樣區間控制圖一般設計為具有兩組或以上取樣參數的模式,從而能根據當前系統的過程數據,靈活確定樣本參數,從而提高效率。考慮到對于一般的過程控制,當取樣模式大于兩種時,在取樣行為更改與實施過程中所耗費的時間可能會大于所節省的時間,因此,本文采用兩組取樣參數s1(n1,h1)和s2(n2,h2),其中n和h分別代表樣本容量與抽樣區間。其中,s1為較小樣本容量和較大取樣區間,對應于良好的過程情況,反之,s2為較大樣本容量和較小取樣區間,對應于需要密切監控的過程情況。假設過程均值為 ,標準差為 ,兩組模式的上下控制限分別表示為UCL1、LCL1和UCL2、LCL2,上下警告限分別表示為UWL1、LWL1和UWL2、LWL2。其計算公式如式(1)和式(2),其中k為控制限系數,w為警告限系數。
(1)
(2)
通過定義樣本點可控概率p0,平均樣本容量n0,以及固定取樣區間h0,樣本容量n1和n2之間必須滿足方程(3),取樣區間h1和h2之間必須滿足方程(4):
(3)
(4)
通過采用控制限與警告限,VSSI控制圖分為三部分:中間區域、警告區域和活動區域。在其應用于控制的過程中,當樣本點位于中間區域時,則認為過程受控,采用模式s1進行下一組取樣;反之,當樣本點位于警告區域時,認為過程具有不受控的風險,采用模式s2進行下一組的取樣;當樣本點超過控制限,即處于活動區域,則發出信號。
此外,本文結合系統特點,對樣本參數的選擇作出了更改:當異常模式識別模塊發現異常模式時,同時將異常信號經由傳遞模塊傳送至樣本參數選擇模塊,在接下來的過程中,采用樣本參數組s2進行取樣,即視作具有不受控風險的情況對待。
3 異常模式識別模塊
BP神經網絡是一種典型的指導學習型網絡,經常用于識別、預測和分類,其結構包括輸入層、輸出層及中間的隱藏層,如圖1所示。BP網絡每層神經元的數目通常根據問題復雜程度確定,同時過多的神經元數目會導致訓練時間過長,本文采用56-35-1和56-35-4結構的三層結構BP網絡。
圖3 BP網絡結構圖
根據經驗總結,控制圖中常見的異常模式包括:①一個點遠離中心線超過3個標準差;②連續7點位于中心線一側,即偏移模式;③連續6點上升或下降,即趨勢模式;④連續14點交替上下變化,即周期模式。這些異常模式反映在控制圖上,可以通過圖3[6]中6種波動模式進行表達。
圖4 控制圖異常模式
識別器模塊由兩個子模塊組成,如圖2所示,其中子模塊1為一個56-35-4結構的BP網絡,其作用為接受控制圖數據輸入,將其分類為相應的異常模式,隨后將其相應的參數傳送至下一子模塊中相應的BP網絡模塊。子模塊2中為四個56-35-1結構的BP網絡B、C、D,其工作模式為接受網絡A發送的參數并進行識別,以得出是否屬于異常的結論,B、C、D對應的模式參數均為0或1,網絡A的輸出值對應模式識別結構如表1所示。
表1 BPN A輸出值與模式對應表
模式 輸出
1 2 3 4
正常 1 0 0 0
偏移 0 1 0 0
趨勢 0 0 1 0
循環 0 0 0 1
圖5 異常模式識別器結構圖
結語
本文研究了將可變樣本容量參數控制圖與BP神經網絡異常模式識別器集成于一體的系統框架,該系統的主要思想是采用可變樣本參數的方式提高過程效率,同時結合由BP神經網絡構建的異常模式識別器對生產過程進行誤差實時識別和診斷,并提高抽樣效率。該方法將可變樣本參數控制圖的優點與神經網絡模式識別的功能相結合,相對于單一的模式識別網絡具有功能優勢。由于時間關系,未能開發原形系統來進行實例驗證。同時,希望在以后的工作中,可以繼續完善,使其能夠實現包括誤差源等更多層次的功能,從而更大地提高工作效率。
參考文獻
[1] D T Pham, E Oztemel. Control chart pattern recognition using learning vector quantization networks [J]. International Journal of Production Research, Vol 32, Issue 3, 1994 , p 721 C 729.
[2] S K Gauri, S Chakraborty. Improved Recognition of Control Charts Patterns Using Artificial Neural Networks [J]. The International Journal of Advanced Manufacturing Technology, Vol 36, p11-12, 2008.
[3] C S Cheng, C A Tzeng. A Neural Network Approach for Detecting Shifts in the Process Mean and Variability [J]. Computer Industrial Engineering, Vol28, p51-61,1995.
[4] A F B Costa. Xbar Charts with Variable Sample Sizes and Sampling Intervals [J]. Report Series in Quality and Productivity, No 133, 1995.
【關鍵詞】近視眼 屈光,眼 角膜
中圖分類號:R779.63 文獻標識碼:B 文章編號:1005-0515(2011)6-071-02
近年來,隨著現代眼科屈光手術的不斷發展,使越來越多的近視患者獲得了良好的視力。而透鏡焦度、角膜中央厚度、角膜曲率對合理選擇手術及設計手術方案非常重要,并在很大程度上直接關系到屈光手術的安全性和矯正的可預測性。因此,我們對840例準分子激光手術患者的術前檢查結果進行了回顧性分析,探討透鏡焦度、性別與角膜厚度、角膜曲率的關系。
1 資料與方法
1.1 對象選擇 本組840例(1670只眼)均為2007年9月~2009年4月來我院眼科接受準分子激光屈光手術的近視患者。所有病例無眼部不適癥狀,眼科常規檢查無異常,排除散光≥2.00 D。年齡18~45歲,平均(23.35±4.56)歲。其中男性480例(954只眼),平均(22.4±4.26)歲,女性360例(716只眼),平均(26.15±5.89)歲。所有病例均遵從等效球鏡原則(等值球鏡=球鏡度數+1/2散光度數),根據透鏡焦度將1670只眼分為3組,低度近視組(-6.00D),680只眼。根據性別分為2組,男性組480例(954只眼),女性組360例 (716只眼)。
1.2 檢查方法
1.2.1 驗光 對所有病例進行復方托品酰胺充分散瞳使睫狀肌麻痹后用TOPCON RM-8000電腦驗光,然后用槍影鏡檢影驗光,結合瞳孔恢復后主覺驗光,確定近視透鏡焦度,透鏡焦度以最佳視力最低度數為準,排除散光≥2.00 D,并計算等值球鏡度數。
1.2.2角膜地形圖檢查 采用ORBSCANⅡ型角膜地形圖儀進行檢查,分別記錄角膜水平曲率K1值和垂直曲率K2值。
1.2.3 角膜中央厚度測量 用超聲角膜測厚儀(DGH-500)測量角膜中央厚度每眼3次,取最小值。
1.3 統計學處理 運用SAS 8.1統計軟件分別對測量數據進行方差分析,P
2 結果
2.1 透鏡焦度 輕、中、高度近視的角膜厚度分別為(541.33±36.23)、(536.34±33.36)、(535.80±34.13)μm,統計學處理有顯著性差異,中、高度之間無顯著性差異。輕度近視的角膜比中、高度角膜厚。三組角膜水平曲率比較無顯著性差別,三組的垂直曲率分別為(43.71±1.46)、(43.95±1.60)、(44.39±1.63)D,三組比較有顯著性差別(P=0.000 1),說明隨著近視度數的增高,角膜垂直方向有變陡的趨勢。見表1。
表1 輕、中、高度近視各組間角膜中央厚度、角膜曲率比較
2.2 性別 男性角膜厚度、角膜水平曲率、垂直曲率954只眼分別為(537.86±38.23) μm、(42.71±1.51)、(43.83±1.69)D,女性為(533.07±38.67) μm、(43.91±14.20)、(44.51±1.50)D,三者比較有顯著性差異(P
3 討論
透鏡焦度與角膜中央厚度的關系存在一定的爭議。有學者認為角膜厚度與近視透鏡焦度之間無明顯相關性[1~3]。范艷華等[4]認為角膜中央厚度與透鏡焦度間呈正相關,角膜厚度每增加95μm透鏡焦度上升1D。倪焰等[5]認為低度近視的角膜厚度最高,與其他2組間均有統計學差異,而中、高度之間的角膜厚度無統計學差異,與本研究相似。本研究中低度近視與中、高度近視的角膜厚度有顯著性差異(P
角膜曲率對近視透鏡焦度的影響,國內進行了許多研究,結論尚有爭議[6~8],本組顯示3組間角膜水平曲率無統計學差異,但垂直曲率有顯著性差異(P=0.0001),說明隨近視度數的增高角膜垂直方向變陡。提示近視除眼軸增長外同時也受角膜曲率改變的影響。
性別與角膜曲率、角膜厚度的關系,本研究中男性角膜厚度為(537.86±38.23) μm,女性角膜厚度為(533.07士38.67) μm,統計學分析顯示性別之間的角膜厚度差別有明顯的統計學意義,男性角膜厚度大于女性。也有學者認為角膜厚度與性別無關系[9]。本研究還顯示,男性角膜曲率和女性角膜曲率比較,有明顯的統計學意義(P
以上問題之所以存在爭議,可能與所研究的病例構成樣本大小及使用的測量儀器不同有關,這些問題還需要進一步研究。而透鏡焦度、角膜厚度及角膜曲率是準分子激光屈光手術前必不可少的檢查,在眼的屈光系統中,角膜曲率對眼球屈光狀態影響很大,它的整體屈光力大約為+43.00D,占眼球屈光系統的3/4,角膜曲率的輕微改變都會對屈光狀態產生影響,角膜厚度個體差異較大,對手術方式的選擇有重要的指導意義。因此,在角膜屈光手術前,精確地分析透鏡焦度、角膜厚度及角膜曲率能使我們在不同性別、不同透鏡焦度的手術方式的選擇、手術計劃的設計上更趨安全。
參考文獻
[1] 熊潔,鄧應平.影響近視眼患者近視屈光度的相關因素分析 [J].眼科,2006.15(5):321―323.
[2] 倪海龍,王勤美,許琛琛.等.Orbscan測量近視眼角膜厚度 [J].眼視光學雜志,2001.3(3):137―139.
[3] 吳苗琴,徐志能.洪朝陽.等.LASIK術眼角膜厚度與眼壓及屈光度相關性研究[J].眼外傷職業眼病雜志,2005,27(10):744 746.
[4] 范艷華,彭清華,曾自明.等.近視跟角膜中央厚度相關因素分析[J].中國中醫眼科雜志.2006,16(2):81―83.
[5] 倪焰.孫建寧,魏春惠,等.近視眼屈光、角膜厚度與眼壓三者間的相關分析[J].眼科新進展.2004,24(4):289―290.
[6] 杜連娟,孟樣毓.陳明,等.近視眼的眼軸與角膜屈光力相關研究[J].實用眼科雜志,1998,16(6):361―362.
[7] 張悅,張國輝。廖世煌.等.近視相關的多因素分析[J].眼科研究.1997,15(1):54―56.
[8] 高昌衛,賀景波,孫紅玲,等.4227只近視眼的角膜厚度測量及分析[J].臨床眼科雜志,2003,1l(4):353―354.
[9] 韋斌,具爾提,付玲玲,等.影響近視跟角膜中央厚度的多因素分析[J].國際眼科雜志,2006.6(4):818-820.
關鍵詞:模式識別;本科教學;教學實踐;教學改革
隨著電子信息技術的迅速發展和信息處理自動化需求的不斷擴大,模式識別方法和技術在信息處理領域中的重要性越來越受到重視。在吸引了眾多研究者投身到模式識別研究領域的同時,模式識別的教學也從研究生教學逐漸延伸到了本科教學。模式識別作為計算機、電子信息技術等專業的專業基礎課程,已經在越來越多的高等院校開設。本科模式識別課程主要討論以統計學為基礎的模式識別理論和方法,內容包括:貝葉斯決策理論以及參數估計方法、以誤差函數最小化為原則的線性和非線性判別、近鄰規則、特征提取和選擇、聚類分析、神經網絡、支撐矢量機、隨機方法、非度量方法、獨立于算法的機器學習等內容[1]。由于模式識別研究領域的廣泛性,模式識別本科教學的內容和側重點的安排目前尚處于探索階段。模式識別領域的發展日新月異,這就要求教師在授業解惑的同時能夠與時俱進地介紹該領域的發展前沿,從而培養學生主動探索知識的興趣。
本文將結合本科模式識別教學的實踐,分析該課程在內容設置方面面臨的問題并給出相應的解決問題的建議;結合模式識別課程的特點,提出了以應用實例為先導的教學方法,以提高學生的學習興趣;針對不同類型的學生,提出了如何培養學生實踐能力和科研興趣的方法。
1模式識別教學內容的層次劃分和講授方法
模式識別是一門理論與實踐緊密結合的學科,其理論基礎涉及高等數學、線性代數、數理統計、矩陣論、隨機過程、工程優化方法、小樣本統計學習理論、模糊數學等學科[2]。然而除了高等數學、線性代數和數理統計,其他課程都是研究生階段才會開設的數學基礎課。這就使得本科的模式識別教學面臨著尷尬的局面:既不能花過多的時間講數學基礎知識,又要把以這些數學知識為基礎的內容講清楚。面對這一難題,我們在教學實踐中總結出了一套辦法,具體做法是將教學內容劃分為基礎型、前沿型兩類;并采用弱化公式推導,強調數學表達式物理含義的方法進行講授。
基礎型教學指的是已經發展完善的模式識別原理和方法。基礎型內容包括:貝葉斯決策理論、概率密度函數估計、線性判別、近鄰規則、獨立于算法的機器學習等內容。貝葉斯決策理論和概率密度函數估計是以數理統計為基礎的[3],這一部分也是模式識別的重點內容。線性判別是以高等數學和線性代數為基礎,同時涉及工程優化方法課程的部分內容。在這部分內容中,公式推導占據了相當大的篇幅,而且推導過程是學生可以理解和掌握的。對于基礎型的內容,可以采取理論推導和實際例子相結合的講授方式。在公式推導的過程中,尤其要強調公式的物理含義,同時給出幾個有趣的例子,在增強記憶加深理解的同時提高學生的學習興趣。
前沿型教學指的是正在發展中的模式識別原理和方法。前沿型內容包括:特征提取和選擇、聚類分析、神經網絡、支撐矢量機、隨機方法等內容。這部分內容或者是數學基礎超出了本科生的能力范圍,或者處于發展前沿,很多內容正處于探討階段。對于前沿型的內容,可以忽略公式推導過程,直接講授推導的結論以及結論的物理含義,同樣結合實際例子加深學生的理解。對于發展中的模式識別方法可以適當介紹該領域的發展前沿,在開拓視野的同時激發學生的科研興趣,引導部分學生從事感興趣的科學領域的研究。
2實例先導的教學方法
模式識別方法是為了解決信息處理中面臨的識別問題而提出的。在講授方法之前,首先要明確將要介紹的模式識別方法的應用背景和使用范圍,而不是像我們通常做的那樣,先介紹方法的理論基礎和流程,最后再給出一個例子,或者通過課后練習和作業的形式讓學生掌握課程介紹的理論和方法的應用。針對本科模式識別課程的特點,我們在教學實踐中摸索出了一套以實例為先導的教學方法,并與上機實驗和課程設計相結合,大大提高了學生的學習興趣和動手能力,取得了良好的教學效果。
實例先導的教學方法是在介紹每一章或者相關的幾章內容之前首先用一個實際的例子引出要學習的內容,在相關內容的學習結束之后給出解決實例問題的模式識別方法。例如:在講授貝葉斯決策理論之前,給出根據長度和光澤度等數值特征識別鮭魚和鱸魚的例子[4];在講授決策樹之前,給出根據顏色,形狀、尺寸等非度量特征識別水果的例子等等。通過學習,找到了解決這類問題的一般方法,同時學生也通過實例記住并理解了該方法的適用范圍。又例如在講授特征的選擇與提取這一章時,先不講特征空間的映射和變換,而是從幾個實例出發,說明并不是特征越多越好,而是要選擇合適的特征向量;特征的組合變換可以使復雜的分類問題轉化為簡單的問題等。從而讓學生更好地理解特征選擇和提取的目的和重要性。
在接觸到實際的模式識別問題時,會引發學生的思考。在授課過程中,教師可以針對具體問題組織學生進行討論,看是否能夠利用已學過的模式識別方法解決該問題。若可以解決,則引導學生分析用已學方法解決該問題時存在的不足,從而引出下面將要介紹的新方法。這樣,在介紹新方法的同時,學生會很自然地將新方法與舊的方法進行比較,分析各種方法的優劣,有利于學生對教學內容的深入理解和掌握。這種方法在講授解決同一類模式識別問題的不同方法時是適用的。如在講授貝葉斯決策時,可以通過對比的方式介紹幾種決策規則的特點,又如在講授線性判別方法中各種形式的感知器算法時,也可以對比學習各種算法的優劣。若該模式識別問題不能用已學的方法解決,則引導學生分析該模式識別問題的特點,思考為何必須引入新的模式識別方法來解決該問題,學生是否能夠提出自己的解決方案。在分析和思考之后,教師再將解決該問題的思路引入到下面將要介紹的新方法上。這種方法在講授解決不同類型的模式識別問題時是適用的。如在講授非度量模式識別方法時,面對非度量語義屬性的模式識別問題是前面介紹的方法無法解決的,要引入非度量模式識別方法加以解決。
因此我們建議在教材的編寫上可以嘗試采用實例先導的方法。首先在引言部分給出一個實際例子,然后在介紹方法的部分結合理論分析給出解決實例問題的方法。這種方法有利于提高學生的學習興趣,增強記憶,加深理解。
3實踐能力和科研興趣的培養
模式識別是一門理論和實踐緊密結合的科學,該學科的發展日新月異,在計算機和信息處理領域的地位越來越重要。因此,在模式識別課程的教學過程中要注重學生實踐能力和科研興趣的培養。在教學實踐中,我們采用了上機實驗和科學報告相結合的教學方式。
掌握各種模式識別方法的原理和流程是本科模式識別教學的第一個階段。在此基礎上,我們要求學生在計算機上實現模式識別方法并用于解決實際的模式識別問題。在上機實現的過程中,學生不僅需要掌握模式識別問題在計算機中的表示方法和識別結果的展示形式,尤其重要的是學生需要對模式識別方法的每一個細節都要深入理解和掌握才能將算法實現。在上機教學中,我們采用了Matlab編程環境實現課程中介紹的模式識別方法。Matlab的編程語言簡單高效,而且提供了功能強大的圖形展示功能[5]。例如在貝葉斯決策和線性分類器的上機實驗中,學生可以利用畫圖函數用不同的顏色和符合標記不同類別的樣本,可以輕松地畫出決策面,這種可視化的分類結果展示形式不僅提高了學生的學習興趣,而且加深了學生對模式識別方法及其特點的理解。
在學生成績考核中,除了筆試成績我們還增設了上機作業成績和科學報告成績兩個部分。上機作業的內容是要求學生從若干個上機題目中選擇有興趣的實現一個簡單的模式識別系統。例如設計實現貝葉斯分類器、線性分類器、神經網絡分類器、決策樹等。科學報告可以有兩種形式,要求學生或者在模式識別領域的主流英文期刊上選擇感興趣的英文文獻,將其翻譯為中文;或者就模式識別領域的一個感興趣的話題談談自己的看法和主張。通過上機作業和科學報告的形式,學生的動手能力得到了良好的鍛煉。不僅提高了學生的學習熱情,而且引導學生積極思考,不少同學在科學報告中提出了自己的學術看法和主張,有些內容頗具獨到的見解。
在學生成績考核中,除了筆試成績我們還增設了上機作業成績和科學報告成績兩個部分。上機作業的內容是要求學生從若干個上機題目中選擇有興趣的實現一個簡單的模式識別系統。例如設計實現貝葉斯分類器、線性分類器、神經網絡分類器、決策樹等。科學報告可以有兩種形式,要求學生或者在模式識別領域的主流英文期刊上選擇感興趣的英文文獻,將其翻譯為中文;或者就模式識別領域的一個感興趣的話題談談自己的看法和主張。通過上機作業和科學報告的形式,學生的動手能力得到了良好的鍛煉。不僅提高了學生的學習熱情,而且引導學生積極思考,不少同學在科學報告中提出了自己的學術看法和主張,有些內容頗獨到的見解。
4結語
本科模式識別教學由于學生的數學基礎有限而面臨著兩難的境地。既要把原理和方法講清楚,又不能過多的涉及復雜的數學推導,這給教學帶來很大困難。在教學實踐中,我們把教學內容劃分為基礎型、前沿型兩類,并提出了弱化公式推導,強調公式的物理含義,以及結合實例增強記憶的教學方法。為了提高學生的學習興趣,加深理解,我們提出了實例先導的教學方法。用實際例子引導學生思考,加深學生對模式識別方法應用背景和適用范圍的理解。模式識別是實踐性很強的科學,并且該學科的發展十分迅速。在教學實踐中,我們十分重視學生動手能力和科研興趣的培養。通過上機作業和科學報告的形式引導學生積極動手,積極思考。
參考文獻:
[1] 邊肇祺,張學工. 模式識別[M]. 2版. 北京:清華大學出版社. ,2002:9-303.
[2] 顧波. 模式識別本科教學方法淺談[J]. 中國科教創新導刊.,2010(4):68.
[3] Andrew R. Webb. 統計模式識別[M]. 2版. 王萍,等,譯. 北京:電子工業出版社,2004:1-10.
[4] Richard O. Duda,Peter E. Hart,David G. Stork. 模式分類[M]. 2版. 李宏東,姚天翔,等,譯. 北京:機械工業出版社. ,2003.
[5] 楊淑瑩. 模式識別與智能計算:Matlab技術實現[M]. 北京:電子工業出版社,2008:1-300.
Teaching Practices on Undergraduate Patten Recognition Course andCurriculum Reforming
QI Yu-tao1,2, LIU Fang 1,2, JIAO Li-cheng 2
(1. School of Computer Science and Technology, Xidian University, Xi’an 710071, China; 2. Institute of Intelligent Information Processing, Xidian University, Xi’an 710071, China)
摘 要:為實現對巴布劑涂布過程中均勻度的檢測,提出一種基于模糊模式識別的檢測方法。根據采集圖像像素點之間的空間和時間相關性及其特征界限的模糊性,引入模糊集理論,運用模糊算法對像素點的灰度值進行識別分類。檢測系統采用基于CycloneⅡ系列的FPGA技術,運用Verilog HDL硬件語言對系統完成建模與實現,并且通過了仿真和驗證。通過在線測試,對視頻數據流進行分析、處理和識別,實現對涂布過程中巴布劑均勻度的檢測,根據統計結果,正確率達到95%。檢測結果證明了模糊模式識別算法的可行性和檢測系統的可靠性。
關鍵詞:模糊集理論;模式識別;巴布劑;均勻度檢測;FPGA技術
中圖分類號: TP274.3; TP391.4 文獻標志碼:A
Abstract: To detect cataplasms uniformity, a method based on fuzzy pattern recognition was proposed. According to the spatial and temporal correlation of pixels and the fuzziness of character boundary, the fuzzy theory was introduced and the fuzzy algorithm was used to recognize and classify the pixels value. The CycloneⅡ Field-Programmable Gate Array (FPGA) of Altera was chosen, and the modeling and realization were performed by making use of Verilog HDL. The detection system passed the simulation and verification. In the on-line detection system, after analyzing, processing and recognizing the data of digital video, cataplasms uniformity detection was completed. According to the statistic results, the accuracy of fuzzy pattern recognition in digital image signals is up to 95%. After experiments and online detection, the feasibility of fuzzy pattern recognition and the reliability of this quality detection system are verified.
Key words: fuzzy set theory; pattern recognition; cataplasm巴布劑的英文是這個嗎?我在網上查的是別的詞,請您明確,并按照規范的詞來表示。; uniformity detection; technology of Field-Programmable Gate Array (FPGA)
0 引言
近年來,經皮給藥系統(Transdermal Drug Delivery System, TDDS)以其獨特而有效的疾病治療方式,深受國內外醫藥學研究機構和制藥企業的重視,鑒于其在國內外的廣闊市場需求和應用前景,將巴布劑的制藥成型工序推向自動化、形成產業智能化的趨勢已勢不可擋[1]。
目前,巴布劑成品質量檢測大多采用人工鑒定的方法,鑒定成品是否合格是從視覺上來看是否有氣泡,亮度、顏色是否均勻,這種對均勻度評估分析帶有一定的主觀性,難以形成規格化標準,而且不能實時地監視涂布過程中均勻度的變化。本文設計采用數字圖像處理的方法將目標問題轉化為信號處理問題,根據圖像像素點之間的空間和時間相關性及其特征界限的模糊性,引入模糊集理論,提出一種基于模糊模式識別的巴布劑均勻度檢測方法,實現對巴布劑均勻度的實時檢測,該方法還可用于對本系統其他指標的檢測,有利于實現巴布劑成型工序的自動化。
1 模糊模式識別原理
模糊集理論是研究和處理現實世界中客觀存在的模糊現象的有效工具之一。在模式識別中引入模糊集理論[2],用模糊技術來設計識別控制系統,可以更廣泛、更深入地模擬人的思維過程,提高系統的實用性和可靠性。
模糊模式識別問題可分為兩大類型:1)待識別的對象是明確的元素,而模式庫(所有已知標準模式的全體)是模糊的,可采用隸屬原則進行分類,稱為直接法;2)待識別的對象是模糊的,模式庫也是模糊的,可使用擇近原則進行分類,稱為間接法[3-4]。
本檢測系統通過采集巴布劑圖像進行分析、處理和識別判斷,實現對巴布劑均勻度的檢測,所以輸入待識別對象(數字圖像的640×480個像素點)是特定具體的,而識別庫(符合標準,幾乎符合標準和不符合標準三個模式)是模糊的,所以采用模糊模式識別的直接方法。
模糊模式識別直接方法的基本原理是:設U為待識別對象所構成的集合,U中每一個待識別對象u有m個特性指標u1,u2,…,um,構成特征向量u=(u1,u2,…,um),設待識別對象集合U可分成P個類別,且每一類別均為U上的一個模糊集,記為A1,A2,…,Ap,則稱它們為模糊模式。給定一個對象ui∈U,求出ui對P個模式的相應的隸屬度A1(ui),A2(ui),…,Ap(up),然后按照某種隸屬原則(最大隸屬度原則、最大隸屬原則、閾值原則)對識別對象ui進行判斷,指出它應歸屬哪一類別。
2 模糊模式識別模塊設計
系統采用直接方法對每一個像素點進行模式識別,隸屬原則選擇了最大隸屬原則,具體的步驟如下。
2.1 抽取特性指標
巴布劑成品均勻和不均勻的圖像及其灰度直方圖如圖1所示。
灰度直方圖是灰度值的函數,它描述了圖像中具有該灰度值的像素的個數,其橫坐標表示像素的灰度級別,縱坐標表示的是該灰度出現的像素的個數[5]。根據圖1分析可知,合格圖像的灰度值比較集中,灰度值在130~170,而不合格的圖像,由于存在氣泡或者藥劑噴涂不均勻帶來的顏色深淺不同,灰度值比較分散,灰度值在50~200。
該系統選取亮度信號Y作為識別對象的特性指標。由于經解碼后的數字視頻數據符合ITU-R BT.601標準[6],其無量綱和數量級的差別無需再進行規格化處理。
2.2 設定模糊模式類別并構造隸屬函數
隸屬函數是刻畫模糊集合最基本的概念,模糊集合是人腦對客觀事物的主觀反映,而人的心理進程是隸屬度形成的基本過程,故模糊集合的隸屬度函數表達形式不是唯一的,因此很難用統一的方法來構造隸屬函數,只能針對具體問題及其特點,采用與之相應的方法來構造隸屬函數。
本文的設計在構造模式識別的隸屬函數時,采用樣板法。首先依據標準均勻度的特性指標值將識別模式分為三大類,即符合標準(模式A1)、幾乎符合標準(模式A2)和不符合標準(模式A3),然后從模糊模式Ai中選出Ki個樣板,并對每個樣板的特性指標向量采集實測值,然后計算這Ki個特性指標向量的平均值,即樣板均值,為構造隸屬函數時計算距離作準備,最后將輸入數字圖像樣點值相對三個模式做隸屬歸類識別。對應三個模式特性指標Y及兩個色度信號Cr和Cb(色度信號Cb、Cr可以用在方案擴展中)的樣板均值如表1所示。
接下來計算圖像視頻數據與各模式均值樣板之間的距離,本系統設計選擇模糊Lambert距離函數,即:
(A,B)=1n∑ni=1A(ui)-B(ui)A(ui)+B(ui)(1)
令
D=max{d1(U,a1),d2(U,a2),d3(U,a3)},則模糊模式Ai的隸屬函數為:
Ai(u)=1-di(U,ai)/D; i=1,2,3,…(2)
2.3 利用最大隸屬原則進行識別判斷
在Ai(u)的計算結果中,若A1(u)最大,模式識別判斷屬于模式A1;若A2(u)最大,模式識別判斷屬于模式A2;若A3(u)最大,模式識別判斷屬于模式A3。對于每個像素點的模糊模式識別過程完成。
一幀圖像由640×480個像素點組成,模式識別是針對每一個有效像素點進行識別,若判斷巴布劑是否均勻,需要完成對一幀圖像的所有像素點的識別,通過記錄一幀圖像中不合格點個數,然后結合實際要求給出判斷信號。
3 基于模糊模式識別的檢測系統實現
本設計采用基于CycloneⅡ系列的FPGA(Field-Programmable Gate Array)技術[7],運用Verilog HDL(Hardware Description Language)對系統完成建模與實現。
3.1 圖像采集、處理、識別系統的硬件平臺
在圖像信息處理過程中為保證實時性,首先要求圖像處理系統具有處理大量數據的能力;其次對系統體積的大小、功能、穩定性等也有嚴格要求。本系統的框圖如圖2所示。
系統各模塊功能簡要描述如下:
1)視頻解碼器ADV7181B配置模塊是基于I2C總線原理,上電后首先要對ADV7181B進行初始化配置,完成對其性能、端口、數據格式、工作模式等必須通過配置選擇;
2)數據傳輸模塊識別出行、場同步信號,根據需要選擇采集圖像的大小,并將符合ITU-R BT.656標準數據轉換為符合ITU-R BT.601標準數據[8];
3)SDRAM控制器模塊產生控制SDRAM讀寫時序信號,實現大容量數字圖像視頻數據的控制與緩存[9-10];
4)模糊模式識別模塊用模糊模式識別理論對系統采集的數字圖像進行處理、分析和判別,實現對巴布劑成型過程中均勻度的檢測。
3.2 模糊模式識別模塊的實現
該均勻度檢測系統的核心部分是模糊模式識別模塊的實現。該模塊的實現步驟如下:
1)提取特征因素(亮度信號Y);
2)提取水平、垂直同步信號HS(Horizontal Sync)和VS(Vertical Sync)[11];
3)提取有效像素點(640×480);
4)用模糊算法對每個像素點進行識別;
5)完成一幀圖像所有像素點識別,記錄不合格點數,輸出判斷信號(control)。
視頻數據的水平和垂直時序如圖3所示。以水平時序為例,HS為負時標志著一行的開始和結束,有效的像素在A這段時間傳輸,HS在一行的最后一個像素傳送后,間隔至少B-A時間后拉低,然后保持時長C-這個是減號,還是連接符?請回復。回復:減號B為低電平,HS的負脈沖結束后,至少保持D-C的時間后開始新的一行。一行的總持續時間為D,像素有效時間為A,D-A為水平消隱時間[12]。垂直時序與水平時序類似,各對應時間段分別用E、F、G、H表示。
視頻數據的水平和垂直時序具體參數為: A=25.4μs,B=26μs,C=29.8μs,D=32.8μs,E=15.3ms,F=15.6ms,G=15.65ms,H=16.7ms。在FPGA中,用Verilog HDL合成滿足上述時序關系的水平、垂直同步信號,同時還要加一個復位信號,使模式識別從第一行第一個像素開始,完成對每幀圖像的均勻度的檢測。
在對每個像素點進行模糊模式識別的程序設計中,主要通過有限狀態機實現的[13],如圖4所示。狀態State0時,分離視頻圖像信號的三個特征指標Y、Cr和Cb;轉入State1時,將亮度信號Y與模式標值對應代入式(1)中的分子,求差并取絕對值;轉入State2時,將Y與模式標值對應代入式(1)中的分母,求和;轉入State3時,將State1中的差值與State2中的和值作商;轉入State4時,求模糊Lambert距離;轉入State5和State6時,利用隸屬函數求值,根據最大隸屬原則做模式識別,并給出判斷信號。另外,在該模塊的設計中嵌入了除法器模塊,通過task任務調用實現。
圖5中,data_cr、data_cb、data_y分別為輸入的數字視頻信號的三個特性指標,cmd2是讀操作命令,data1和data2是數據緩存單元,control為對各像素點進行判別后所歸屬的模式類別,以十進制標識,4是符合厚度標準“100”,2是幾乎符合厚度標準“010”,1是不符合厚度標準“001”;另外,當沒有視頻數據輸入到模式識別模塊時,control輸出為“0”值。
本系統設計將巴布劑均勻度檢測結果的判斷信號輸出給兩個LED燈:A(均勻)、B(不均)。實驗檢測結果表現為:當攝像頭攝取均勻的巴布劑成品時A燈間歇性亮滅;當攝取不均勻的巴布劑成品時B等間歇性亮滅。滅的時間表示正在對一幀圖像進行基于模式識別的均勻度檢測;亮的時間表示輸出判斷信號的延時。
4 結語
本文提出一種基于模糊模式識別的巴布劑均勻度檢測系統,從實驗和在線檢測結果看,模糊模式識別的算法比較理想,可以實現對巴布劑均勻度的實時檢測。本系統設計不僅為實現TDDS制劑成型生產的自動化作了有益的探索性嘗試,而且該系統還可以對其他的指標進行檢測,對今后TDDS成型生產設備走向工業化有著積極的借鑒意義。
參考文獻:
[1]
謝光杰,鄧啟華.經皮給藥制劑概述及研究現狀[J].內江科技,2009,30(9):31-32.
[2]
陳水利,李敬功,王向公.模糊集理論及其應用[M].北京:科學出版社,2005:156-178.
[3]
劉素華,侯惠芳,劉東.模糊模式識別在大氣評定中的作用[J].計算機工程,2005,31(2):7-10.
[4]
王艷玲,張,羅詩途.基于模糊模式識別的場景圖像分類方法[J].微計算機信息,2007,23(34):220-221.
[5]
尹建新,樓雄偉,黃美麗.灰度直方圖在木材表面缺陷檢測中的應用[J].浙江林學院學報,2008,25(3):272-276.
[6]
柯.數字視頻文件轉換算法的設計與實現[J].企業技術開發,2011,30(9):21-22.
[7]
黃智偉,王彥.FPGA系統設計與實踐[M].北京:電子工業出版社,2005:130-132.
[8]
蔡軍輝.基于FPGA的視頻信號數字化采集與顯示系統[D].南京:南京航空航天大學,2009.
[9]
何云斌,張玉芬.多端口SDRAM控制器的設計與實現[J].微計算機信息,2009,25(14):49-50,73.
[10]
向興富,袁玉群,譚亞軍.基于FPGA的DDR2 SDRAM數據存儲研究[J].貴州大學學報:自然科學版,2010,27(2):70-73.
[11]
陳彬,伍乾永,劉永春.基于FPGA的VGA控制模塊設計[J].微電子學,2008,38(2):306-308.
[12]
朱奕丹,方怡冰.基于FPGA的圖像采集與VGA顯示系統[J].計算機應用,2011,31(5):1258-1264.
[13]
劉小平,何云斌,董懷國.基于Verilog HDL的有限狀態機設計與描述[J].計算機工程與設計,2008,29(4):958-960.
收稿日期:2011-07-25;修回日期:2011-09-21。
基金項目:
國家自然科學基金資助項目(2009ZX09502)。
關鍵詞:脫機手寫藏文識別;GABP神經網絡;特征提取
中圖分類號:TP317.2 文獻標識碼:A 文章編號:16727800(2013)009007902
基金項目:青海省普通高等學校研究生創新項目
作者簡介:梁會方(1987-),女,青海師范大學計算機學院碩士研究生,研究方向為藏文信息處理。
0引言
模式識別在各個領域中的應用非常多,從這些應用中可以看到它們的共性,即一個模式識別系統通常包括原始數據的獲取和預處理、特征提取與選擇、分類或聚類、后處理4個主要部分。其中藏文識別需要解決的關鍵問題是模式分類,其理論基礎是模式識別技術,其中最常用的方法是統計模式識別方法和結構模式識別方法。近年來也有很多人將隱馬爾科夫模型用于手寫識別領域,取得了良好的效果。本文主要介紹統計模式識別、結構模式識別以及使用較多的隱馬爾科夫模型和人工神經網絡模型。
1模式識別
1.1統計模式識別
統計模式識別是依據統計的原理來建立分類器,其分類器設計方法主要有貝葉斯決策理論和判別函數。貝葉斯決策理論基本思想為:在類條件概率密度和先驗概率已知或者可以估計的條件下,利用貝葉斯公式比較樣本屬于兩類的后驗概率,然后將類別決策為后驗概率大的一類,從而使總體錯誤率最小。常見的一種貝葉斯決策為最小錯誤率貝葉斯決策[1],其決策規律如下:
如果P(w\-1|x)>P(w\-2|x),則x∈w\-1;反之,則x∈w\-2。
通過貝葉斯公式 ,后驗概率的比較可以轉化為類條件概率密度的比較,離散情況下也是類條件概率的比較,而這種條件概率或條件密度則反映了在各類模型下觀察到當前樣本的可能性或似然度,因此可以定義兩類之間的似然比或對數似然比進行決策。
該方法的主要優點是抗干擾能力強,且易于實現,但是應用中的主要缺點是細分能力較弱,區分相似字的能力較差。
1.2結構模式識別
藏文文字結構復雜,但同時具有相當的規律性,這種文字都含有豐富的結構信息,因此可以獲取這些組字的規律以及藏文字符信息的結構特征作為識別的依據。結構模式識別[2]的主要思想就是文字圖像劃分為很多基本組合,然后利用一些相似性度量準則確定出這些組合之間的關系,以及這些字符圖像模式和一些典型模式之間利用一些相似性度量準則確定的相似程度。
1.3隱馬爾科夫模型
HMM模型[3]是將特征值和一個狀態轉移模型聯系起來,它是一個雙重隨機過程,其中狀態轉移過程是不可觀察即隱藏的馬爾科夫模型,而可觀察事件的隨機過程是隱藏狀態轉換過程的隨機函數。HMM有3個基本問題及常用算法:①評估問題:前后向遞推算法;②解碼問題:Viterbi算法;③學習問題:BaumWelch算法。
HMM模型可以用一種特定的神經網絡模型來模擬[4],該模型收斂性較差,易陷入局部極值。
1.4人工神經網絡模型
神經系統是由大量神經細胞構成的復雜網絡,是一個由大量簡單的處理單元組成的高度復雜的大規模非線性自適應系統。神經網絡是一個高度并行的分布處理結構,它是非線性的,具有自組織和自學習的能力。神經網絡與傳統的模式識別不同,能夠直接輸入數據并進行學習,用樣本訓練網絡并實現識別。它是非參數的識別方法,不需要傳統方法中的建模、參數估計以及參數校驗、重新建模等復雜過程。
在字符識別領域常用的網絡模型有:BP網絡、RBF網絡、自組織網絡、Hopfield網絡、SVM網絡等。
BP網絡是一種多層前饋網絡[5],是一種依靠反饋值來不斷調整節點之間的連接權值而構建的一種網絡模型。它由輸入層、隱藏層、輸出層相互連接構成,其結構如圖1所示。
網絡的學習訓練過程由信號的正向傳播與誤差的反向傳播組成,其中正向傳播是把輸入樣本從輸入層輸入,經各隱層處理后傳向輸出層,若輸出層的實際輸出和期望輸出不符,則轉入誤差的反向傳播階段。誤差反傳是將輸出誤差以某種形式通過隱層向輸入層逐層反傳,并將誤差分攤給各層的所有單元,從而獲得各層單元的誤差信號,此誤差信號即作為修正各單元權值的依據。各層權值調整過程是周而復始地進行,直到網絡輸出的誤差減少到可以接受的程度。
2遺傳算法改進的BP網絡
藏文字符識別是中國多文種信息處理系統的重要組成部分,脫機手寫藏文識別在很多領域有廣闊的使用前景。在現有漢字以及數字識別方法的基礎上,提出了很多預處理和模式識別的方法,大大提高了手寫藏文的識別精度。為了提高脫機手寫藏文識別精度,本文將GABP神經網絡應用于脫機手寫藏文識別分析中,識別過程分為兩步:訓練階段、識別階段。在訓練階段,提取訓練樣本集的特征,建立網絡模型,以輸入為目標,保存網絡的連接權值和閾值以及字符特征;在識別階段,將待識別的藏文特征送入網絡運行,待網絡運行到平衡狀態,將輸出結果與數字特征庫的值進行比較,識別出藏文字符。
BP網絡是目前應用最多的神經網絡,這主要是因為BP算法[6]有較強的非線性映射能力、泛化能力以及容錯能力。但是它本身存在大量的問題,突出表現在:BP算法的學習速度很慢,需要較長的訓練時間;網絡訓練失敗的可能性較大,易陷入局部極小點,逼近局部極小值[5]。為了改善這些缺點,通常會改變隱層數量,隱藏層一般根據具體情況制定,但是增加隱藏層的層數和隱藏層神經元個數不一定總能夠提高網絡精度和表達能力。而遺傳算法的基本作用對象是多個可行解的集合,而非單個可行解。它同時處理多個個體,同時對搜索空間中的多個解進行評估,使得遺傳算法具有較好的全局搜索性能,減少了陷于局部最優解的可能性,同時,它本身具有良好的并行性。所以用遺傳算法學習神經網絡的權重及拓撲結構[6],對神經網絡進行改進,提高了神經網絡的精度,同時也提高了遺傳算法的局部搜索能力。在模式分類應用中進行數據預處理,利用遺傳算法進行特征提取,其后用神經網絡進行分類。GABP混合學習算法結構如圖2所示,采用GA優化BP網絡權值。
①BP網絡參數初始化;
②按BP網絡的權值和閾值連接隨機產生染色體;
③計算染色體的適應值以及迭代次數,如果達到要求,則結束GA算法,產生最佳個體,如果沒有達到,進行下一步;
④按適應度進行選擇、交叉和變異操作,產生新的染色體,重復上一步;
⑤將產生的最好個體依次映射到BP網絡中對應的權值和閾值,并將此作為BP網絡的初始值;
⑥利用BP網絡,判斷誤差是否達到預定要求,達到就結束,如果沒有,則BP網絡反向傳播,返回上一步。
3結語
本文分析了文字識別的常用方法及其優缺點,著重分析了手寫藏文識別征提取和分類器設計兩個關鍵技術,并對藏文識別研究領域今后的研究方向和發展前景提出了一些看法。在原BP網絡的基礎上改進GABP神經網絡,可以提高其學習速度,加快收斂速度,相比而言識別精度較高、訓練時間較短,且具有較強的魯棒性。由于神經網絡和遺傳算法已經發展得比較成熟,將兩者結合的方法用于藏文識別,具有很大的實用價值,同時將GABP神經網絡用于藏文識別,有助于神經網絡用于藏文識別的可能性和有效性。
參考文獻:
[1]張學工.模式識別[M].北京:清華大學出版社,2010.
[2]吳剛,德熙嘉措,黃鶴鳴.印刷體藏文識別技術[C].第十屆全國少數民族語言文字信息處理學術研討會論文集,2005.
[3]劉衛,李和成.基于局部保持投影與隱馬爾可夫模型的維文字符識別[J].計算機應用,2012,32(8).
[4]梁弼,王維蘭,錢建軍.基于HMM的分類器在聯機手寫藏文識別中的應用[J].微電子學與計算機,2009,26(4).