前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的數(shù)字圖像處理綜述主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:數(shù)字圖像 圖像處理 數(shù)字技術(shù) 應(yīng)用
數(shù)字圖像處理(Digital Image Processing)又稱為計(jì)算機(jī)圖像處理,它是指將圖像信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)并利用計(jì)算機(jī)對(duì)其進(jìn)行處理的過(guò)程。
數(shù)字圖像處理最早出現(xiàn)于20世紀(jì)50年代,當(dāng)時(shí)的電子計(jì)算機(jī)已經(jīng)發(fā)展到一定水平,人們開(kāi)始利用計(jì)算機(jī)來(lái)處理圖形和圖像信息,數(shù)字圖像處理作為一門(mén)學(xué)科大約形成于20世紀(jì)60年代初期,早期的圖像處理的目的是改善圖像的質(zhì)量,它以人為對(duì)象,以改善人的視覺(jué)效果為目的。圖像處理中,輸入的是質(zhì)量低的圖像,輸出的是改善質(zhì)量后的圖像,常用的圖像處理方法有圖像增強(qiáng)、復(fù)原、編碼、壓縮等。
首次獲得實(shí)際成功應(yīng)用的是美國(guó)噴氣推進(jìn)實(shí)驗(yàn)室(JPL),他們對(duì)航天探測(cè)器徘徊者7號(hào)在1964年發(fā)回的幾千張?jiān)虑蛘掌褂昧藞D像處理技術(shù),如幾何校正、灰度變換、去除噪聲等方法進(jìn)行處理,并考慮了太陽(yáng)位置和月球環(huán)境的影響,由計(jì)算機(jī)成功地繪制出月球表面地圖,獲得了巨大的成功。隨后又對(duì)探測(cè)飛船發(fā)回的近十萬(wàn)張照片進(jìn)行更為復(fù)雜的圖像處理,以致獲得了月球的地形圖、彩色圖及全景鑲嵌圖,獲得了非凡的成果,為人類登月創(chuàng)舉奠定了堅(jiān)實(shí)的基礎(chǔ),也推動(dòng)了數(shù)字圖像處理這門(mén)學(xué)科的誕生。在以后的宇航空間技術(shù),醫(yī)學(xué)技術(shù)中數(shù)字圖像處理技術(shù)都發(fā)揮了巨大的作用。
從70年代中期開(kāi)始,隨著計(jì)算機(jī)技術(shù)和人工智能、思維科學(xué)研究的迅速發(fā)展,數(shù)字圖像處理向更高、更深層次發(fā)展,人們已開(kāi)始研究如何用計(jì)算機(jī)系統(tǒng)解釋圖像,實(shí)現(xiàn)類似人類視覺(jué)系統(tǒng)理解外部世界,這被稱為圖像理解或計(jì)算機(jī)視覺(jué)。很多國(guó)家,特別是發(fā)達(dá)國(guó)家投入更多的人力、物力到這項(xiàng)研究,取得了不少重要的研究成果。其中代表性的成果是70年代末MIT的Marr提出的視覺(jué)計(jì)算理論,這個(gè)理論成為計(jì)算機(jī)視覺(jué)領(lǐng)域其后十多年的主導(dǎo)思想。圖像理解雖然在理論方法研究上已取得不小的進(jìn)展,但它本身是一個(gè)比較難的研究領(lǐng)域,存在不少困難,因人類本身對(duì)自己的視覺(jué)過(guò)程還了解甚少,因此計(jì)算機(jī)視覺(jué)是一個(gè)有待人們進(jìn)一步探索的新領(lǐng)域。
二、國(guó)內(nèi)外研究現(xiàn)狀
目前,國(guó)內(nèi)圖像識(shí)別的算法研究多是關(guān)于數(shù)字、文字、人臉、以及醫(yī)用病理方面的較多,對(duì)產(chǎn)品內(nèi)表圖像進(jìn)行分析識(shí)別、分類的還很少。國(guó)內(nèi)已研制出了具有先進(jìn)水平的高精度內(nèi)表檢測(cè)系統(tǒng)和裝置,如何對(duì)產(chǎn)品零部件的外形,尺寸進(jìn)行較高精度測(cè)量的激光在線檢測(cè)系統(tǒng)等,但迄今為止,尚無(wú)能對(duì)生產(chǎn)出的產(chǎn)品內(nèi)表面進(jìn)行自動(dòng)檢測(cè)和識(shí)別的系統(tǒng)。應(yīng)用CCD、電子、計(jì)算機(jī)技術(shù)檢測(cè)內(nèi)表面的實(shí)時(shí)自動(dòng)檢測(cè)技術(shù)在國(guó)內(nèi)正處于剛剛起步的階段,對(duì)內(nèi)表面圖像進(jìn)行分析識(shí)別、分類的軟件系統(tǒng)還沒(méi)有十分完善,現(xiàn)在的識(shí)別算法對(duì)圖像中的疵病部分定位不是很準(zhǔn)確,對(duì)疵病的范圍、大小、方位不能做定量分析,只能作定性分析,精度低,采用的傳統(tǒng)的最小距離等分類器在圖像復(fù)雜且類別多時(shí),很難表示和提取特征,進(jìn)行圖像識(shí)別十分困難。
國(guó)外關(guān)于圖像識(shí)別中的圖像分割,特征信號(hào)提取,邊緣檢測(cè),紋理識(shí)別等的算法已經(jīng)取得了一定的成果,提出了一些新方法,如利用直線分割來(lái)識(shí)別三維人臉,通過(guò)子圖匹配法在相鄰區(qū)域間識(shí)別不同目標(biāo),用雙值微波仿射不變函數(shù)識(shí)別二維形形狀等等,近年來(lái),國(guó)外基于圖像識(shí)別與分類技術(shù)的圖像檢索,人臉識(shí)別,字體識(shí)別發(fā)展十分迅速。
在國(guó)外,為提高自動(dòng)目標(biāo)識(shí)別能力而開(kāi)發(fā)的算法現(xiàn)在正被引入許多偵測(cè)和成像系統(tǒng)之中,圖像分割、特征信號(hào)探測(cè)和析取、靜止目標(biāo)的模式識(shí)別等方面已取得了很大進(jìn)步,這一自動(dòng)目標(biāo)識(shí)別能力大大減輕了操作人員的工作負(fù)擔(dān)。如美國(guó)正在加緊自動(dòng)檢測(cè)能力與自動(dòng)目標(biāo)識(shí)別的研究工作,并在硬件能力的基礎(chǔ)上開(kāi)發(fā)多種用于信號(hào)圖像處理的算法和開(kāi)展各種算法軟件的研制,包括相關(guān)法(匹配濾波器技術(shù))、自適應(yīng)多維處理法、基于模型的方法等。
三、數(shù)字圖像處理的應(yīng)用
圖像是人類獲取和交換信息的主要來(lái)源,因此,圖像處理的應(yīng)用領(lǐng)域必然涉及到人類生活和工作的方方面面,隨著人類活動(dòng)范圍的不斷擴(kuò)大,圖像處理的應(yīng)用領(lǐng)域也將隨之不斷擴(kuò)大。
1、航天和航空技術(shù)方面的應(yīng)用
數(shù)字圖像處理技術(shù)在航天和航空技術(shù)方面的應(yīng)用,除了JPL對(duì)月球、火星照片的處理之外,另一方面的應(yīng)用是在飛機(jī)遙感和衛(wèi)星遙感技術(shù)中。現(xiàn)在世界各國(guó)都在利用陸地衛(wèi)星所獲取的圖像進(jìn)行資源調(diào)查,災(zāi)害檢測(cè),資源勘察,農(nóng)業(yè)規(guī)劃,城市規(guī)劃,我國(guó)也陸續(xù)開(kāi)展了以上諸方面的一些實(shí)際應(yīng)用,并獲得了良好的效果。在氣象預(yù)報(bào)和對(duì)太空其它星球研究方面,數(shù)字圖像處理技術(shù)也發(fā)揮了相當(dāng)大的作用。
2、生物醫(yī)學(xué)工程方面的應(yīng)用
數(shù)字圖像處理在生物醫(yī)學(xué)工程方面的應(yīng)用十分廣泛,而且很有成效。除了一般的CT技術(shù)之外,還有一類是對(duì)醫(yī)用顯微圖像的處理分析,如紅細(xì)胞、白細(xì)胞分類,染色體分析,癌細(xì)胞識(shí)別等,此外,在X光肺部圖像增晰、超聲波圖像處理、心電圖分析、立體定向放射治療等醫(yī)學(xué)診斷方面都廣泛地應(yīng)用圖像處理技術(shù)。
3、通信工程方面的應(yīng)用
當(dāng)前通信的主要發(fā)展方向是聲音、文字、圖像和數(shù)據(jù)結(jié)合的多媒體通信。具體地講是將電話、電視和計(jì)算機(jī)以三網(wǎng)合一的方式在數(shù)字通信網(wǎng)上傳輸。其中以圖像通信最為復(fù)雜和困難,因圖像的數(shù)據(jù)量十分巨大,如傳送彩色電視信號(hào)的速率達(dá)100Mbit/s以上,要將這樣高速率的數(shù)據(jù)實(shí)時(shí)傳送出去,必須采用編碼技術(shù)來(lái)壓縮信息的比特量。在一定意義上講,編碼壓縮是這些技術(shù)成敗的關(guān)鍵。除了已應(yīng)用較廣泛的熵編碼、DPCM編碼、變換編碼外,目前國(guó)內(nèi)外正在大力開(kāi)發(fā)研究新的編碼方法,如分行編碼、自適應(yīng)網(wǎng)絡(luò)編碼、小波變換圖像壓縮編碼等。
4、工業(yè)和工程方面的應(yīng)用
在工業(yè)和工程領(lǐng)域中圖像處理技術(shù)有著廣泛的應(yīng)用,如自動(dòng)裝配線中檢測(cè)零件的質(zhì)量、并對(duì)零件進(jìn)行分類,印刷電路板疵病檢查,彈性力學(xué)照片的應(yīng)力分析,流體力學(xué)圖片的阻力和升力分析,郵政信件的自動(dòng)分揀,在一些有毒、放射性環(huán)境內(nèi)識(shí)別工件及物體的形狀和排列狀態(tài),先進(jìn)的設(shè)計(jì)和制造技術(shù)中采用工業(yè)視覺(jué)等等。其中值得一提的是研制具備視覺(jué)、聽(tīng)覺(jué)和觸覺(jué)功能的智能機(jī)器人,將會(huì)給工農(nóng)業(yè)生產(chǎn)帶來(lái)新的激勵(lì),目前已在工業(yè)生產(chǎn)中的噴漆、焊接、裝配中得到有效的利用。
5、軍事公安方面的應(yīng)用
在軍事方面圖像處理和識(shí)別主要用于導(dǎo)彈的精確末制導(dǎo),各種偵察照片的判讀,具有圖像傳輸、存儲(chǔ)和顯示的軍事自動(dòng)化指揮系統(tǒng),飛機(jī)、坦克和軍艦?zāi)M訓(xùn)練系統(tǒng)等;公安業(yè)務(wù)圖片的判讀分析,指紋識(shí)別,人臉鑒別,不完整圖片的復(fù)原,以及交通監(jiān)控、事故分析等。目前已投入運(yùn)行的高速公路不停車(chē)自動(dòng)收費(fèi)系統(tǒng)中的車(chē)輛和車(chē)牌的自動(dòng)識(shí)別都是圖像處理技術(shù)成功應(yīng)用的例子。
6、文化藝術(shù)方面的應(yīng)用
目前這類應(yīng)用有電視畫(huà)面的數(shù)字編輯,動(dòng)畫(huà)的制作,電子圖像游戲,紡織工藝品設(shè)計(jì),服裝設(shè)計(jì)與制作,發(fā)型設(shè)計(jì),文物資料照片的復(fù)制和修復(fù),運(yùn)動(dòng)員動(dòng)作分析和評(píng)分等等,現(xiàn)在已逐漸形成一門(mén)新的藝術(shù)——計(jì)算機(jī)美術(shù)。
參考文獻(xiàn):
[1]孫即祥 圖像壓縮與投影重建 北京:科學(xué)出版社;2005.7:第一章:1~2,63~64.
[2]韓金姝.基于分形的植物形態(tài)模擬與圖像壓縮技術(shù)研究:[碩士論文]. 青島:中國(guó)海洋大學(xué)信號(hào)與信息處理專業(yè),2005.
【Abstract】In the process of computer technology rapidly develop, people need to deal with all kinds of complex images. Image processing method presents diversity and complex characteristics, and the remind for CPU capability is higher, the traditional CPU image processing already can not satisfy the needs of people at present. In this paper, it research a high efficiency and fast image processing method. It makes full use of GPU parallel processing ability, using G++ language to complete the corresponding images. The image parallel processing algorithm method main contain the color negative film processing algorithms, transparent merging processing algorithms and so on, and comparing the performance of achieving the same effect with the GPU, to prove the efficiency of parallel image processing algorithm. based on GPU .
【關(guān)鍵詞】GPU;圖像處理;并行算法
【Keywords】GPU; image process; parallel algorithm
【中圖分類號(hào)】TP301. 6 【文獻(xiàn)標(biāo)志碼】A 【文章編號(hào)】1673-1069(2017)03-0071-02
1 引言
在目前業(yè)務(wù)逐漸復(fù)雜的情況下,人們需要進(jìn)行各種形式的圖像處理,其處理形式主要包括對(duì)數(shù)字圖形進(jìn)行模糊、銳化和合并并根據(jù)人們的實(shí)際需求將原始圖形轉(zhuǎn)化成人們所需要的圖形。人們對(duì)應(yīng)用系統(tǒng)圖形方面處理質(zhì)量要求越來(lái)越高,雖然CPU的整體運(yùn)行速度無(wú)法滿足人們的實(shí)際需求,這就需要利用GPU的快速計(jì)算能力,將其應(yīng)用到圖形計(jì)算當(dāng)中,以此來(lái)形成相應(yīng)的通用計(jì)算,并且能夠通過(guò)C++語(yǔ)言解決和處理復(fù)雜問(wèn)題。
2 基于GPU圖像處理的相關(guān)技術(shù)
GPU技術(shù)。在計(jì)算機(jī)發(fā)展的過(guò)程中,人們對(duì)圖像處理的要求還沒(méi)有那么復(fù)雜,其中圖像的運(yùn)行和相關(guān)的計(jì)算方法都比較簡(jiǎn)單,所以說(shuō)不用借助相應(yīng)的硬件處理設(shè)備來(lái)對(duì)圖像進(jìn)行編輯處理,只需要借助GPU強(qiáng)大的計(jì)算能力就能蚨醞夾謂行處理。但是隨著社會(huì)的不斷進(jìn)步和計(jì)算機(jī)技術(shù)的不斷發(fā)展,人們需要更快的運(yùn)算速度來(lái)進(jìn)行更高質(zhì)量的圖像處理,這就促使GPU運(yùn)算技術(shù)產(chǎn)生并不斷發(fā)展。從目前來(lái)看,CPU一般指的是中央處理器,是一種超大規(guī)模的集成電路,其主要功能是對(duì)計(jì)算機(jī)的指令進(jìn)行解釋,并對(duì)相應(yīng)的計(jì)算機(jī)軟件數(shù)據(jù)進(jìn)行處理,而對(duì)數(shù)字進(jìn)行處理就主要依靠GPU來(lái)進(jìn)行,通過(guò)指令來(lái)產(chǎn)生相應(yīng)的操作控制信號(hào),以此來(lái)進(jìn)行相應(yīng)的圖像處理。而GPU主要指的是圖形處理器,也可以被稱為視覺(jué)處理器,其主要功能是將計(jì)算機(jī)系統(tǒng)所需要的現(xiàn)實(shí)信息進(jìn)行轉(zhuǎn)換驅(qū)動(dòng),并且向顯示器提供相應(yīng)的掃描信號(hào),來(lái)對(duì)顯示器的顯示進(jìn)行正確控制,另外,圖形處理器也是顯卡的處理器,是顯卡中較為重要的一部分,與CPU相比來(lái)說(shuō),兩者具有一定的相似之處,而GPU主要是執(zhí)行復(fù)雜的數(shù)學(xué)計(jì)算和幾何計(jì)算,也就是說(shuō)如果CPU想要畫(huà)一個(gè)圖形,只需要結(jié)合想要圖形的實(shí)際坐標(biāo)和特征,來(lái)產(chǎn)生相應(yīng)的信號(hào),而GPU就能夠?qū)υ搱D形的所有像素進(jìn)行計(jì)算并且集成,并且在顯示器的指定位置上畫(huà)出相應(yīng)的圖形,并且對(duì)CPU進(jìn)行圖形完成的通知,等待后續(xù)的命令[1]。
CUDA。從上述可以知道,GPU主要是對(duì)圖形進(jìn)行編輯和處理,但是在計(jì)算機(jī)的眾多應(yīng)用領(lǐng)域當(dāng)中,GPU仍舊不能發(fā)揮出其具體功能,其主要是由于API的編程較為復(fù)雜,同時(shí)由于GPU內(nèi)部的內(nèi)存量較小,不能支持較大的程序規(guī)模,另外GPU的編程靈活性較差,這就使GPU無(wú)法發(fā)揮出其主要功能。為了對(duì)上述問(wèn)題進(jìn)行解決,廠商N(yùn)VIDIA推出了一種運(yùn)算平臺(tái),也就是CUDA,這種運(yùn)算平臺(tái)能夠并行計(jì)算架構(gòu),使GPU能夠?qū)ο鄬?duì)較為復(fù)雜的問(wèn)題進(jìn)行解決,目前的CUDA已經(jīng)能夠支持C++語(yǔ)言的實(shí)際運(yùn)行,這也就意味著GPU能夠發(fā)揮出更為重要的作用。
數(shù)字圖形處理算法。數(shù)字圖像處理是根據(jù)實(shí)際的需求,來(lái)對(duì)圖像進(jìn)行相應(yīng)的運(yùn)算和設(shè)計(jì),對(duì)數(shù)字圖像進(jìn)行處理主要目的體現(xiàn)以下方面:一是提高圖像的整體視覺(jué)效果和質(zhì)量;二是對(duì)圖像中所包含的信息和資源進(jìn)行提取和處理,三是對(duì)數(shù)字圖像的格式和信息進(jìn)行變化處理,以此來(lái)保證數(shù)字圖像數(shù)據(jù)的安全快速傳遞[2]。
3 基于GPU的數(shù)字圖像處理并行算法
3.1 高斯模糊算法并行化
高斯模糊也被稱為高斯平滑,目前屬于一種在各種圖像處理軟件中進(jìn)行廣泛使用的處理效果,對(duì)其進(jìn)行應(yīng)用的主要目的是減少圖像噪聲和降低細(xì)節(jié)層次,高斯模糊當(dāng)中的模糊,可以被看成周邊像素的平均值。高斯模糊算法并行化在串聯(lián)的程序結(jié)構(gòu)當(dāng)中無(wú)法進(jìn)行靈活變換,為了能夠?qū)PU中的硬件多線程資料進(jìn)行最大程度的利用,就需要按照CUDA多線程架構(gòu)處理的思想來(lái)對(duì)程序進(jìn)行重構(gòu)。在利用GPU對(duì)圖像進(jìn)行高斯模糊變化的過(guò)程中,其主要前提是水平方向上的一維高斯矩陣變換和垂直方向上的一維高斯矩陣變換是不相關(guān)的,換個(gè)說(shuō)法是可以對(duì)其進(jìn)行分開(kāi)處理,針對(duì)某一方向的處理,各個(gè)像素之間的處理也是不相關(guān)的,結(jié)合這樣的特性,可以利用GPU中的多線程并行將像素的處理任務(wù)分為不同的模塊,并且使GPU的線程來(lái)對(duì)其進(jìn)行計(jì)算。基于CUDA的高斯模糊處理,首先是需要對(duì)需要處理的原始圖形進(jìn)行讀入,然后將圖像中的像素在水平和垂直方向中進(jìn)行分塊,使GPU的線程塊能夠?qū)@些模塊進(jìn)行分開(kāi)處理,在進(jìn)行處理之后,將處理之后的結(jié)果進(jìn)行合并,這樣就達(dá)到了想要的原始圖像高斯模糊效果。在這樣的過(guò)程中,需要根據(jù)實(shí)際的不同需求,來(lái)提供相應(yīng)的函數(shù),使GPU中的線程塊能夠?qū)Σ煌臄?shù)據(jù)進(jìn)行不同的理和操作,這也就是高斯模糊算法在CUDA基礎(chǔ)上來(lái)進(jìn)行圖像處理的[3]。
3.2 彩色附頁(yè)處理算法并行化
對(duì)于彩色附頁(yè)的處理來(lái)說(shuō),屬于一種特別耗費(fèi)時(shí)間的圖像處理過(guò)程,因?yàn)檫@種數(shù)字圖像處理方法要求將整個(gè)圖像中的每一個(gè)像素點(diǎn)都進(jìn)行處理,但是從數(shù)字處理的角度來(lái)看彩色附頁(yè)處理,其整體處理流程較為簡(jiǎn)單,首先是需要對(duì)圖像進(jìn)行處理,然后根據(jù)圖像格式的不同來(lái)放入內(nèi)存,并且對(duì)圖像的所有像素點(diǎn)進(jìn)行讀取,對(duì)其中的r、g、b值進(jìn)行取出,用255減去所取出的值,得出處理過(guò)后的數(shù)值,最后利用這些數(shù)值,就能夠形成所需要的負(fù)片圖像。在進(jìn)行負(fù)片處理的過(guò)程中可以看出,針對(duì)圖像中的每一個(gè)像素點(diǎn)的處理都是相對(duì)獨(dú)立的,也就是說(shuō)在對(duì)某一像素點(diǎn)進(jìn)行處理的過(guò)程中,其中各種數(shù)值的取值是與其他像素值不相關(guān)的,針對(duì)這樣的獨(dú)立性特點(diǎn),可以在圖像處理的過(guò)程中,充分利用GPU多線程并行處理的優(yōu)勢(shì),對(duì)所需要處理圖像中進(jìn)行一定程度的分割,然后對(duì)所分割圖像中的所有像素點(diǎn)進(jìn)行處理,最后進(jìn)行統(tǒng)一的合并,就能夠得出所需要的圖像[4]。在對(duì)圖像中各個(gè)像素點(diǎn)進(jìn)行處理的過(guò)程中,需要注意這樣像素點(diǎn)之間的運(yùn)算必須保證相互獨(dú)立,如果出現(xiàn)像素點(diǎn)不獨(dú)立的情況,那么就需要在程序中編寫(xiě)大量的控制代碼,而這樣的控制代碼的運(yùn)行方式與GPU的處理方式不相匹配,不能達(dá)到最好的圖像處理效果。
3.3 透明合并處理算法并行化
圖像的透明合并處理也就是說(shuō)需要實(shí)現(xiàn)圖像的一種半透明效果,從這種處理方式的數(shù)學(xué)公式和函數(shù)當(dāng)中可以看出,圖像的透明合并處理并不復(fù)雜,并且能夠在一定程度上實(shí)現(xiàn)各種形式的半透明效果,其中主要包括火光、煙霧和陰影等。在利用GPU多線程處理器來(lái)對(duì)圖像進(jìn)行透明合并處理的過(guò)程中,首先需要對(duì)兩幅圖像的位置進(jìn)行確定,并且根據(jù)圖像的實(shí)際大小,來(lái)對(duì)混合處理的范圍進(jìn)行確定,并且將所需要處理的范圍進(jìn)行分割,然后利用GPU的多線程處理器,來(lái)對(duì)所分割的單元進(jìn)行處理,最后進(jìn)行統(tǒng)一合并,來(lái)完成圖像的透明化處理[5]。在對(duì)圖像進(jìn)行透明合并處理的過(guò)程中,不存在較為復(fù)雜的邏輯控制,也就是說(shuō)對(duì)于不同的處理對(duì)象,其處理流程和方式都是保持一致的,而不同處理對(duì)象之間并不存在相應(yīng)的聯(lián)系。
4 結(jié)語(yǔ)
通過(guò)對(duì)以上算法的介紹可以發(fā)現(xiàn),在利用CUDA編程框架,在基于GPU多線程處理器對(duì)圖像進(jìn)行處理的方式,具有較快的速度和較高的成像效果。
【參考文獻(xiàn)】
【1】翟優(yōu),曾巒,熊偉.基于不變特征描述符實(shí)現(xiàn)星點(diǎn)匹配[J].光學(xué)精密工程,2012(11):56-57.
【2】陳慶奎,王海峰,那麗春,等.圖形處理器通用計(jì)算的研究綜述[J].黑龍江大學(xué)自然科學(xué)學(xué)報(bào),2012(05):23-24.
【3】Giorgia Zucchelli.使用MATLAB輕松享受GPU的強(qiáng)大功能[J].電子設(shè)計(jì)技術(shù),2012(03):44-45.
關(guān)鍵詞:數(shù)字圖像處理;車(chē)牌定位;字符分割;字符識(shí)別
中圖分類號(hào):TP391.41
隨著世界經(jīng)濟(jì)全球化發(fā)展,人們生活和消費(fèi)水平的日益提高,對(duì)汽車(chē)的需求量也越來(lái)越大,其結(jié)果是巨大的城市交通壓力擺到了人們的面前,于是如何運(yùn)用高新科學(xué)技術(shù)來(lái)解決城市交通管理的問(wèn)題越來(lái)越受到人們的重視。智能交通系統(tǒng)(Intelligent Transportation System,ITS)的出現(xiàn)大大的緩解了城市交通所帶來(lái)的巨大壓力,它被認(rèn)為是有效改善城市交通狀況最有利的工具。如今,數(shù)字圖像處理技術(shù)(Digital Image Processing)已發(fā)展成為城市生命體承載系統(tǒng)的健康識(shí)別和調(diào)控理論與方法的研究熱點(diǎn)。它的應(yīng)用范圍已從傳統(tǒng)的圖像處理技術(shù)發(fā)展到人工智能和高新科技領(lǐng)域,如計(jì)算機(jī)視覺(jué)、數(shù)碼變焦、機(jī)器人學(xué)和交通視頻監(jiān)測(cè)技術(shù)等,以數(shù)字圖像處理技術(shù)為主的研究也成為智能交通系統(tǒng)中的重要前沿研究領(lǐng)域。本文根據(jù)數(shù)字圖像處理技術(shù)的特點(diǎn),詳細(xì)的介紹了其在車(chē)牌識(shí)別系統(tǒng)中的應(yīng)用。
1 車(chē)牌識(shí)別系統(tǒng)簡(jiǎn)介
數(shù)字圖像處理技術(shù)在ITS中最令人感興趣的便是車(chē)牌識(shí)別系統(tǒng)(License Plate Recognition System)。車(chē)牌識(shí)別是一個(gè)復(fù)雜的過(guò)程,包括圖像采集、圖像預(yù)處理、車(chē)牌定位與分割、字符識(shí)別、輸出結(jié)果等階段。圖像采集多是由硬件來(lái)完成的,是抓取車(chē)牌輸入到車(chē)牌識(shí)別系統(tǒng)中的過(guò)程;圖像預(yù)處理是對(duì)車(chē)牌圖像進(jìn)行處理,減小其數(shù)據(jù)量和突出圖像有價(jià)值信息的過(guò)程;定位與分割是從處理好的圖像中只提取車(chē)牌信息,再將它們分隔成單個(gè)的字符;字符識(shí)別是將分割后的字符識(shí)別出來(lái)的過(guò)程。整個(gè)車(chē)牌識(shí)別過(guò)程如圖1所示:
圖1 車(chē)牌識(shí)別過(guò)程框圖
2 車(chē)牌定位
車(chē)牌定位算法有很多,其核心都離不開(kāi)車(chē)牌圖像中車(chē)牌所在區(qū)域的特征。其中車(chē)牌的字符紋理特征、顏色特征以及幾何特征是研究車(chē)牌定位的主要方向。圍繞著這三個(gè)特征,車(chē)牌定位方法的主要思想即是如何突出車(chē)牌的紋理特征,怎樣根據(jù)車(chē)牌的顏色特征以及如何運(yùn)用車(chē)牌的幾何特征來(lái)進(jìn)行車(chē)牌定位。
2.1 基于紋理特征的車(chē)牌定位算法
車(chē)牌本身含有豐富的紋理信息,其主要體現(xiàn)在字符上面,因?yàn)樽址y理信息是非常有規(guī)則的,關(guān)于如何通過(guò)這個(gè)特征來(lái)進(jìn)行定位的算法比較多,如Liu等[1]提出了一種基于紋理特征自動(dòng)定位車(chē)牌的算法,該算法是通過(guò)一維周期算法來(lái)進(jìn)行定位,該方法可以有效的過(guò)濾掉車(chē)牌周?chē)脑肼暎ㄎ粶?zhǔn)確;全書(shū)海等[2]提出一種改進(jìn)Sobel算子的來(lái)進(jìn)行車(chē)牌定位,該方式是通過(guò)將傳統(tǒng)的Sobel算子只利用水平和垂直方向算子來(lái)計(jì)算邊緣信息改進(jìn)為通過(guò)輸出6個(gè)方向的算子計(jì)算出的值的最大值,最大值對(duì)用的模板表示的方向作為該點(diǎn)的邊緣方向;Zheng等[3]利用奇異值特征來(lái)定位,即通過(guò)車(chē)牌灰度化后,利用灰度化后字符特征具有一定的跳變性,從而能夠?qū)④?chē)牌進(jìn)行定位。此類算法對(duì)復(fù)雜背景下的圖像,也有較好的定位效果,并且具有較好的適應(yīng)性和魯棒性;Anagnostopoulos等[4]提出了一種滑動(dòng)同心窗口的方法來(lái)定位車(chē)牌,該方法認(rèn)為圖像中車(chē)牌的紋理是不規(guī)則的,因此,局部特征發(fā)生突變的區(qū)域即是可能的車(chē)牌區(qū)域;Caner等[5]利用Gabor濾波算法分析紋理信息,這個(gè)方法對(duì)于分析紋理的無(wú)限方向和尺度十分地有效;Zhang等[6]運(yùn)用基于Adaboost學(xué)習(xí)算法結(jié)合Harr-like特征,并采用一種分級(jí)分類器的結(jié)構(gòu)來(lái)進(jìn)行車(chē)牌定位。Harr-like特征常用來(lái)進(jìn)行目標(biāo)檢測(cè),它可以利用分類器分類出車(chē)牌的亮度、顏色、尺寸和位置等不變量。
所有基于紋理特征的車(chē)牌定位算法即使是對(duì)車(chē)牌邊緣發(fā)生畸變的情況都十分地有效。然而,這些方法在擁有較多邊緣、復(fù)雜背景下和不同光照條件下時(shí)運(yùn)算起來(lái)都比較復(fù)雜。
2.2 基于顏色特征的車(chē)牌定位算法
車(chē)牌是由特定的背景顏色組合和字符組成的,因此我們可以通過(guò)顏色特征對(duì)車(chē)牌進(jìn)行定位。基于顏色特征來(lái)進(jìn)行車(chē)牌定位算法大致可以概括為兩種:一種是將提取出的車(chē)牌從RGB空間轉(zhuǎn)換到HSV(或HSI)空間從而進(jìn)行車(chē)牌定位;另一種則是利用彩色圖像的顏色特征來(lái)檢測(cè)圖像邊緣信息,以達(dá)到定位車(chē)牌的目的。
中國(guó)科技大學(xué)的陳鍛生等[7]研究出了在豐富的背景下對(duì)于帶有顏色的汽車(chē)圖像牌照提取與分割技術(shù)。該算法通過(guò)車(chē)牌牌照自身標(biāo)準(zhǔn)模式的多種重要特征,綜合了局部特征分布、形狀、彩色等信息從而進(jìn)行車(chē)牌定位;華中科技大學(xué)的任仙怡等[8]提出了一種利用顏色信息的車(chē)牌定位方法。該算法首先將RGB圖像的顏色模型轉(zhuǎn)化為HSI模型,再利用顏色信息對(duì)車(chē)牌圖像進(jìn)行彩色粗分割,然后將分割的候選車(chē)牌分為目標(biāo)區(qū)域和偽車(chē)牌區(qū)域這兩種類型,接著通過(guò)投影檢測(cè)的方法對(duì)這兩種類型進(jìn)行處理,以獲得精確的車(chē)牌區(qū)域;Yang等[9]運(yùn)用車(chē)牌顏色與字符顏色的固定搭配生成一個(gè)邊緣圖像。對(duì)圖像進(jìn)行水平掃描,如果有任何一個(gè)像素的值出現(xiàn)在車(chē)牌顏色的范圍內(nèi),接著繼續(xù)水平掃描與之鄰近的顏色值,若有兩個(gè)或者更多鄰近的值在同一個(gè)字符顏色的范圍內(nèi),那么這個(gè)像素即被認(rèn)為是一幅新的邊緣圖像的邊緣像素,分析新圖像中所有的這些邊緣即可找出車(chē)牌所在的候選區(qū)域;Wang等[10]為了處理不同光照情況下基于顏色特征的車(chē)牌定位問(wèn)題,提出了一種基于模糊邏輯的方法。運(yùn)用HSV彩色空間模型,首先將色度、飽和度、亮度三個(gè)權(quán)值根據(jù)不同的隸屬函數(shù)映射到模糊集合中,然后用這三個(gè)權(quán)值隸屬度結(jié)合起來(lái)描述模糊分類函數(shù)用以定位車(chē)牌。
利用顏色特征有利于定位出產(chǎn)生傾斜和畸變的車(chē)牌,然而直接運(yùn)用顏色投影的方法有時(shí)可能會(huì)造成檢測(cè)出錯(cuò),特別是當(dāng)圖像的某些部分,如車(chē)身與車(chē)牌部分顏色一樣時(shí)。
2.3 基于幾何特征的車(chē)牌定位算法
利用車(chē)牌的幾何特征來(lái)進(jìn)行車(chē)牌的定位,其基本原理就是在對(duì)車(chē)牌進(jìn)行預(yù)處理后的基礎(chǔ)上通過(guò)幾何特征來(lái)進(jìn)行定位。檢測(cè)所得候選區(qū)域的幾何特征,即長(zhǎng)度和寬度,通過(guò)設(shè)定閾值去掉不適合的候選區(qū)域,可以很好的提取出真正的車(chē)牌區(qū)域。因?yàn)楹蜻x區(qū)域集中在車(chē)身中間,且高度比大致為140/440=0.318,這里選取[0.30,0.45]作為判斷區(qū)間,據(jù)此幾何特征,能夠把干擾的區(qū)域剔除掉。
運(yùn)用幾何特征來(lái)進(jìn)行車(chē)牌定位的算法有很多,如Nelson等[11]利用幾何特征定位線形成一個(gè)矩形來(lái)檢測(cè)出車(chē)牌的矩形位置;Zheng等[12]利用與垂直邊緣的匹配程度選出車(chē)牌的候選區(qū)域,車(chē)牌的垂直邊緣被看成是對(duì)車(chē)牌進(jìn)行定位的一個(gè)至關(guān)重要的特征,因?yàn)橹焕盟竭吘壢菀讬z測(cè)到保險(xiǎn)杠從而定位出錯(cuò);基于塊的車(chē)牌定位方法,具有高尖邊緣的塊被認(rèn)為是可能的車(chē)牌所在區(qū)域,因?yàn)榛趬K的方法并不依賴于車(chē)牌邊界的邊緣,因此它也適用于車(chē)牌邊界不清晰的圖像;運(yùn)用基于邊界提取的Hough變換檢測(cè)圖像中的直線來(lái)進(jìn)行定位車(chē)牌,Hough變換對(duì)多達(dá)30°的傾斜直線的檢測(cè)都十分地有效,當(dāng)結(jié)合形態(tài)學(xué)的方法消除不需要的邊緣后,定位的準(zhǔn)確率將得到了大幅的提高。
3 字符分割
定位出準(zhǔn)確的車(chē)牌位置后,下一步則是將車(chē)牌字符識(shí)別出來(lái)。但是車(chē)牌里面的字符是由一連串字符組成的,直接對(duì)車(chē)牌進(jìn)行識(shí)別十分地困難,因此就需要通過(guò)字符分割的方法對(duì)車(chē)牌進(jìn)行處理,然后對(duì)車(chē)牌里面的7個(gè)字符進(jìn)行提取,這樣將使接下來(lái)的字符識(shí)別過(guò)程變得更容易一些。常用的字符分割方法主要有以下三種:基于投影特征的字符分割算法、基于字符先驗(yàn)知識(shí)的字符分割算法和基于字符輪廓的字符分割算法。
3.1 基于投影特征的字符分割算法
字符顏色與車(chē)牌背景顏色有所不同,它們?cè)诙祱D像中往往呈現(xiàn)出完全相反的二進(jìn)制值。因此,首先運(yùn)用去噪處理結(jié)合字符序列分析,接著利用垂直投影分割出字;提出了一種對(duì)提取出的二值車(chē)牌圖像進(jìn)行垂直投影的方法,確定出起始和結(jié)束的字符位置,接著對(duì)提取出的字符進(jìn)行水平投影分割出每個(gè)字符;利用投影后字符的顏色信息代替運(yùn)用二值車(chē)牌圖像進(jìn)行投影的方法進(jìn)行字符分割。綜合以上文獻(xiàn)中的方法,可以發(fā)現(xiàn)利用垂直和水平像素投影的方法明顯的要更簡(jiǎn)單跟常見(jiàn)一些。
基于投影特征的字符分割算法的優(yōu)點(diǎn)在于它并不依賴于字符所在的位置,車(chē)牌也可以存在一定角度的傾斜。不過(guò),此方法取決于圖像的質(zhì)量,任何噪聲都可能會(huì)影響投影值。
3.2 基于字符先驗(yàn)知識(shí)的字符分割算法
字符的先驗(yàn)知識(shí)可以用來(lái)幫助我們進(jìn)行車(chē)牌的字符分割。利用行掃描二值圖像的方法找出字符起始和結(jié)束的位置以進(jìn)行字符分割,當(dāng)掃描的某行中字符像素與背景像素的比例先超過(guò)某一特定的閾值然后接著低于該閾值,就認(rèn)為此行是字符所在的起始位置;把定位出的車(chē)牌調(diào)整到一個(gè)已知的模板大小,在此模板中,所有的字符位置都是已知的。經(jīng)過(guò)調(diào)整后,與模板中位置一致的即是字符所在的位置,此方法具有簡(jiǎn)單易現(xiàn)實(shí)的優(yōu)點(diǎn);首先采用顏色匹配的方法定位出車(chē)牌在圖像中的位置,然后利用每個(gè)字符的尺寸進(jìn)行字符分割操作;在文獻(xiàn)中提到,臺(tái)灣的車(chē)牌全都具有相同的顏色分布情況:白底黑字。如果采用行掃描的方法檢測(cè)黑白點(diǎn)的跳變個(gè)數(shù)應(yīng)為6~14個(gè),運(yùn)用Hough變換矯正可能存在的車(chē)牌傾斜,最后利用混合二值化技術(shù)可以分割出受污染的車(chē)牌字符。
3.3 基于字符輪廓的字符分割算法
字符的輪廓模型也可以用于進(jìn)行車(chē)牌的字符分割。利用一種快速變化推進(jìn)算法建立了一種以形狀驅(qū)動(dòng)的主動(dòng)輪廓模型。此模型分為兩步進(jìn)行處理,首先運(yùn)用一種普通的快速推進(jìn)技術(shù)結(jié)合一個(gè)梯度依賴和曲率依賴的速度函數(shù)粗定位出每個(gè)字符的大致位置,然后利用一種特殊的快速推進(jìn)方法獲得字符所在位置的準(zhǔn)確邊界,進(jìn)而分割出每個(gè)字符。
4 字符識(shí)別
準(zhǔn)確分割出車(chē)牌的字符后,下一步則是將車(chē)牌字符識(shí)別出來(lái)。然而在車(chē)牌識(shí)別系統(tǒng)中字符識(shí)別可能存在以下一些困難:由于鏡頭的縮放,可能導(dǎo)致分割出的字符大小和厚度不一致;不同的國(guó)家所用的車(chē)牌字符的字體都不一樣;分割出的車(chē)牌字符可能存在噪點(diǎn)和缺損;分割出的車(chē)牌字符可能存在一定角度的傾斜等。接下來(lái),本文將把現(xiàn)有的一些常見(jiàn)的車(chē)牌字符識(shí)別算法根據(jù)他們的特點(diǎn)分成兩類,以解決在進(jìn)行字符識(shí)別時(shí)遇到的困難。
4.1 基于模板匹配的字符識(shí)別算法
在字符識(shí)別的算法中,模板匹配算法是一種既簡(jiǎn)單又容易的方法。該方法判斷字符與模板之間匹配的相似度,與模板中的字符相似度最高的即為車(chē)牌的字符。大多數(shù)模板匹配算法都采用二值圖像來(lái)進(jìn)行處理,這是由于灰度跳變會(huì)受不同光照條件的影響。
在對(duì)字符進(jìn)行歸一化處理之后,都采用字符匹配算法來(lái)進(jìn)行車(chē)牌的字符識(shí)別,文獻(xiàn)中定義了幾個(gè)相似性的度量技術(shù),如馬氏距離和貝葉斯決策定理,杰卡德值,豪斯多夫距離和漢明距離,利用歸一化互相關(guān)系數(shù)作為模板匹配分割出的字符,每個(gè)模板逐列的掃描字符以計(jì)算歸一化互相關(guān)系數(shù),模板中的最大值即為最相似的字符。
模板匹配算法對(duì)識(shí)別單個(gè)字體、非旋轉(zhuǎn)的、非缺損的和固定大小的字符十分地有效。但是,如果遇到因一個(gè)字符產(chǎn)生形變、旋轉(zhuǎn)或有噪點(diǎn)等情況,就可能影響到模板匹配算法識(shí)別的準(zhǔn)確率。
4.2 基于特征提取的字符識(shí)別算法
因?yàn)椴⒉皇敲總€(gè)字符的像素點(diǎn)都對(duì)區(qū)分字符具有相同的重要性,一種提取某些字符特征的特征提取方法是一個(gè)很好的可替代灰度級(jí)模板匹配的算法。這種算法降低了用模板匹配法來(lái)進(jìn)行處理的時(shí)間,因?yàn)椴⒉皇撬械南袼攸c(diǎn)都會(huì)涉及到。該方法也克服了模板匹配法無(wú)法做到的對(duì)產(chǎn)生了形變的字符進(jìn)行識(shí)別的問(wèn)題。
利用對(duì)二值圖像進(jìn)行水平和垂直投影獲得特征向量,把二進(jìn)制的字符分割成3×3的像素塊以獲取特征向量,然后統(tǒng)計(jì)每個(gè)像素塊中黑色像素的值。在對(duì)字符進(jìn)行細(xì)化操作之后把二進(jìn)制的字符分割成3×3的像素塊并統(tǒng)計(jì)它們?cè)?°、45°、90°和135°傾斜角時(shí)的像素個(gè)數(shù)以獲取特征向量;首先沿著中心軸掃描字符,該中心軸是上限水平中心矩和下限水平中心矩的連接,然后由字符到背景轉(zhuǎn)換的數(shù)量和他們之間的間距形成了每個(gè)字符的特征向量。該方法對(duì)字符產(chǎn)生旋轉(zhuǎn)的情況一樣有效,因?yàn)樗@得的特征向量是一致的;利用采樣的字符輪廓所得到的波形量化為特征向量。該方法可用于識(shí)別多字體和多尺寸的字符,因?yàn)樽址妮喞⒉皇茏煮w和尺寸改變的影響。
5 結(jié)論及發(fā)展趨勢(shì)
本文綜述了當(dāng)前現(xiàn)有的一些比較成熟的車(chē)牌識(shí)別算法,并根據(jù)其在每個(gè)階段不同的特征對(duì)這些算法進(jìn)行了分類。總之,由于車(chē)牌識(shí)別系統(tǒng)是計(jì)算機(jī)視覺(jué)和數(shù)字圖像處理技術(shù)在智能交通領(lǐng)域的重要研究?jī)?nèi)容,因此它對(duì)于現(xiàn)代智能交通有著十分重要的意義。接下來(lái),車(chē)牌識(shí)別技術(shù)的發(fā)展趨勢(shì)將主要集中在多風(fēng)格的車(chē)牌識(shí)別系統(tǒng)、基于攝像頭拍攝的實(shí)時(shí)信息的車(chē)牌識(shí)別系統(tǒng)、多車(chē)牌同時(shí)進(jìn)行處理的識(shí)別系統(tǒng)、高清晰度的車(chē)牌圖像處理系統(tǒng)以及模糊字符的車(chē)牌識(shí)別系統(tǒng)等方向。
參考文獻(xiàn):
[1]Liu CY,Chang FL.A novel algorithm of license plates automation location based on texture feature[C].Proceedings of the IEEE International Conference on Automation and Logistics.China:Shenyang,2009:1360-1363.
[2]王濤,全書(shū)海.基于改進(jìn)Sobel算子的車(chē)牌定位方法[J].微計(jì)算機(jī)信息,2008(05):312-314.
[3]Zheng DN,Tao YN.An efficient method of license plate location[J].Pattern Reconiton Letters,2005(26):2431-2438.
[4]C.-N.E.Anagnostopoulos,I.E. Anagnostopoulos,V.Loumos,and E.Kayafas.A license plate-recognition algorithm for intelligent transportation system applications[C].IEEE Trans.Intell.Trans.Syst.,2006:377-392.
[5]H.Caner,H.S.Gecim, and A.Z.Alkar.Efficient embedded neural-network-based license plate recognition system[C].IEEE Trans.Veh.Tech.,2008:2675-2683.
[6]H.Zhang,W.Jia,X.He,and Q.Wu.Learning-based license plate detection using global and local features[C].In Proc.Int.Conf.Pattern Recognit.,2006:1102-1105.
[7]陳鍛生,謝志鵬,劉政凱.復(fù)雜背景下彩色圖像提取與字符分割技術(shù)[J].小型計(jì)算機(jī)系統(tǒng),2002(09):1144-1148.
[8]任仙怡,周曉,張桂林等.彩色汽車(chē)牌照定位[J].紅外與激光工程,2002(03):204-207.
[9]Y.-Q.Yang,J.B.R.-L.Tian,and N. Liu. A vehicle license plate recognition system based on fixed color collocation[C].In Proc. Int. Conf. Mach.Learning Cybern.,2005:5394-5397.
[10]F.Wang,L.Man,B.Wang,Y.Xiao,W.Pan,and X.Lu.Fuzzy-based algorithm for color recognition of license plates[J].Pattern Recognit.Lett.,2008:1007-1020.
[11]C.Nelson Kennedy Babu and K. Nallaperumal.An efficient geometric feature based license plate localization and recognition[C].Int.J.Imaging Sci.Eng.,2008:189-194.
[12]D.Zheng,Y.Zhao,and J.Wang.An efficient method of license plate location[J].Pattern Recognit.Lett.,2005:2431-2438.
【關(guān)鍵詞】FPGA,Sobel,Verilog;
在圖像處理中邊緣蘊(yùn)含了豐富的信息,是圖像的基本特征之一。邊緣檢測(cè)不僅能減少圖像處理的工作量,還能保留圖像中物體的形狀特性。所以研究邊緣檢測(cè)是非常有必要的。FPGA是利用硬件編程語(yǔ)言對(duì)圖像進(jìn)行處理,可以同一時(shí)間處理大量的數(shù)據(jù),在此利用FPGA的并行結(jié)構(gòu)特性和流水線技巧,快速實(shí)現(xiàn)了Sobel邊緣檢測(cè)算法 。為圖像的后續(xù)處理打下了基礎(chǔ)。
一、Sobel邊緣檢測(cè)算法
邊緣檢測(cè)算法都是通過(guò)梯度算子來(lái)實(shí)現(xiàn)的。經(jīng)典的梯度算子有Sobel、Kirsch、Roberts等。在求邊緣的梯度時(shí)需要對(duì)每個(gè)像素點(diǎn)進(jìn)行計(jì)算,工作量是比較大的。在這些算法中Sobel具有計(jì)算簡(jiǎn)單、檢測(cè)效果好的特點(diǎn),是一種被廣泛應(yīng)用的算法。Sobel算子是一階導(dǎo)數(shù)的邊緣算子。是利用水平和垂直方向上3X3的Sobel算子模版,與選定圖像中同樣大小的窗口中的每個(gè)像素點(diǎn)做卷積求和運(yùn)算,窗口中心點(diǎn)為待求的像素點(diǎn)。計(jì)算出圖像水平和垂直方向的梯度值,然后對(duì)水平和垂直方向的梯度值的平方求和,再開(kāi)方。與設(shè)定的閾值進(jìn)行比較,如果結(jié)果大于閾值邊視為邊緣點(diǎn),否者就不是邊緣點(diǎn)。
圖1為水平方向的Sobel矩陣算子,圖2為垂直方向的Sobel矩陣算子。圖3為3X3模版的像素灰度值。
利用Sobel算子對(duì)圖3中的3X3模版做卷積和計(jì)算。就可以得到p5像素處水平和垂直方向的梯度值Gx和Gy。最后利用
(1)
算出p5處的灰度值,再與設(shè)定的閾值進(jìn)行比較。若大于閾值就視為邊緣點(diǎn),不然就是普通點(diǎn)。
二、Sobel邊緣檢測(cè)算法的硬件系統(tǒng)實(shí)現(xiàn)
(一)Sobel實(shí)現(xiàn)方法選擇
由于Quartus II 9.0自帶有很多的IP核,可以調(diào)用IP核進(jìn)行乘法、并行相加來(lái)實(shí)現(xiàn)Sobel邊緣檢測(cè)。但是這樣就會(huì)涉及到補(bǔ)碼、負(fù)數(shù)等。實(shí)現(xiàn)方法較為復(fù)雜。在本文中提出一種簡(jiǎn)單的算法實(shí)現(xiàn)邊緣檢測(cè),把復(fù)雜的問(wèn)題簡(jiǎn)單化。
對(duì)于水平模版,把圖3中的第1列和第3列像素點(diǎn)分別與其相應(yīng)的位置做卷積和,并且分別取第1列和第3列的卷積和的絕對(duì)值比較大小,把較大值認(rèn)為Gx。
Gx=max{(p1+2p4+p7),(p3+2p6+p9)} (2)
對(duì)于垂直模版,把圖2中的第1行和第3行像素點(diǎn)分別與其對(duì)應(yīng)的位置做卷積和,并分別取第1行和第3行的卷積和的絕對(duì)值比較大小,把較大值認(rèn)為Gy。
Gy=max{(p1+2p2+p3),(p7+2p8+p9)} (3)
(二)Sobel的硬件實(shí)現(xiàn)
由于Sobel的實(shí)現(xiàn)需要3X3的像素模版與水平方向和垂直方向的卷積因子進(jìn)行卷積求和,所以這里利用Quartus II 9.0自帶的IP核Shift Register(RAM-based)構(gòu)建三行以此為基礎(chǔ)獲得3X3的像素模版。如圖4所示
圖4 移位寄存器
在得到3X3模版后利用(2)、(3)進(jìn)行硬件實(shí)現(xiàn),關(guān)鍵代碼如下
begin
Gy1
Gy2
Gy Gy2? Gy1-Gy2 : Gy2-Gy1;
end
begin
Gx1
Gx2
Gx Gx2?Gx1-Gx2 : Gx2-Gx1;
end
經(jīng)過(guò)一系列運(yùn)算就得到Gx與Gy,再根據(jù)公式(1)與自己設(shè)置的閾值,就能實(shí)現(xiàn)Sobel邊緣檢測(cè)。
三、實(shí)驗(yàn)結(jié)果
在視頻采集系統(tǒng)里面加入Sobel邊緣檢測(cè)模塊,編譯并下載程序,運(yùn)行系統(tǒng),實(shí)驗(yàn)結(jié)果如圖5所示。
實(shí)驗(yàn)效果顯示可以很好的進(jìn)行邊緣檢測(cè),經(jīng)過(guò)邊緣檢測(cè)處理后也為后續(xù)更復(fù)雜的圖像處理打下了基礎(chǔ)。
四、結(jié)束語(yǔ)
通過(guò)利用FPGA的并行特性,完成了3X3模版像素的提取和Sobel邊緣檢測(cè)算子的處理。通過(guò)FPGA的流水線結(jié)構(gòu)和并行特點(diǎn)處理了大量的數(shù)據(jù),最終實(shí)現(xiàn)了Sobel邊緣檢測(cè)。為更加復(fù)雜的圖像處理進(jìn)行了鋪墊。
參考文獻(xiàn):
[1]岡撒雷斯.數(shù)字圖像處理.北京:電子工業(yè)出版社.
[2]王濤,全書(shū)海.基于改進(jìn)Sobel算子的車(chē)牌定位方法.微計(jì)算機(jī)信息,2008,24(5):63―65.
[3]夏宇聞.Verilog數(shù)字系統(tǒng)設(shè)計(jì)教程[M].北京:北京航空航天大學(xué)出版社,2003.
關(guān)鍵詞:嵌入式系統(tǒng);機(jī)器視覺(jué);測(cè)控系統(tǒng);圖像跟蹤
中圖分類號(hào):TP391.41文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2010)08-1987-02
1 概述
隨著科學(xué)技術(shù)的發(fā)展,更高速,更可靠,更低成本成為各種技術(shù)開(kāi)發(fā)的要求。因此,設(shè)計(jì)能實(shí)現(xiàn)實(shí)時(shí)視覺(jué)圖像采集、視覺(jué)圖像處理控制,使其結(jié)構(gòu)更緊湊,甚至完全不需要計(jì)算機(jī)的介入,提高處理速度,并能有效降低成本的專用機(jī)器視覺(jué)控制系統(tǒng),使得該系統(tǒng)具有安裝方便、配置靈活、便于攜帶等突出優(yōu)點(diǎn)。為此,本課題提出了基于嵌入式機(jī)器視覺(jué)測(cè)控系統(tǒng)的研究,在嵌入式系統(tǒng)上實(shí)現(xiàn)實(shí)時(shí)視覺(jué)圖像采集、視覺(jué)圖像處理及控制,構(gòu)成處理速度快,成本低,結(jié)構(gòu)緊湊,不需要計(jì)算機(jī)介入的專用嵌入式機(jī)器視覺(jué)測(cè)控系統(tǒng)。
2 系統(tǒng)總體設(shè)計(jì)
2.1 設(shè)計(jì)方案
目前,用于圖像采集處理系統(tǒng)的嵌入式核心器件一般有FPGA、DSP和ARM芯片,出于成本控制與測(cè)控系統(tǒng)性能要求的考慮,這里選用FPGA方案。
FPGA內(nèi)嵌的NiosII軟核處理器是32位的,主要包括CPU微處理器、I/O中斷、計(jì)時(shí)器、UART串口及大量通用寄存器。選用FPGA方案的優(yōu)點(diǎn)在于,在單個(gè)芯片上既可以完成圖像采集等復(fù)雜邏輯的控制,又可以用內(nèi)嵌的NiosII處理器完成對(duì)圖像的處理和識(shí)別,電路設(shè)計(jì)簡(jiǎn)單,成本低。
對(duì)于機(jī)器視覺(jué)測(cè)控系統(tǒng),在選用了嵌入式處理器實(shí)現(xiàn)圖像采集的功能之后,需要將視頻圖像進(jìn)行數(shù)字化處理,這里采用標(biāo)準(zhǔn)工業(yè)攝像機(jī)+視頻圖像數(shù)字化模塊的方法實(shí)現(xiàn)。標(biāo)準(zhǔn)工業(yè)攝像機(jī)的輸出信號(hào)一般是PAL制式或NTSC制式的模擬信號(hào),信號(hào)在進(jìn)行數(shù)字圖像處理前必須經(jīng)過(guò)刀D轉(zhuǎn)換,即視頻采集。視頻采集是整個(gè)系統(tǒng)中的一個(gè)重要組成部分,它是對(duì)模擬視頻信號(hào)實(shí)現(xiàn)數(shù)字圖像處理的第一個(gè)步驟。該方案具有通用性好、成本低的優(yōu)點(diǎn)。
2.2 總體結(jié)構(gòu)設(shè)計(jì)
1) 硬件設(shè)計(jì)
硬件設(shè)計(jì)包括系統(tǒng)硬件電路的連接和FPGA內(nèi)部邏輯電路的設(shè)計(jì)。
FPGA內(nèi)部邏輯電路的設(shè)計(jì)是以QuartusII為開(kāi)發(fā)環(huán)境,用VHDL語(yǔ)言編程實(shí)現(xiàn)圖像采集、SRAM總線切換等模塊的功能,用SOPC Builder配置、產(chǎn)生NiosII軟核處理器及必要的外設(shè)(用戶自定義外設(shè)用VHDL編程實(shí)現(xiàn)),然后一起編譯并下載到FPGA的配置芯片中,再由配置芯片完成對(duì)FPGA的上電配置,由此形成硬件邏輯電路的連接,實(shí)現(xiàn)圖像采集、處理、存儲(chǔ)、顯示、實(shí)時(shí)控制等功能模塊。
2) 軟件設(shè)計(jì)
用SOPC Builder生成NiosII處理器系統(tǒng)的同時(shí),也會(huì)生成相應(yīng)的SDK軟件開(kāi)發(fā)包。在這個(gè)軟件包的基礎(chǔ)上,開(kāi)發(fā)者可以利用NiosII IDE,移植嵌入式實(shí)時(shí)操作系統(tǒng)μc/OS-II,編寫(xiě)C或者C++程序來(lái)完成對(duì)圖像的二值化、區(qū)域分割、特征提取、模式識(shí)別等處理過(guò)程,最終實(shí)現(xiàn)對(duì)目標(biāo)軌跡的跟蹤,實(shí)時(shí)控制機(jī)器人沿規(guī)定軌跡運(yùn)行。
3 關(guān)鍵技術(shù)問(wèn)題探討
3.1 圖像采集CCD模塊設(shè)計(jì)
圖像信息的獲取就是捕捉待處理目標(biāo)的圖像信息并將其轉(zhuǎn)換成適合一體機(jī)處理的數(shù)字信號(hào),這一過(guò)程主要包括圖像捕獲、光電轉(zhuǎn)換及數(shù)字化等幾個(gè)步驟。目前圖像信息獲取可以使用CCD、CMOS、CIS等傳感器,其中以CCD的應(yīng)用最為廣泛。
本設(shè)計(jì)模塊采用1/3寸逐行掃描型黑白面陣CCD圖像傳感器ICX424AL。ICX424AL有效光敏單元為659×494,靈敏度高、暗電流小,帶有電子快門(mén)。由三相垂直脈沖(V1、V2、V3)和兩相水平脈沖(H1、H2)驅(qū)動(dòng)工作,水平驅(qū)動(dòng)時(shí)鐘頻率為24.154MHz,驅(qū)動(dòng)電壓5V。曝光之后,每一列成像勢(shì)阱中的電荷在脈沖的驅(qū)動(dòng)作用下被移至勢(shì)阱旁的垂直寄存器當(dāng)中,然后垂直驅(qū)動(dòng)脈沖發(fā)揮作用,每次脈沖驅(qū)動(dòng)垂直寄存器組中的像素電荷向下移一行,而此時(shí)最下面一行的像素電荷則被移動(dòng)到水平寄存器當(dāng)中。之后水平驅(qū)動(dòng)脈沖發(fā)揮作用,脈沖驅(qū)動(dòng)水平寄存器中的像素的電荷向輸出口移動(dòng)。被移出像素電荷,經(jīng)過(guò)放大器后形成電壓信號(hào)輸出。水平寄存器被移空后,剩余電荷再次向下移一行,在水平驅(qū)動(dòng)脈沖作用下,水平寄存器的電荷再次被依次移出。上述過(guò)程一直重復(fù)直至所有像素電荷被移出。
ICX424AL的驅(qū)動(dòng)時(shí)序由CCD信號(hào)處理器AD9929產(chǎn)生。AD9929有一個(gè)三線式串行接的串行通信接口,通過(guò)該接口可以對(duì)AD9929時(shí)序發(fā)生器的相位寄存器組進(jìn)行操作,發(fā)送配置信息或讀取AD9929的工作狀態(tài)。AD9929可直接與CCD傳感器相連接,CCD像素模擬電壓信號(hào)在AD9929驅(qū)動(dòng)脈沖的作用下,由CCD_IN引腳輸入到AD9929中,經(jīng)模擬前端采樣、放大和A/D轉(zhuǎn)換后,產(chǎn)生8位的數(shù)字信號(hào)由DOUT[0-11]引腳輸出,這些數(shù)字信號(hào)即為CCD圖像傳感器捕捉到的待測(cè)目標(biāo)的原始圖像信息。
3.2 圖像實(shí)時(shí)跟蹤算法設(shè)計(jì)
由CCD模塊負(fù)責(zé)采集圖像,那么嵌入式系統(tǒng)必須要有完善的圖像跟蹤算法,才能夠?qū)崿F(xiàn)智能機(jī)器人對(duì)目標(biāo)的跟蹤,傳統(tǒng)的圖像跟蹤算法由于運(yùn)算量較大而存在實(shí)時(shí)性較差的問(wèn)題,因此,有必要對(duì)圖像跟蹤算法進(jìn)行實(shí)時(shí)性優(yōu)化設(shè)計(jì)。
目標(biāo)圖像跟蹤是一個(gè)序列圖像處理、識(shí)別和測(cè)量過(guò)程。在跟蹤過(guò)程中,目標(biāo)可能出現(xiàn)大小、形狀、姿態(tài)等變化,加上實(shí)際環(huán)境中的各種干擾,以及圖像處理最小計(jì)量單位的精度問(wèn)題,相關(guān)跟蹤得不到絕對(duì)最佳的匹配位置,存在測(cè)量誤差。因此,為了保證跟蹤的穩(wěn)定性,需要對(duì)圖像跟蹤模板進(jìn)行自適應(yīng)更新。圖像跟蹤模板的更新是目標(biāo)跟蹤中要解決的重要問(wèn)題之一,圖像跟蹤模板更新過(guò)快或過(guò)慢,都有可能丟失所跟蹤的目標(biāo)。判斷圖像跟蹤模板是否需要更新要根據(jù)相關(guān)的置信度信號(hào),如果相關(guān)匹配的置信度高,就可以根據(jù)本幀圖像的匹配點(diǎn)處的坐標(biāo)來(lái)更新圖像跟蹤模板;如果置信度低,則說(shuō)明匹配不穩(wěn)定,要沿用以前的匹配圖像跟蹤模板對(duì)下一幀進(jìn)行相關(guān)匹配。
相關(guān)置信度信號(hào)是在分析相關(guān)匹配算法的基礎(chǔ)上設(shè)計(jì)出來(lái)的,它是一個(gè)非常重要的參數(shù)。經(jīng)過(guò)分析可知:若匹配點(diǎn)處的峰值很大,且峰值與其它非匹配點(diǎn)的均值之差越大,則表明跟蹤越可靠。定義幀內(nèi)相關(guān)置信度為:
式中:C0是幀內(nèi)相關(guān)置信度;maxR是當(dāng)前幀匹配點(diǎn)處的誤差累加次數(shù);R是同一幀內(nèi)M個(gè)依次比maxR小的誤差累加次數(shù)的均值,如果maxR和R相差越大,則說(shuō)明該匹配點(diǎn)越可靠。本算法可根據(jù)計(jì)算速度的需要對(duì)M取值,一般可以取M等于20~100的任何值。若C0大于閾值T0,則認(rèn)為相關(guān)匹配值maxR符合幀內(nèi)置信度,更新圖像跟蹤模板;否則,相關(guān)匹配不可靠,不更新圖像跟蹤模板。閾值T0根據(jù)圖像的質(zhì)量和經(jīng)驗(yàn)來(lái)確定,這里我們?nèi)0=0.6。
實(shí)踐證明,在序列圖像跟蹤過(guò)程中,若單純地利用當(dāng)前圖像的最佳匹配位置處的圖像跟蹤模板作為依據(jù)進(jìn)行下一幀圖像的匹配,則跟蹤結(jié)果很容易受某一幀發(fā)生突變的圖像的影響而偏離正確位置。因此,本系統(tǒng)采用基于置信度的加權(quán)自適應(yīng)模板修正算法:如果當(dāng)前幀匹配質(zhì)量很差,則該幀圖像數(shù)據(jù)不進(jìn)行修正;而若當(dāng)前幀匹配質(zhì)量很好,則該幀圖像數(shù)據(jù)進(jìn)行修正,加權(quán)修正算法表示如下式:
上式中,T(i,j,t)為當(dāng)前幀使用的圖像跟蹤模板,O(i,j,t)為當(dāng)前幀最佳匹配位置的子圖像,T(i,j,t+1)為預(yù)測(cè)得到的下一幀圖像坐標(biāo),α為加權(quán)系數(shù)(0≤α≤1),該系數(shù)的大小根據(jù)幀內(nèi)相關(guān)置信度C0,按照下式計(jì)算:
4 結(jié)束語(yǔ)
本文在嵌入式系統(tǒng)與機(jī)器視覺(jué)控制系統(tǒng)的交叉點(diǎn)展開(kāi)研究,目的是將具有重要意義的機(jī)器視覺(jué)控制系統(tǒng)應(yīng)用到具有廣泛基礎(chǔ)的嵌入式系統(tǒng)平臺(tái)上,拓展機(jī)器視覺(jué)的應(yīng)用范圍。通過(guò)對(duì)機(jī)器視覺(jué)控制系統(tǒng)及嵌入式系統(tǒng)設(shè)計(jì)方案的選擇,并對(duì)基于嵌入式機(jī)器視覺(jué)控制系統(tǒng)的關(guān)鍵技術(shù)問(wèn)題展開(kāi)研究,以此為依據(jù),設(shè)計(jì)了相應(yīng)的硬件系統(tǒng)和軟件系統(tǒng),并將其應(yīng)用到智能機(jī)器人視覺(jué)的控制上。
參考文獻(xiàn):
[1] 王耀南,李樹(shù)濤,毛建旭.計(jì)算機(jī)圖像處理與識(shí)別技術(shù)[M].北京:高等教育出版社,2001.
[2] 段峰,王耀南,雷曉峰.機(jī)器視覺(jué)技術(shù)及其應(yīng)用綜述[J].自動(dòng)化博覽,2002,19(3):59-61.
關(guān)鍵詞:
匹配算法;圖像匹配;關(guān)鍵技術(shù);圖像評(píng)價(jià)
中圖分類號(hào):
F49
文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):16723198(2013)21017602
1基本概念
圖像匹配是指通過(guò)特定的某種算法在某待測(cè)圖像或待測(cè)圖像的子圖中(也就是搜索圖像)尋找目標(biāo)圖像(也稱為模板圖像)的過(guò)程。一般情況下,待測(cè)圖像比較大,目標(biāo)圖像稍小。由于視角不同、拍攝器材不同等都會(huì)造成同一物體在不同時(shí)間的成像也是不同的,再加上噪聲、旋轉(zhuǎn)、干擾、圖像預(yù)處理等對(duì)圖像的影響,無(wú)形地?cái)U(kuò)大了搜索圖像和目標(biāo)圖像之間的差異,從而增加了增加匹配難度。因此,如何極速地檢測(cè)出目標(biāo)圖像在搜索圖像中的準(zhǔn)確位置仍是圖像匹配研究人員的重要研究方向。
2關(guān)鍵技術(shù)
大量?jī)?yōu)秀的國(guó)內(nèi)外學(xué)者都將自己的精力投入到圖像匹配研究中,因此產(chǎn)生了海量的圖像匹配算法。這些算法各有優(yōu)劣,推動(dòng)著圖像匹配技術(shù)的發(fā)展。就這些算法來(lái)說(shuō),圖像匹配技術(shù)的研究及算法主要包含以下四個(gè)方面:
(1)相似度。相似度是相似性度量的簡(jiǎn)稱,主要用來(lái)衡量待測(cè)圖像和目標(biāo)圖像之間的相似程度。目前使用較多的相似性度量主要有:最小距離度量、相關(guān)函數(shù)度量及概率度量這三種。最小度量主要包含:Hausdorff距離、AD(絕對(duì)差)、SD(平方差)、MAD(平均絕對(duì)差)及MSD(平均平方差)等;歸一化互相關(guān)函數(shù)、協(xié)方差函數(shù)、積相關(guān)函數(shù)等是主要的相關(guān)函數(shù);概率度量則是一種相似比,它是用后驗(yàn)概率來(lái)估算的目標(biāo)圖像與潛在待測(cè)子圖間的相似度。
(2)特征空間。提取待測(cè)圖像及目標(biāo)圖像的部分特征或是主要特征構(gòu)成特征空間,然后通過(guò)對(duì)比特征空間進(jìn)行匹配。所以,構(gòu)建合理而恰當(dāng)?shù)奶卣骺臻g不但能提高圖像匹配速度,也能提升匹配精度。目前常用的圖像特征主要有空間位置、點(diǎn)特征、圖像邊緣、紋理、顏色形狀等。
(3)搜索策略。搜索策略的優(yōu)劣直接影響圖像匹配的精度及速度。目前使用的搜索算法比較多也比較復(fù)雜,有單一的某種搜索算法,也有融合了幾種算法的搜索算法,還有一些是基于基本算法的改進(jìn)算法。常用的基本搜索算法有遺傳算法、粒子群優(yōu)化算法、金字塔分層搜索法、魚(yú)群算法等。
(4)搜索空間。待測(cè)圖像中所有的可能位置和變換后可能的匹配位置共同構(gòu)成圖像匹配的搜索空間。因此,為了縮短匹配時(shí)間,應(yīng)盡量縮小搜索空間。
相似性度量函數(shù)和特征空間的選擇主要影響匹配精度和算法的抗噪性及抗干擾能力。而搜索策略和搜索空間則將直接影響算法的匹配速度。
3匹配評(píng)價(jià)
目前,圖像匹配算法缺乏通用性,算法的好壞也沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)。我們一般主要從以下四個(gè)方面來(lái)評(píng)價(jià)圖像匹配算的性能:
(1)匹配概率。正確匹配的次數(shù)與總匹配次數(shù)之間的比值就是匹配概率,它基于統(tǒng)計(jì)學(xué)的概率統(tǒng)計(jì)。一般情況下,我們應(yīng)該把算法的錯(cuò)誤匹配率限定在一個(gè)比較小的特定精度范圍內(nèi),也就是說(shuō)我應(yīng)該盡量提升算法的正確匹配概率。匹配概率高低的主要影響因素有提取到的圖像特征空間、匹配算法和匹配精度。提取的圖像特征細(xì)而且密集,那么匹配概率則較高,但圖像變換這緩慢,匹配較慢。匹配算法也會(huì)影響匹配概率,有些極端的匹配算法也會(huì)導(dǎo)致匹配概率接近零。
匹配概率=正確匹配次數(shù)總匹配次數(shù)
(2)匹配精度。匹配的準(zhǔn)確性就被稱為匹配精度。匹配精度的計(jì)算方法有多種,我們一般用匹配誤差的均方差來(lái)表示:均方差小,則匹配位置誤差小,匹配精度高;反之匹配精度低。匹配誤差是指匹配算法得到的匹配位置和目標(biāo)圖像在待測(cè)圖像中的真實(shí)位置之間的偏差。匹配精度的影響因素很多,主要有噪聲污染、干擾、變形、算法選擇、適應(yīng)度函數(shù)構(gòu)造等。
(3)匹配速度。圖像的匹配速度是指匹配的時(shí)間。主要由匹配算法的本身計(jì)算量和算法的結(jié)構(gòu)兩部分決定。算法的本身計(jì)算量等于相似性計(jì)算量乘以待檢測(cè)的匹配點(diǎn)。所以相似性計(jì)算簡(jiǎn)單,且待檢測(cè)點(diǎn)少,那么相應(yīng)的匹配時(shí)間久短。算法的結(jié)構(gòu)主要是指算法是并行還是串行算法,并行能較大程度的提升匹配速度,但是并行算法的實(shí)現(xiàn)不但與算法本身設(shè)計(jì)有關(guān),還需要相應(yīng)的硬件支持才能運(yùn)行。雖然如此,現(xiàn)在已經(jīng)有很多學(xué)者已投身于基于并行算法的分布式圖像匹配系統(tǒng)研究中了。
(4)魯棒性及通用性。實(shí)際應(yīng)用中,待測(cè)圖像一般都是有噪聲或是干擾等,這就要求匹配算法具有較強(qiáng)的抗干擾和除噪能力,這就是算法魯棒性。目前,沒(méi)有一種圖像匹配算法能適用于所有的圖像匹配,但是我們都希望匹配算法能盡量適合于更多的匹配需求。所以應(yīng)盡可能提高算法的通用性。所以魯棒性和通用性不是匹配算法質(zhì)量最主要的評(píng)價(jià)標(biāo)準(zhǔn)。
4結(jié)束語(yǔ)
圖像匹配雖然起步較晚,發(fā)展較快,已經(jīng)在理論和實(shí)踐上取得了很大發(fā)展,但它依然存在很多問(wèn)題。比如相似度函數(shù)的設(shè)計(jì)或是選擇,圖像特征的提取,算法的構(gòu)造等仍有很大的改進(jìn)空間。我們?nèi)栽跒樵O(shè)計(jì)出有強(qiáng)通用性、高匹配精度、高匹配概率、匹配速度快、強(qiáng)魯棒性的匹配算法而努力。
參考文獻(xiàn)
[1]戴濤,朱長(zhǎng)仁,胡樹(shù)平.圖像匹配技術(shù)綜述[J].數(shù)字技術(shù)與應(yīng)用,2012:174176.
[2]蔣大林,李林.圖像匹配技術(shù)研究[C].計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展,2008.
[3]卜凡艷.數(shù)字圖像匹配技術(shù)研究[D].合肥:合肥工業(yè)大學(xué),2010.
[4]王宏力.賈萬(wàn)波.圖像匹配算法研究綜述[J].計(jì)算機(jī)技術(shù)與應(yīng)用進(jìn)展,2008:418422.
[5]劉錦峰.圖像模板匹配快速算法研究[D].廣州:中山大學(xué),2007,(5).
[6]Wu Gang, Wu Chun-feng.Target Location Method Based on Invariable Moment Feature Matching[J].Optics Precision Engineering, 2009,17(2):460468.
關(guān)鍵詞:瀝青混合料,細(xì)觀力學(xué),數(shù)值模擬,損傷力學(xué)
中圖分類號(hào):TV431文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào):
0引言
復(fù)合材料力學(xué)研究具有宏細(xì)觀兩個(gè)層次。傳統(tǒng)的宏觀力學(xué)方法從唯象學(xué)的觀點(diǎn)出發(fā),將復(fù)合材料當(dāng)作宏觀均勻介質(zhì),視增強(qiáng)相和基體為一體,不考慮組分相的相互影響,僅考慮復(fù)合材料的平均表現(xiàn)性能。宏觀力學(xué)分析方法忽略了復(fù)合材料的細(xì)觀結(jié)構(gòu)特點(diǎn),沒(méi)有考慮復(fù)合材料的細(xì)觀破壞形態(tài),因此,難以反映深層次的物理機(jī)制。而細(xì)觀力學(xué)的核心任務(wù)是建立復(fù)合材料宏觀性能與其組分性能及其細(xì)觀結(jié)構(gòu)之間的定量關(guān)系,揭示材料及結(jié)構(gòu)在一定工況下的響應(yīng)規(guī)律及其本質(zhì)。細(xì)觀力學(xué)在復(fù)合材料宏觀彈性性能預(yù)測(cè)、彈塑性變形、損傷破壞分析等方面具有宏觀力學(xué)無(wú)可比擬的優(yōu)勢(shì)。因此,越來(lái)越多的研究者投身于復(fù)合材料細(xì)觀力學(xué)的研究。瀝青混合料作為道路工程界的一種重要復(fù)合材料,其細(xì)觀力學(xué)的研究自然廣受業(yè)內(nèi)研究工作者的重視。
1瀝青混合料的細(xì)觀力學(xué)研究
瀝青混合料是具有復(fù)雜結(jié)構(gòu)的非均質(zhì)、多相(氣相、液相、固相)和多層次(微觀、細(xì)觀、宏觀)的復(fù)合材料體系,其宏觀行為所表現(xiàn)出的不規(guī)則性、不確定性、模糊性、非線性等特征,正是其細(xì)觀結(jié)構(gòu)復(fù)雜性的反映。
細(xì)觀力學(xué)認(rèn)為,通過(guò)電鏡觀察到一個(gè)畫(huà)面或用其它方法確定一個(gè)典型的細(xì)觀單元,比如通過(guò)力學(xué)模型對(duì)所有組成整體的各單元的性質(zhì)作統(tǒng)計(jì)分析后得到,或通過(guò)力學(xué)試驗(yàn)直接測(cè)量得到。如果一個(gè)細(xì)觀單元總的幾何特性,如增強(qiáng)體的體分比、增強(qiáng)體分布的概率統(tǒng)計(jì)值(一次矩陣、二次矩陣)都為常數(shù),且與細(xì)觀單元的位置無(wú)關(guān),則稱為一個(gè)代表體元。通過(guò)代表體元的均勻邊界條件所形成的統(tǒng)計(jì)均勻場(chǎng)的分析,得到代表體元的平均應(yīng)力和應(yīng)變特性。由于代表體元的普遍性,故可推求得瀝青混合料的宏觀應(yīng)變和應(yīng)力,從而推求出瀝青混合料的宏觀性能。
1.1瀝青混合料細(xì)觀力學(xué)研究的主要內(nèi)容
目前,瀝青混合料細(xì)觀力學(xué)研究的主要內(nèi)容包括:
1)瀝青混合料體積特征的研究
瀝青混合料體積特征的研究首先是對(duì)粗集料的形態(tài)特征分析,比如粗集料的周長(zhǎng)、直徑、針狀質(zhì)量分?jǐn)?shù)和長(zhǎng)軸取向等;然后是瀝青混合料的組成特性研究,如瀝青混合料的空隙率、級(jí)配組成狀況和離析狀況等。對(duì)瀝青混合料組成特性的研究,可以更為方便、直觀地了解瀝青混合料內(nèi)部結(jié)構(gòu)的空間分布、初始損傷,同時(shí)也使原先的定性觀察研究轉(zhuǎn)為定量計(jì)算研究,其研究成果能更好的指導(dǎo)工程實(shí)踐。但是,瀝青混合料體積特征的研究亦存在以下局限性:
目前的混合料內(nèi)部細(xì)觀研究多是二維識(shí)別與分析。因?yàn)椴荒芡耆紤]集料、膠漿及空隙的三維體積特征,所以在考慮某個(gè)單元體時(shí),具有一定的隨機(jī)性與變異性;由于檢測(cè)設(shè)備、數(shù)據(jù)處理系統(tǒng)的軟硬件的限制,瀝青混合料細(xì)觀結(jié)構(gòu)研究仍處于理論研究階段;研究瀝青混合料的級(jí)配特征時(shí),集料的二維面積級(jí)配與三維體積級(jí)配間存在差異。
2)瀝青混合料試件動(dòng)態(tài)加載時(shí)的內(nèi)部結(jié)構(gòu)研究
在靜態(tài)研究瀝青混合料內(nèi)部結(jié)構(gòu)形態(tài)、尺寸和分布等體積特征的基礎(chǔ)上,對(duì)瀝青混合料試件在動(dòng)態(tài)加載時(shí)內(nèi)部結(jié)構(gòu)的變化做定量研究。臺(tái)灣國(guó)立成功大學(xué)黃隆升[1]運(yùn)用數(shù)字圖像技術(shù)對(duì)不同類型瀝青混合料的粗集料在高溫碾壓狀態(tài)下的行為軌跡進(jìn)行了定量分析,分析不同級(jí)配類型對(duì)高溫抗車(chē)轍能力的影響效應(yīng)。華南理工大學(xué)李曉軍[2]利用CT技術(shù)對(duì)SGC成型的瀝青混合料試件在動(dòng)態(tài)加載狀態(tài)下的內(nèi)部損傷行為進(jìn)行了實(shí)時(shí)測(cè)量,結(jié)果令人滿意。 Hartman A M[3]等運(yùn)用數(shù)字圖像技術(shù),分析瀝青混合料小梁四分點(diǎn)試驗(yàn)的疲勞性能,通過(guò)圖像采集系統(tǒng),研究實(shí)時(shí)加載過(guò)程中小梁的變形及破壞特征,并采用了數(shù)字圖像與內(nèi)置位移傳感器相結(jié)合的對(duì)比分析方法,二者結(jié)果吻合度較高。
1.2瀝青混合料細(xì)觀力學(xué)研究的實(shí)現(xiàn)手段
目前,研究人員主要采用以下兩種方法來(lái)獲取瀝青混合料的細(xì)觀結(jié)構(gòu)信息[4].
1)X-ray CT無(wú)損傷掃描
利用CT技術(shù)對(duì)瀝青混合料試件內(nèi)部細(xì)觀結(jié)構(gòu)進(jìn)行掃描研究的特點(diǎn)主要是:成像精度較高,在研究瀝青混合料時(shí)間內(nèi)部細(xì)觀結(jié)構(gòu)時(shí),宜采用工業(yè)CT。比如俄羅斯生產(chǎn)的BT500型工業(yè)CT機(jī),其最大工作電壓為450kV,檢測(cè)的幾何靈敏度可達(dá)到0.05mm,成像的圖片為100×像素;在檢測(cè)中,不會(huì)破壞樣品的整體性,同時(shí)可多次對(duì)試件的不同層面(包括橫向與縱向)重復(fù)掃描。
2)CCD數(shù)碼相機(jī)拍照
采用數(shù)碼相機(jī)拍照技術(shù)對(duì)瀝青混合料結(jié)構(gòu)進(jìn)行識(shí)別與分析時(shí),主要是利用各種材料具有不同的色彩來(lái)區(qū)分。從瀝青混合料色彩來(lái)看,集料呈現(xiàn)為灰色或者白色,瀝青膠漿接近黑色,而空隙通常為深黑色。
在數(shù)碼拍照前,需要將瀝青混合料時(shí)間按指定位置切開(kāi),獲取其內(nèi)部細(xì)觀結(jié)構(gòu)信息。通常情況下,集料顆粒的邊緣在切割時(shí)容易發(fā)生松散破碎,出現(xiàn)許多松散連接的顆粒群,邊緣模糊。宜將瀝青混合料試件在零下五攝氏度冷液中冷凍約兩小時(shí),然后再進(jìn)行切割,集料邊緣松散狀況可得到顯著改善。
瀝青混合料細(xì)觀結(jié)構(gòu)的重構(gòu)是進(jìn)行細(xì)觀力學(xué)分析的基礎(chǔ)。隨著數(shù)字化技術(shù)的發(fā)展,又出現(xiàn)了一系列新的細(xì)觀結(jié)構(gòu)信息收集方式,比如X斷層掃描、數(shù)字掃描、磁共振(或核磁共振)、視頻圖像以及數(shù)字圖像處理技術(shù)[5]等。
2瀝青混合料細(xì)觀力學(xué)的數(shù)值模擬方法
隨著檢測(cè)技術(shù)的不斷發(fā)展,越來(lái)越多的學(xué)者致力于研究瀝青混合料內(nèi)部細(xì)觀結(jié)構(gòu)與外部宏觀力學(xué)性能之間的關(guān)系。目前,道路瀝青混合料內(nèi)部結(jié)構(gòu)細(xì)觀力學(xué)模擬[6]的主要方法包括以下三種:
1)離散元法
離散元法是近30多年來(lái)發(fā)展起來(lái)的用于解決非連續(xù)介質(zhì)力學(xué)的數(shù)值方法,其基本特征在于允許單元體發(fā)生有限的位移和旋轉(zhuǎn),在計(jì)算過(guò)程中能夠自動(dòng)識(shí)別各個(gè)離散塊體的平動(dòng)、轉(zhuǎn)動(dòng),甚至分離和接觸的重新生成,彌補(bǔ)了有限元法或邊界元法的介質(zhì)連續(xù)和小變形的限制,而且離散元法無(wú)須滿足位移連續(xù)和變形協(xié)調(diào)的條件,認(rèn)為大變形行為是各單元作為獨(dú)立個(gè)體運(yùn)動(dòng)和變形的宏觀顯現(xiàn),因此離散單元法尤其適用于大變形和旋轉(zhuǎn)等非連續(xù)介質(zhì)模型的宏觀和細(xì)觀力學(xué)問(wèn)題的分析,已經(jīng)較為成功地運(yùn)用于解決巖石解理、邊坡滑落和采礦等方面的研究。離散元法在瀝青混合料內(nèi)部結(jié)構(gòu)性能的模擬中也得到了應(yīng)用。
2)有限元法
有限元法是應(yīng)用最早也是應(yīng)用最廣泛的數(shù)值計(jì)算方法,在瀝青混合料細(xì)觀結(jié)構(gòu)的分析中,Sepehr較早的采用有限元法模擬瀝青混合料的微觀結(jié)構(gòu);Sadi Kose 結(jié)合數(shù)字圖像技術(shù)和有限元法計(jì)算了混合料中瀝青膠質(zhì)應(yīng)變的分布:Papagiannakis利用相應(yīng)的圖形軟件分析瀝青混合料的數(shù)碼圖像特征后,采用有限元法對(duì)混合料直剪試驗(yàn)的應(yīng)變特性進(jìn)行數(shù)值模擬;Masad E等也均采用有限元法對(duì)瀝青混合料內(nèi)部結(jié)構(gòu)與外部宏觀力學(xué)性能間的關(guān)系進(jìn)行了數(shù)值模擬。目前應(yīng)用有限元建模方法對(duì)瀝青混合料的微細(xì)觀結(jié)構(gòu)進(jìn)行力學(xué)分析,可以精確地建立集料與瀝青膠漿的幾何微細(xì)觀結(jié)構(gòu)模型。
3)邊界元法
邊界元法是近50年來(lái)發(fā)展起來(lái)的一種數(shù)值方法。Soranakom C [7]等采用邊界元法對(duì)瀝青混合料細(xì)觀結(jié)構(gòu)強(qiáng)度及其變形特征進(jìn)行二維數(shù)值模擬,結(jié)果表明:邊界元法能夠較好的描述瀝青混合料內(nèi)部裂紋的產(chǎn)生、發(fā)展及其在混合料內(nèi)部的分布情況。
3瀝青混合料的細(xì)觀損傷
瀝青混合料材料的細(xì)觀損傷是指在外荷載或環(huán)境變化的條件下,由于體內(nèi)細(xì)觀尺度的微缺陷如微裂紋、微孔洞等在荷載、溫度或環(huán)境效應(yīng)等因素持續(xù)作用下,產(chǎn)生彌散裂縫并進(jìn)一步增長(zhǎng)、擴(kuò)展、匯合,形成一定尺度的宏觀裂紋,導(dǎo)致結(jié)構(gòu)的強(qiáng)度、剛度下降,以致最終發(fā)生破壞。由試驗(yàn)分析得知,細(xì)觀上瀝青混合料的本構(gòu)關(guān)系表現(xiàn)為彈脆性,微裂縫起裂和擴(kuò)展表現(xiàn)為張拉形,宏觀上的剪切帶是已經(jīng)擴(kuò)展的細(xì)觀微裂縫網(wǎng)絡(luò)變形、錯(cuò)動(dòng)的結(jié)果。因此,可以采用彈性損傷本構(gòu)關(guān)系來(lái)表達(dá)細(xì)觀單元的力學(xué)性質(zhì)。基于細(xì)觀損傷的本構(gòu)模型常用的有:美國(guó)西北大學(xué)Bazant教授于1985年提出的微平面模型(micro plane model)、二維格構(gòu)模型、隨機(jī)粒子模型和基于彈性損傷本構(gòu)關(guān)系的細(xì)觀結(jié)構(gòu)模型等。
4結(jié)語(yǔ)
瀝青混合料是具有復(fù)雜結(jié)構(gòu)的非均質(zhì)的多層次(微觀、細(xì)觀、宏觀)復(fù)合材料體系,其宏觀行為在很大程度上受其復(fù)雜的內(nèi)部細(xì)觀結(jié)構(gòu)影響。因此,為了真正、全面地分析研究瀝青混合料的力學(xué)性能,應(yīng)該從細(xì)觀角度入手,進(jìn)行基于細(xì)觀的瀝青混合料力學(xué)性能的研究,并且將細(xì)觀和宏觀的方法結(jié)合起來(lái)。
參考文獻(xiàn):
[1]黃隆升.瀝青混凝土巨觀車(chē)轍及微觀軌跡之行為機(jī)制分析[D].臺(tái)南:成功大學(xué),2003.
[2]李曉軍,張肖寧.CT技術(shù)在瀝青膠結(jié)顆粒材料內(nèi)部結(jié)構(gòu)分析中的應(yīng)用[J].公路交通科技,2005,22(2):14-16.
[3]Hartman A M, Gilehrist M D. Evaluating four-point bend fatigue of asphalt mix using image analysis[J]. Journal of Materials in Civil Engineering, 2004, 16(1): 60-68.
[4]汪海年,郝培文.瀝青混合料微細(xì)觀結(jié)構(gòu)的研究進(jìn)展[J].長(zhǎng)安大學(xué)學(xué)報(bào)(自然科學(xué)版),2008,28(3):11-15.
[5]張蕾,王哲人.應(yīng)用數(shù)字圖像處理技術(shù)研究瀝青混合料微細(xì)觀結(jié)構(gòu)方法綜述究進(jìn)展[J].中外公路,2008,28(3):168-171.
關(guān)鍵詞:遙感圖像;紋理特征;灰度共生矩陣法
中圖分類號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2013)09-2216-03
1 圖像特征分析
圖像最基本屬性稱為圖像特征,它是圖像內(nèi)部最反映圖像本質(zhì)的信息,圖像特征可以根據(jù)圖像所具有的色度、亮度、邊緣值、紋理或結(jié)構(gòu)等劃分為多種類別,整個(gè)圖像在各個(gè)方面的屬性都得到了反映。這幾種特征主要分為統(tǒng)計(jì)特征(比如圖像的均值、方差、直方圖等)、幅值特征(比如圖像像素的灰度值、頻譜值等表示的幅值特征)、變換系數(shù)特征、邊界特征、拓?fù)涮卣饕约凹y理特征。
下面對(duì)其中幾種重要的特征做出詳細(xì)的描述:
1)變換系數(shù)特征:亮度圖像決定于變換域系數(shù),它和原空間域圖像是相同的,都同時(shí)具有唯一性的變化,所以其變換系數(shù)可以稱為一種圖像特征。
2)邊界特征:包括了亮度邊界點(diǎn)和噪聲點(diǎn)。圖像中的亮度邊界點(diǎn)是指利用灰度及三色值來(lái)表示的在一幅沒(méi)有噪聲的圖像中亮度突變或斷續(xù)的點(diǎn)。噪聲點(diǎn)和周?chē)南袼乇容^起來(lái)也是具有灰度突變的性質(zhì),不過(guò)它是單獨(dú)的隨機(jī)點(diǎn)。
3)紋理特征:紋理特征在所有圖像特征的種類中是一種相當(dāng)重要的特征,它反映了圖像或物體本身的屬性。例如對(duì)遙感圖像的分析和解譯,最根本的依據(jù)就是波譜信息和空間信息兩個(gè)方面的數(shù)據(jù),即灰度和紋理信息。以前對(duì)圖像的波譜信息的使用是最頻繁的,隨著衛(wèi)星遙感圖像信息處理的技術(shù)不斷的提高和發(fā)展,單利用波譜信息早已適應(yīng)不了遙感應(yīng)用技術(shù)的發(fā)展需要。譬如,在地質(zhì)學(xué)的角度來(lái)看,巖石受含水性或其他因素的影響,它的波譜信息顯示的非常雜亂而且沒(méi)有可循的規(guī)律性,但是紋理反映的信息是與巖石的類型有緊密的關(guān)系,它詳細(xì)地描述了巖石表面的粗糙度和巖石的影文結(jié)構(gòu),所以紋理信息有助于我們將兩種不同的物體區(qū)別開(kāi)來(lái),對(duì)巖石識(shí)別有必要的輔助作用。
2 紋理特征分析
目前對(duì)紋理準(zhǔn)確的概念在業(yè)界還沒(méi)有統(tǒng)一的標(biāo)準(zhǔn)性定義。我們把圖像的像素灰度級(jí)或顏色相關(guān)的變化指定為圖像紋理的一般描述。序列是按照某種特定的規(guī)律排列的基本部分所構(gòu)成的;在某種序列范圍之外,其局部的序列信息是不斷的重復(fù)出現(xiàn)的;各基本部分在紋理范圍內(nèi)的所有地方都是具有幾乎相同的結(jié)構(gòu)大小,并且基本都是均勻的統(tǒng)一體。我們將這個(gè)系列的基本部分一般命名為紋理基元,紋理基元是一種或多種有特定形狀大小的圖像基元的組合,所以紋理也可以認(rèn)為是由紋理基元按照一種特定的統(tǒng)計(jì)規(guī)律排列,或是按照某種確定的規(guī)律組合而成的,我們把前者稱為隨機(jī)性紋理,將后者稱為確定性紋理。
紋理在圖像中有很多特性,通常表現(xiàn)為疏密性、均一性、周期性、平滑性、粗糙性和復(fù)雜程度,特別的還有紋理基元或灰度空間組合的某些特征,如頻率、強(qiáng)弱的程度以及方向性會(huì)在一個(gè)區(qū)域內(nèi)重復(fù)地出現(xiàn),這些特性的改變能深刻的影響圖像的質(zhì)量,使圖像的外觀產(chǎn)生非常大的改變。粗糙程度和局部的灰度變化與空間中的重復(fù)周期是相關(guān)的,長(zhǎng)周期和低頻率的是粗紋理,短周期的是細(xì)紋理。對(duì)紋理進(jìn)行描述的參量有很多方面,包括紋理的密度、強(qiáng)度、方向和紋理的粗糙程度等。此外,紋理是二維的,只有一個(gè)點(diǎn)是無(wú)法描述紋理特征的,所以對(duì)紋理進(jìn)行計(jì)算需要選擇窗口。
分析紋理的方法一般概括為兩類:一種是統(tǒng)計(jì)紋理分析法;另一種是結(jié)構(gòu)紋理分析法。基于事物的構(gòu)成不同,并且空間分布也具有很強(qiáng)的多樣性和復(fù)雜性等原因,遙感圖像的紋理并不擁有規(guī)則不變的局部模式和簡(jiǎn)單的周期重復(fù),它的紋理信息和周期重復(fù)只是建立在統(tǒng)計(jì)學(xué)理論基礎(chǔ)之上的,這樣遙感圖像紋理分析主要采用的是統(tǒng)計(jì)紋理分析方法,而結(jié)構(gòu)分析方法在遙感圖像中的應(yīng)用所得到的結(jié)果沒(méi)有用統(tǒng)計(jì)紋理分析方法的效果好。
3 空間灰度共生矩陣法
對(duì)于紋理圖像的特征分析和提取方法是多種多樣的,其中一種常用而且非常有效的統(tǒng)計(jì)特征提取方法就是空間灰度共生矩陣法。空間灰度共生矩陣主要表示的是在圖像中某兩個(gè)像素在相同方向且不同位置上出現(xiàn)的概率的大小,這種方法的使用是在圖像灰度的二階統(tǒng)計(jì)特性的基礎(chǔ)之上的。
1)灰度共生矩陣的定義
在圖像中任取兩個(gè)像素點(diǎn)[x1,y1]和[x2,y2],設(shè)他們之間的距離為[d],并分別設(shè)[i]和[j]為兩點(diǎn)對(duì)應(yīng)的灰度值。由下圖可知,根據(jù)給定的距離[d],與像素點(diǎn)[x1,y1]對(duì)應(yīng)的有不在圖像邊界上的8個(gè)相鄰的點(diǎn)[x2,y2],于是我們?nèi)魧?duì)圖像進(jìn)行統(tǒng)計(jì)就可以選擇[θ=0?]、[θ=45?]、[θ=90?]和[θ=135?]這四個(gè)不同方向的角度,如圖1所示。
在這四個(gè)角度上我們可以得到四個(gè)灰度共生矩陣:[P0?]、[P45?]、[P90?]和[P135?],它們的含義可理解為與灰度是[i]的點(diǎn)[x1,y1]相距達(dá)到[d]的長(zhǎng)度且灰度達(dá)到[j]的點(diǎn)[x2,y2]能夠出現(xiàn)的概率,即:
由此我們可知灰度共生矩陣法實(shí)際上就是關(guān)于對(duì)稱矩陣中相鄰基元之間的距離和角度的函數(shù),即[Pi,j=Pj,i]。我們通過(guò)一個(gè)簡(jiǎn)單的例子來(lái)體會(huì)下灰度共生矩陣的作用:有一幅數(shù)字圖像是[4×4]個(gè)四灰度級(jí)的,假設(shè)當(dāng)[d=1]時(shí)通過(guò)計(jì)算得到的空間灰度共生矩陣,其中公式(1)表示的是灰度級(jí)為[0-3]的[4×4]圖像,公式(2)-(5)分別表示的是當(dāng)[d=1]時(shí)四個(gè)角度的共生矩陣。
我們?cè)诜治鰣D像時(shí),灰度共生矩陣只要確定下來(lái),圖像的方向模式就可以通過(guò)分析提取的圖像特征[P0?]、[P45?]、[P90?]和[P135?]的大小來(lái)得到,特別強(qiáng)調(diào)的是[d]和[θ]是決定這些特征的關(guān)鍵。比如說(shuō),若使空間灰度共生矩陣趨于均勻分布,紋理要細(xì)并且是不規(guī)則的,[d]的取值要比紋理基元大,此時(shí)像素對(duì)的灰度值通常才會(huì)有大的差別;如果空間灰度共生矩陣趨于對(duì)角分布,紋理需要是粗糙且規(guī)則的,當(dāng)[d]的取值比較小時(shí),像素對(duì)灰度值才會(huì)相似。我們可以得出,分析紋理的粗糙度需要通過(guò)計(jì)算矩陣中根據(jù)不同的[d]值決定的元素,并且要計(jì)算元素關(guān)于主對(duì)角線的離散程度才能達(dá)到分析紋理的目的。
4 結(jié)束語(yǔ)
在紋理有方向的情況下,通過(guò)比較矩陣值隨[θ]變化的分散程度就能夠分析紋理的方向性,這樣也可以達(dá)到紋理分析的目的,因?yàn)榭臻g灰度共生矩陣對(duì)角線上的值是隨[θ]變化而變化的。由此可得,直觀地反映紋理圖像的某些特性是灰度共生矩陣的一大特色,而且它擁有恰好滿足人類視覺(jué)特性需求的統(tǒng)計(jì)方法,所以提取特征分析紋理的方法中比較簡(jiǎn)單實(shí)用的就是空間灰度共生矩陣法。
參考文獻(xiàn):
[1] 何東健,耿楠,張義寬.數(shù)字圖像處理[M].西安:西安電子科技大學(xué)出版社,2003(7):213-218.
[2] 劉麗,匡綱要.圖像紋理特征提取方法綜述[J].中國(guó)圖像圖形學(xué)報(bào),2009(4).
[3] 阮秋琦.數(shù)字圖像處理學(xué)[M].北京:電子工業(yè)出版社,2010.
關(guān)鍵詞:壓縮感知;低速采樣;圖像壓縮
中圖分類號(hào):TN919 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2010)04-0958-02
A Primary Research on Compressed Sensing Based Image Compression
ZHANG Rui
(Southwest Jiaotong University, Chengdu 610031, China)
Abstract: The Nyquist law is applied to all the conventional compression coding algorithms, which prescribes that the sampling rate must be at least as twice as the signal frequency. As this algorithm leads to enormous calculation and resource waste, compressed sensing could be applied to image compression to reduce the account the sampling rate, several experiments are presented.
Key words: compressed sensing; low-speed sampling; image compression
如今,人們對(duì)信息的需求與日俱增。在人從外界獲得的信息中,大部分是視覺(jué)信息。而圖像以其生動(dòng)直觀的特點(diǎn)以及包含的豐富信息,成為人們獲得信息的主要工具。然而巨大的數(shù)據(jù)量給圖像的傳輸和存儲(chǔ)帶來(lái)了極大的不便,圖像壓縮技術(shù)顯得尤為重要[1-3]。然而,在傳統(tǒng)的壓縮技術(shù)中采樣遵循奈奎斯特定律,依據(jù)該定律,為了不破壞或丟失信號(hào)信息,采樣速率要高于原信號(hào)頻率的兩倍。傳統(tǒng)的壓縮模式是,先對(duì)信號(hào)進(jìn)行高速采樣,得到大量采樣值,進(jìn)行變換得到大量的系數(shù),在編碼時(shí)又刪減了大部分的系數(shù)只提取少量的包含重要信息的作為有效值,對(duì)有效值及其定位信息進(jìn)行編碼,這個(gè)過(guò)程浪費(fèi)了大量的采樣資源,加大了計(jì)算復(fù)雜度,也造成了不必要的內(nèi)存浪費(fèi)。近年來(lái),Donoho等人提出了一種新穎的理論――壓縮感知理論[4-8],在該理論中,采樣速率不再?zèng)Q定于信號(hào)的帶寬,而決定于信息在信號(hào)中的結(jié)構(gòu)和內(nèi)容。基于壓縮感知理論,信號(hào)可進(jìn)行低速采樣,然后進(jìn)行編碼,這大大降低了計(jì)算復(fù)雜度。本文著重對(duì)基于壓縮感知理論的圖像壓縮編碼進(jìn)行探討,并進(jìn)行了實(shí)驗(yàn)仿真。
1 壓縮感知理論介紹
假定長(zhǎng)度為n的信號(hào)X,在空間基Ψ上的具有表達(dá)式X=Ψ,其中系數(shù)向量中只有K個(gè)非零值,則稱X為K-稀疏信號(hào)。壓縮感知理論指出,將稀疏信號(hào)投影到一個(gè)隨機(jī)矩陣上得到少量的投影值,該投影矩陣與稀疏基Ψ不相關(guān),根據(jù)這些投影值即可高概率恢復(fù)信號(hào),以此實(shí)現(xiàn)了對(duì)信號(hào)的低速采樣。即若存在一個(gè)與Ψ不相關(guān)的M*N的變換基Φ,M
理論證明,基于壓縮感知重建信號(hào)時(shí),要提高重建圖像的質(zhì)量,包括兩方面的主要工作:1)構(gòu)造測(cè)量矩陣Φ,保證圖像投影時(shí)能盡可能多地把結(jié)構(gòu)信息等投影在測(cè)量矩陣上,信息越完整重建圖像的質(zhì)量越好;2)選定圖像具有稀疏表達(dá)的稀疏基Ψ[4-8],Φ與Ψ越不相關(guān),圖像重建質(zhì)量越好。
圖1為仿真實(shí)驗(yàn)結(jié)果,實(shí)驗(yàn)中采用256*256的Lena圖像,采用CS理論進(jìn)行抽樣后重建的圖像,選取了25000個(gè)測(cè)量值。
2 壓縮感知理論應(yīng)用于圖像壓縮
2.1 圖像壓縮概況
1948年電視信號(hào)數(shù)字化的概念提出以后,對(duì)圖像壓縮編碼技術(shù)的研究工作就開(kāi)始了,至今已經(jīng)有60多年的歷史。圖像壓縮編碼技術(shù)經(jīng)歷了兩代,第一代如基于DCT變換的技術(shù),在壓縮比較大時(shí)會(huì)出現(xiàn)方塊效應(yīng),第二代以基于小波變換的壓縮算法最具代表性,小波變換本身并不具備壓縮性能,小波變換后獲得的數(shù)據(jù)量與原圖的數(shù)據(jù)量是相等的,經(jīng)過(guò)適當(dāng)?shù)牧炕途幋a后才能實(shí)現(xiàn)壓縮。但是這些方法都是先對(duì)圖像進(jìn)行高速采樣,在壓縮編碼時(shí)再去除冗余的方法,計(jì)算量巨大。
2.2 基于壓縮感知理論的圖像壓縮
壓縮感知理論一經(jīng)提出,就受到了廣泛的關(guān)注,該理論不斷被應(yīng)用到數(shù)字圖像處理中。
如前所述,在傳統(tǒng)的圖像壓縮算法中,都是先對(duì)圖像進(jìn)行高速采樣,即進(jìn)行變換后得到大量變換系數(shù),但是為了實(shí)現(xiàn)圖像壓縮又選取其中一小部分系數(shù),稱作有效值,扔掉大部分的系數(shù),對(duì)有效值及其位置信息等進(jìn)行壓縮編碼后再進(jìn)行傳輸或存儲(chǔ)。而采用壓縮感知理論進(jìn)行抽樣時(shí),可以直接對(duì)圖像進(jìn)行隨機(jī)抽樣,只得到少量的抽樣值,對(duì)抽樣值進(jìn)行量化編碼即可進(jìn)行傳輸或存儲(chǔ),不必記錄每個(gè)有效值的位置信息并對(duì)其進(jìn)行編碼,這大大降低了計(jì)算復(fù)雜度,也避免了不必要的空間浪費(fèi),最重要的是實(shí)現(xiàn)了低速采樣。流程圖如圖2。仿真實(shí)驗(yàn)中采用了Huffman編碼算法,分別選取了10K、25K、20K、25K個(gè)測(cè)量值,實(shí)驗(yàn)結(jié)果如表1,解碼重建圖像如圖3。由實(shí)驗(yàn)數(shù)據(jù)可知將壓縮感知理論應(yīng)用于圖像壓縮是一項(xiàng)可行的技術(shù),通過(guò)改進(jìn)算法即可獲得優(yōu)良的壓縮性能。
3 結(jié)束語(yǔ)
由初步的仿真實(shí)驗(yàn)結(jié)果可知,如果能構(gòu)造適合的投影矩陣,在少量投影值中包含足夠的原信號(hào)信息,即可高概率重建信號(hào)。構(gòu)造更適合的投影矩陣,將是接下來(lái)的主要研究?jī)?nèi)容。
參考文獻(xiàn):
[1] 覃鳳清.數(shù)字圖像壓縮綜述[J].宜賓學(xué)院學(xué)報(bào),2006(6).
[2] 喻玲春,謝小春.壓縮感知理論簡(jiǎn)介[J].數(shù)字視頻,2008,32(12).
[3] 石光明,劉丹華,高大化,等.壓縮感知理論及其研究進(jìn)展[J].電子學(xué)報(bào),2009(5).
[4] David pressed sensing[J].IEEE Trans on Information Theory.2006,52(4):1289-1306.
[5] Emmanuel Candèpressive sampling[A].International Congress of Mathematics[C].Madrid,Spain,2006(3):1433-1452.
[6] Emmanuel Candès,Justin Romberg,Terence Tao.Robust uncertainty principles:Exact signal reconstruction from highly incomplete frequency information[J]. IEEE Trans on Information Theory,2006,52(2):489-509.
[7] Emmanuel Candès,Justin Romberg.Quantitative robust uncertainty principles and optimally sparse decompositions[J].Foundations of Comput.Math..2006,6(2):227-254.
[8] Emmanuel Candès,Justin Romberg.Practical signal recovery from random projection[EB/OL].acm.caltech.edu/emmanuel/papers/PracticalRecovery.pdf.
[9] Justin Romberg.Imaging via compressive sampling[J].IEEE SIGNAL PROCESSING MAGZINE,2008(3).
級(jí)別:部級(jí)期刊
榮譽(yù):中國(guó)學(xué)術(shù)期刊(光盤(pán)版)全文收錄期刊
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:部級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:部級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)