前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計(jì)算機(jī)視覺研究的目的主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:雙目視覺;匹配算法;計(jì)算機(jī)視覺;立體匹配;相位一致性
1.計(jì)算機(jī)視覺系統(tǒng)分析研究
1.1計(jì)算機(jī)視覺技術(shù)及雙目立體視覺
計(jì)算機(jī)視覺是通過計(jì)算機(jī)技術(shù)實(shí)現(xiàn)對(duì)視覺信息處理的整個(gè)過程,是一門新的學(xué)科。視覺是人們認(rèn)知事物的重要途徑,視覺是人們對(duì)視覺信息獲取、處理和存儲(chǔ)的過程。隨著計(jì)算機(jī)技術(shù)的發(fā)展,信號(hào)處理技術(shù)的應(yīng)用,人們通過照相機(jī)來把實(shí)際的事物拍攝下來轉(zhuǎn)變?yōu)閿?shù)字信息,并通過計(jì)算機(jī)信號(hào)處理技術(shù)隊(duì)獲取的視覺信號(hào)進(jìn)行處理。計(jì)算機(jī)視覺技術(shù)對(duì)圖像的處理分為獲取圖像、特征抽象選取、事物識(shí)別及分類和對(duì)三維信息的理解。獲取圖像主要是通過攝像機(jī)和紅外線等技術(shù)對(duì)周圍視覺事物進(jìn)行獲取,并通過計(jì)算得到和真實(shí)事物相應(yīng)的二維圖像,二維圖像主要是數(shù)字圖像。計(jì)算機(jī)視覺系統(tǒng)的最基本的功能是數(shù)字圖像的獲取。可以看出計(jì)算機(jī)視覺研究最基本內(nèi)容是三維場(chǎng)景距離信息的獲取。在計(jì)算機(jī)被動(dòng)測(cè)量距離方法中,有一種重要的距離感知技術(shù)叫作雙目立體視覺。雙目立體視覺技術(shù)是其他計(jì)算機(jī)視覺技術(shù)無法取代的一種技術(shù),對(duì)雙目立體視覺技術(shù)的研究在計(jì)算機(jī)視覺技術(shù)和工程應(yīng)用方面都是非常重要的。
1.2計(jì)算機(jī)視覺理論框架
第一個(gè)視覺系統(tǒng)理論框架的提出是以信息處理為基礎(chǔ),綜合了圖像處理和神經(jīng)生理學(xué)等研究?jī)?nèi)容而建立的。這個(gè)視覺系統(tǒng)理論框架是計(jì)算機(jī)視覺系統(tǒng)的基本框架,與計(jì)算機(jī)視覺技術(shù)有著密切的關(guān)系。視覺系統(tǒng)的研究是以信息處理為基礎(chǔ)的,從理論層次、算法層次和硬件層次3個(gè)層次進(jìn)行研究。計(jì)算機(jī)理論層次主要是表達(dá)系統(tǒng)各個(gè)部分計(jì)算的目的和方法,對(duì)視覺系統(tǒng)的輸入和輸出進(jìn)行規(guī)定,輸入作為二維圖像,輸出是以二維圖像為基礎(chǔ)建立起來的三維物體,視覺系統(tǒng)的目的就是對(duì)三維物體進(jìn)行分析和識(shí)別,通過計(jì)算對(duì)二維物置和形狀進(jìn)行重新建立。算法層次對(duì)計(jì)算機(jī)規(guī)定的目標(biāo)進(jìn)行計(jì)算,算法和計(jì)算機(jī)表達(dá)有關(guān),不同的表達(dá)可以通過不同的算法進(jìn)行實(shí)現(xiàn),在計(jì)算機(jī)理論的層次上,算法和表達(dá)比計(jì)算機(jī)理論的層次要低。硬件層次是通過硬件來實(shí)現(xiàn)算法的一種表達(dá)方法。計(jì)算機(jī)理論層次在計(jì)算機(jī)信息處理中時(shí)最高的層次,取決于計(jì)算機(jī)的本質(zhì)是解決計(jì)算機(jī)的自身問題,不是取決于計(jì)算問題的計(jì)算機(jī)硬件。要更好地對(duì)計(jì)算機(jī)系統(tǒng)和框架進(jìn)行理解最好的方法就是要區(qū)分3個(gè)不同的層次,計(jì)算機(jī)理論的含義和主要解決的問題是計(jì)算機(jī)的目的,表達(dá)算法含義和主要解決的問題是實(shí)現(xiàn)計(jì)算理論的方法和輸入輸出的表達(dá),硬件的實(shí)現(xiàn)的含義和主要解決的問題是如何在物理上對(duì)表達(dá)和算法進(jìn)行實(shí)現(xiàn)。計(jì)算機(jī)視覺處理的可以分為3個(gè)階段,對(duì)視覺信息的處理過程從最初的二維圖像的原始數(shù)據(jù),到三維環(huán)境的表達(dá)。第一階段基元圖的構(gòu)成,基元圖是用來表示二維圖像中的重要信息,主要是圖像中亮度變化位置及其幾何分布和組織結(jié)構(gòu),圖像中每點(diǎn)的亮度值包括零交叉、斑點(diǎn)、端點(diǎn)和不連續(xù)點(diǎn)、邊緣等。第二階段2.5維圖描述,在以觀測(cè)者為中心的坐標(biāo)中,表示可見表面的方向、深度值和不連續(xù)的輪廓,基元是局部表面朝向離觀測(cè)者的距離深度上的不連續(xù)點(diǎn)表面朝向的不連續(xù)點(diǎn)。第三階段三維模型表示,在以物體為中心的坐標(biāo)系中,有由體積單元和面積單元構(gòu)成的模塊化多層次表示,描述形狀及其空間組織形式,分層次組成若干三維模型,每個(gè)三維模型都是在幾個(gè)軸線空間的基礎(chǔ)上構(gòu)成的,所有體積單元或面積形狀基元都附著在軸線上。視覺理論框架圖如圖1所示。
2.基于計(jì)算機(jī)的視覺立體匹配算法研究
視覺立體匹配算法是基于人類視覺系統(tǒng)的一種計(jì)算機(jī)算法。立體匹配算法作為計(jì)算機(jī)立體視覺問題研究的重點(diǎn),快速地實(shí)現(xiàn)圖像對(duì)應(yīng)點(diǎn)的匹配來獲得視差圖是當(dāng)今研究的熱點(diǎn)問題。立體視覺匹配算法根據(jù)基元匹配的不同可以分為相位匹配、區(qū)域匹配和特征匹配3種,其中區(qū)域匹配算法可以減少計(jì)算負(fù)擔(dān),區(qū)域匹配算法實(shí)時(shí)性高,應(yīng)用前景廣闊。計(jì)算機(jī)立體視覺通過對(duì)人的雙眼進(jìn)行模仿,在雙眼的立體感知中獲得信息,從攝像機(jī)拍攝的圖像中獲取物體的三維深度信息,這就是深度圖的獲取,把深度圖經(jīng)過處理得到三維空間信息數(shù)據(jù),二維圖像到三維空間實(shí)現(xiàn)轉(zhuǎn)換。深度的獲取在雙目立體成像視覺系統(tǒng)中分為兩步,首先在雙目立體圖像與圖像之間建立點(diǎn)對(duì)點(diǎn)的對(duì)象關(guān)系,雙目立體視覺算法研究的重點(diǎn)問題是解決對(duì)應(yīng)點(diǎn)之間的匹配問題。其次以對(duì)應(yīng)點(diǎn)之間的視差為依據(jù)對(duì)深度值進(jìn)行計(jì)算。雙目成像是獲取同一場(chǎng)景中兩幅不同的圖像,兩個(gè)單目成像模型構(gòu)成一個(gè)雙目成像模型。雙目成像示意圖如圖2所示。系統(tǒng)的基線B是兩個(gè)鏡頭中心的連接線,空間點(diǎn)w(z,y,z)作為世界坐標(biāo)的值由(x1,y1)與(x2,y2)進(jìn)行確定,如果攝像機(jī)的坐標(biāo)位置和空間點(diǎn)w世界坐標(biāo)的位置重合,圖像平面和世界坐標(biāo)軸xY的平面就是平行的。如果兩個(gè)攝像機(jī)在坐標(biāo)系統(tǒng)中的原點(diǎn)不同但是它們的光軸平行,那么雙目成像計(jì)算人們可以看圖3所示,圖3表示的是兩個(gè)攝像頭連線在平臺(tái)xY的示意。
立體視覺的成像過程是成像的逆過程,具有一定的不確定性。大量的數(shù)據(jù)信息在從三維影像向二維圖像進(jìn)行投影的過程會(huì)出現(xiàn)丟失的現(xiàn)象,所以視覺系統(tǒng)要通過自然的約束條件才能保證獲取正確的解。這些約束條件在減少匹配的計(jì)算量方面可以提供有利的幫助。針對(duì)基于區(qū)域匹配快速算法,還可以應(yīng)用基于視差梯度的匹配算法,這種匹配算法應(yīng)用較大的搜索范圍在邊緣的特征點(diǎn)上進(jìn)行搜索,采用視差梯度在非邊緣區(qū)減少搜索范圍。應(yīng)用計(jì)算機(jī)視覺立體匹配算法可以減少成像匹配時(shí)間,大大提高了工作效率。計(jì)算機(jī)立體匹配算法征點(diǎn)的提取是算法的關(guān)鍵問題,今后的研究方向重點(diǎn)是對(duì)有效特征點(diǎn)提取方法的研究。
關(guān)鍵詞: 計(jì)算機(jī)視覺;快速開發(fā);框架;模塊化;模塊耦合;底層剝離
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2012)29-7084-04
在視覺分析實(shí)際應(yīng)用項(xiàng)目中,如何通過建立計(jì)算機(jī)視覺分析快速開發(fā)框架,搭建一個(gè)分工明確,快捷有效的圖像學(xué)應(yīng)用處理平臺(tái),提高開發(fā)效率,縮短開發(fā)時(shí)間,已成為項(xiàng)目開發(fā)人員關(guān)注的重點(diǎn)內(nèi)容之一。本框架從項(xiàng)目應(yīng)用和實(shí)際需求出發(fā),將計(jì)算機(jī)視覺技術(shù)的核心算法從底層研究工作中剝離,可極大的縮短開發(fā)時(shí)間,提高開發(fā)效率。
在本框架下,開發(fā)人員可各司其職,分工、構(gòu)成和職能劃分明確,框架開發(fā)人員只專注于框架接口的定義;算法開發(fā)人員只專注于圖像處理與識(shí)別等算法的開發(fā);上層應(yīng)用開發(fā)人員只負(fù)責(zé)抽取出一般的處理流程,專注于項(xiàng)目的具體實(shí)現(xiàn)和功能模塊的組合應(yīng)用。
1 研究與應(yīng)用
1.1背景
計(jì)算機(jī)視覺是用攝像機(jī)和電腦代替人眼對(duì)目標(biāo)進(jìn)行識(shí)別、跟蹤和測(cè)量的機(jī)器視覺。系統(tǒng)將獲取的視頻或圖像資料,通過計(jì)算機(jī)處理成為更適合人眼觀察或傳送給儀器檢測(cè)的圖像,其中包括圖像處理、模式識(shí)別或圖像識(shí)別、景物分析、圖像理解等相關(guān)內(nèi)容,它們之間既有差別,又有相互重疊。
在計(jì)算機(jī)視覺分析技術(shù)中,對(duì)于一些復(fù)雜的問題,往往不是某單一學(xué)科能夠解決的,它需要一系列相關(guān)技術(shù)的支持。例如:對(duì)航道中船舶的識(shí)別,獲取的視頻流往往要經(jīng)過平滑、去噪等圖像處理操作后,便于下一步運(yùn)用基于直方圖分類器的圖像識(shí)別算法來區(qū)分船舶和水面,通過圖像分割技術(shù)來提取檢測(cè)目標(biāo)。而這些方案的實(shí)現(xiàn)中,同一個(gè)問題的解決又往往需要有一系列的算法來支持。還是以船舶識(shí)別為例,圖像平滑有領(lǐng)域平均、低通濾波等算法;圖像去噪有各種濾波器算法;基于直方圖的分類器也存在決策樹、貝葉斯、SVM等等算法。雖然上述的算法本身沒有優(yōu)劣之分,但在特定的環(huán)境下一定會(huì)有某個(gè)最佳算法。
因此,在實(shí)際應(yīng)用項(xiàng)目中如何找出其最優(yōu)路徑,除了需要開發(fā)者擁有深厚的圖像學(xué)功底,更需要的是通過大量的對(duì)比實(shí)驗(yàn)來找出該最優(yōu)路徑的解決方案。即便如此,也只能解決特定環(huán)境下的計(jì)算機(jī)視覺需求,換個(gè)應(yīng)用場(chǎng)景,上述步驟又需要重新進(jìn)行,此類過程的重復(fù),既增加了開發(fā)成本,又延長(zhǎng)了開發(fā)時(shí)間。
本框架從工程化的角度出發(fā),在不同項(xiàng)目中的計(jì)算機(jī)視覺軟件開發(fā)中,研究如何提高開發(fā)結(jié)果的復(fù)用性,盡量降低上述各條件間的相互依賴關(guān)系,將視覺技術(shù)的核心算法從底層研究中剝離,達(dá)到縮短開發(fā)時(shí)間,提高開發(fā)效率的目的。
1.2研究目標(biāo)
1) 框架系統(tǒng)的扁平化、模塊化;
2) 完成處理過程的任意組合,使圖像處理模塊單一化;
3) 理行為在處理模塊內(nèi)部完成,處理結(jié)果可通過接口方式進(jìn)行輸出;
4) 處理模塊間的數(shù)據(jù)流動(dòng)定義在框架之中,框架負(fù)責(zé)配置數(shù)據(jù)流;
5) 置好的數(shù)據(jù)流,通過指定圖像處理模塊實(shí)現(xiàn)對(duì)物體的識(shí)別、行為的識(shí)別。
1.3.5框架的效果演示
從右側(cè)功能區(qū)中選取兩個(gè)輸入模塊:MediaOpen00和MediaOpen01,分別打開視頻文件“.\公司監(jiān)控視頻.avi”和圖片“.\Lena.jpg”,任意添加一些圖像處理模塊或者圖像識(shí)別模塊,這里我們選取了行人檢測(cè)算法、基本全局閾值二值算法、人臉檢測(cè)算法、輪廓檢測(cè)算法,加入輸出展示模塊用于顯示處理結(jié)果。最后我們用曲線將模塊間的輸入輸出點(diǎn)連起來,完成數(shù)據(jù)流向的配置過程。其中一個(gè)輸出點(diǎn)可以連接多個(gè)輸入點(diǎn),但一個(gè)輸入點(diǎn)只能接入一個(gè)輸出點(diǎn)。
2 結(jié)論
隨著計(jì)算機(jī)視覺技術(shù)發(fā)展的日新月異,算法的更新和積累將會(huì)越來越多。計(jì)算機(jī)視覺快速開發(fā)框架從實(shí)際應(yīng)用工程的角度出發(fā),在不同項(xiàng)目計(jì)算機(jī)視覺軟件的開發(fā)過程中,將視覺技術(shù)的核心算法從底層研究中剝離,使視覺分析應(yīng)用項(xiàng)目中的框架開發(fā)人員專注于框架接口定義的開發(fā),而項(xiàng)目中的算法、上層應(yīng)用等開發(fā)人員各司其職,分工明確,不但提高了開發(fā)結(jié)果的復(fù)用性,同時(shí),也降低了項(xiàng)目開發(fā)中各條件間的相互依賴關(guān)系,縮短了開發(fā)時(shí)間,提高了開發(fā)效率。
參考文獻(xiàn):
[1] Gary bradski,Adrian Kaebler.《Learning OpenCV》[M].O’Reilly Media Inc,2008.
[2] 張廣軍.機(jī)器視覺[M].北京:科學(xué)出版社,2005.
[3] 張少輝,沈曉蓉,范耀祖.一種基于圖像特征點(diǎn)提取及匹配的方法[J].北京航空航天大學(xué)學(xué)報(bào),2008,34(5).
[4] 劉立,彭復(fù)員,趙坤,萬亞平.采用簡(jiǎn)化SIFT算法實(shí)現(xiàn)快速圖像匹配[J].紅外與激光工程,2008,37(1).
[5] 戴斌,方宇強(qiáng),孫振平,王亮.基于光流技術(shù)的運(yùn)動(dòng)目標(biāo)檢測(cè)和跟蹤方法研究[D].國(guó)防科學(xué)技術(shù)大學(xué)機(jī)電工程與自動(dòng)化學(xué)院.
[6] 陳勝勇,劉盛.基于OpenCV的計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)[M].科學(xué)出版社.
關(guān)鍵詞:計(jì)算機(jī)視覺;案例推理;圖像處理;圖像描述
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1009-3044(2007)04-11102-03
1 引言
基于案例推理(case-base reasoning)是人工智能中正不斷發(fā)展的一項(xiàng)重要推理技術(shù)?;诎咐评砼c類比推理方法相似,案例推理將舊經(jīng)驗(yàn)或教訓(xùn)轉(zhuǎn)換為知識(shí),出現(xiàn)新問題時(shí),首先查找以前是否有相似的案例,并用相似案例解決新問題。如果沒遇到相似案例的,經(jīng)過推理后解決新問題的方法,又會(huì)成為新的案例或新經(jīng)驗(yàn),下一次再遇到相同問題時(shí),就可以復(fù)用這些案例或經(jīng)驗(yàn)。
這與人遇到問題時(shí),首先會(huì)用經(jīng)驗(yàn)思考解決問題的方式相似,這也是解決問題較好的方法?;诎咐评響?yīng)用于工業(yè)產(chǎn)品檢測(cè)或故障診斷時(shí)具有以下特點(diǎn):
CBR智能化程度較高。利用案例中隱含的難以規(guī)則化的知識(shí),以輔助規(guī)則推理的不足,提高故障診斷系統(tǒng)的智能化程度。
CBR較好解決“知識(shí)獲取”的瓶頸。CBR知識(shí)表示以案例為基礎(chǔ),案例的獲取比規(guī)則獲取要容易,大大簡(jiǎn)化知識(shí)獲取的過。
CBR求解效率較高。是對(duì)過去的求解結(jié)果進(jìn)行復(fù)用,而不是再次從頭開始推導(dǎo),可以提高對(duì)新問題的求解效率。
CBR求解的質(zhì)量較高。CBR以過去求解成功或失敗的經(jīng)歷,可以指導(dǎo)當(dāng)前求解時(shí)該怎樣走向成功或避開失敗。
CBR持續(xù)不斷的學(xué)習(xí)能力,使得它可以適應(yīng)于將來問題的解決。
所以基于案例推理方法正不斷應(yīng)用在產(chǎn)品質(zhì)量檢測(cè)和設(shè)備故障診斷方面,并取得較好的經(jīng)濟(jì)效益。為了產(chǎn)品檢測(cè)和設(shè)備故障診斷中,更為智能化,更容易實(shí)現(xiàn)現(xiàn)場(chǎng)檢測(cè)和診斷,計(jì)算機(jī)視覺技術(shù)起到很大的作用。
計(jì)算機(jī)視覺是研究用計(jì)算機(jī)來模擬人和生物的視覺系統(tǒng)功能的技術(shù)學(xué)科,使計(jì)算機(jī)具有感知周圍視覺世界的能力。通過計(jì)算機(jī)視覺,進(jìn)行圖像的獲取預(yù)處理、圖像分割與特征抽取、識(shí)別與分類、三維信息理解、景物描述、圖像解釋,讓計(jì)算機(jī)具有對(duì)周圍世界的空間物體進(jìn)行傳感、抽象、判斷的能力,從而達(dá)到識(shí)別、理解的目的。
計(jì)算機(jī)視覺隨著科學(xué)技術(shù)發(fā)展,特別計(jì)算機(jī)技術(shù)、通信技術(shù)、圖像采集技術(shù)、傳感器技術(shù)等,以及神經(jīng)網(wǎng)絡(luò)理論、模糊數(shù)學(xué)理論、小波的分析理論等計(jì)算機(jī)視覺理論的不斷發(fā)展和日趨成熟,使計(jì)算機(jī)視覺從上世紀(jì)60年代開始興起發(fā)展到現(xiàn)在,取得快速發(fā)展,已經(jīng)從簡(jiǎn)單圖像質(zhì)量處理發(fā)展到圍繞著紋理分析、圖像編碼、圖像分割和濾波等研究。圖像的分析與處理,也由靜止轉(zhuǎn)向運(yùn)動(dòng),由二維轉(zhuǎn)向三維,并主要著眼于對(duì)圖像的識(shí)別和理解上,也使計(jì)算機(jī)視覺的應(yīng)用領(lǐng)域更為廣泛,為案例推理中運(yùn)用計(jì)算機(jī)視覺打下基礎(chǔ)。
2 案例推理系統(tǒng)的主要關(guān)鍵技術(shù)
(1)案例的表示與組織
案例的表示與組織即是如何抽取案例的特征變量,并以一定的結(jié)構(gòu)在計(jì)算機(jī)中組織存儲(chǔ)。如何將信息抽取出特征變量,選擇什么語(yǔ)言描述案例和選擇什么內(nèi)容存放在案例中,案例按什么組織結(jié)構(gòu)存放在存儲(chǔ)器中,這關(guān)系到基于案例推理方法的效率,而且對(duì)于案例數(shù)量越來越多,結(jié)構(gòu)十分復(fù)雜的案例庫(kù),尤其重要。
(2)案例的索引與檢索
案例的索引與檢索即是為了查找最佳相似案例,如何建立案例索引和相似度算法,利用檢索信息從案例庫(kù)中檢索并選擇潛在可用相似案例。后面的工作能否發(fā)揮出應(yīng)有的作用,很大程度上依賴于這一階段得到的案例質(zhì)量的高低,因此這一步非常關(guān)鍵。
(3)案例的復(fù)用和調(diào)整
案例的復(fù)用即是如何根據(jù)舊案例得出新解,涉及到找出案例與新問題之間的不同之處,案例中的哪些部分可以用于新問題,哪些部分不適合應(yīng)用于新問題的解決。而復(fù)用還分案例的結(jié)果復(fù)用,案例的求解方法復(fù)用。
(4)案例的學(xué)習(xí)
案例的學(xué)習(xí)即是將新解添加到案例庫(kù)中,擴(kuò)充案例庫(kù)的案例種類與數(shù)量,這過程也是知識(shí)獲取。此過程涉及選取哪些信息保留,以及如何把新案例有機(jī)集成到案例庫(kù)中,包括如何存儲(chǔ),如何建立索引等等。
針對(duì)案例推理的關(guān)鍵技術(shù),根據(jù)檢測(cè)和故障診斷系統(tǒng)的特點(diǎn),計(jì)算機(jī)視覺主要解決如何將產(chǎn)品圖像輸入系統(tǒng),如何將產(chǎn)品圖像特征進(jìn)行抽取和描述,如何區(qū)別產(chǎn)品不同之處。以便案例推理系統(tǒng)進(jìn)行案例建模,確立案例的表示形成和案例相似度的計(jì)算。本文主要從計(jì)算機(jī)視覺如何運(yùn)用在案例推理系統(tǒng)進(jìn)行探討。
3 產(chǎn)品輸入系統(tǒng)
產(chǎn)品輸入系統(tǒng)在不同產(chǎn)品類型和生產(chǎn)環(huán)境可能有不同之處,主要應(yīng)有傳感器單元和圖像采集單元。如圖1。
圖1 產(chǎn)品輸入系統(tǒng)結(jié)構(gòu)
傳感器單元主要判斷是否有產(chǎn)品存在,是否需要進(jìn)行圖像采集,是否繼續(xù)下一個(gè)產(chǎn)品圖像的采集。這簡(jiǎn)單傳感器可使用光電開關(guān),配合光源,當(dāng)產(chǎn)品經(jīng)過時(shí),產(chǎn)品遮擋住光源,使光電開關(guān)產(chǎn)生一個(gè)0值,而沒有產(chǎn)品經(jīng)過時(shí),光電開關(guān)產(chǎn)生相反的1值,系統(tǒng)通過判斷光電開關(guān)的值,從而判斷是否有產(chǎn)品。
圖像采集單元簡(jiǎn)單地說是將產(chǎn)品拍攝并形成數(shù)字化圖像,主要包括光源、反射鏡、CCD相機(jī)和圖像采集卡等組成。光源和反射鏡作用主要使圖像中的物體和背景之間有較大灰度。CCD相機(jī)主要是拍攝設(shè)備。圖像采集卡主要是將圖像數(shù)字化。通過傳感器判斷有產(chǎn)品后,光源發(fā)出的光均勻地照在被測(cè)件上,CCD相機(jī)拍攝,拍攝圖像經(jīng)過圖像采集卡數(shù)字化后輸入存儲(chǔ)設(shè)備。存儲(chǔ)設(shè)備即為計(jì)算機(jī)硬盤。存放原始圖像、數(shù)據(jù)、處理結(jié)果等。
這是案例推理系統(tǒng)的原始數(shù)據(jù),是圖像處理、圖像特征抽取描述的基礎(chǔ)。
4 圖像處理
在案例推理系統(tǒng)中,需要對(duì)案例的組織和案例建模,案例的組織即案例的表示,相對(duì)計(jì)算機(jī)而言,即圖像特征的抽取,即某圖像具有與其它圖像不同之處,用于區(qū)別其它圖像,具有唯一性。同時(shí),又能完整地表示該圖像。所以案例的表示要體現(xiàn)案例的完整性、唯一性、操作容易性。
圖像中有顏色區(qū)別、又有物體大小之分以及圖像由不同的物體組成。如何表示圖像,或說圖像內(nèi)部包含表示的本質(zhì),即圖像的描述。根據(jù)圖像特點(diǎn),確立圖像案例的表示,以圖像的像素、圖像的數(shù)字化外觀、圖像物體的數(shù)字組成等屬性。這需要對(duì)產(chǎn)品輸入的原始圖像進(jìn)行處理。
在計(jì)算機(jī)視覺技術(shù)中,對(duì)原始圖像主要進(jìn)行圖像增強(qiáng)、平滑、邊緣銳化、分割、特征抽取、圖像識(shí)別與理解等內(nèi)容。經(jīng)過這些處理后,輸出圖像的質(zhì)量得到相當(dāng)程度的改善,既改善了圖像的視覺效果,又便于計(jì)算機(jī)對(duì)圖像進(jìn)行分析、處理和識(shí)別。具體工作流程如圖2所示:
圖2 計(jì)算機(jī)視覺的任務(wù)與工作流程
圖像預(yù)處理是將產(chǎn)品的數(shù)字圖像輸入計(jì)算機(jī)后,首先要進(jìn)行圖像的預(yù)處理,主要完成對(duì)圖像噪聲的消除以及零件的邊緣提取。預(yù)處理的步驟為:圖像二值化處理;圖像的平滑處理;圖像的邊緣提取。
圖像二值化處理主將灰度圖形二值化的關(guān)鍵是閾值的選取,由于物體與背景有明顯的灰度差,可以選取根據(jù)灰度直方圖中兩峰之間的谷值作為閾值來分割目標(biāo)和背景。
圖像的平滑處理技術(shù)即圖像的去噪聲處理,主要是為了去除實(shí)際成像過程中因成像設(shè)備和環(huán)境所造成的圖像失真,提取有用信息。
圖像邊緣提取是為了將圖像中有意義的對(duì)象與其背景分開,并使之具有某種指定的數(shù)學(xué)或符號(hào)表達(dá)形式,使計(jì)算機(jī)能夠理解對(duì)象的具體含義,檢測(cè)出邊緣的圖像就可以進(jìn)行特征提取和形狀分析了??刹捎枚喾N算法,如采用Sobel算子提取邊緣。
圖像預(yù)處理是為下一步的特征描述打基礎(chǔ),預(yù)處理的好壞直接影響案例推理的結(jié)果和檢測(cè)診斷的效率。
特征提取是對(duì)圖像進(jìn)行描述,是案例建模關(guān)鍵,案例建模是根據(jù)案例組織要求抽取圖像特征,是建立案例索引和檢索的關(guān)鍵。如果圖像沒有特征,就談不上進(jìn)行檢索。圖像特征可通過圖像邊界、圖像分割、圖像的紋理等方法,確定圖像特征,包括是什么產(chǎn)品、產(chǎn)品形狀大小、產(chǎn)品顏色,產(chǎn)品有什么缺陷、產(chǎn)品缺陷在什么位置等特征,根據(jù)這些圖像特征進(jìn)行描述,形成計(jì)算機(jī)中屬性值,并從數(shù)據(jù)庫(kù)查找相應(yīng)信息資料,從而確定產(chǎn)品之間的關(guān)系,相似度,也就是案例推理的方向。
5 系統(tǒng)的檢索
根據(jù)案例推理原理和相應(yīng)算法,建立案例推理系統(tǒng)模型,如圖3所示。
圖3 案例推理系統(tǒng)
對(duì)話系統(tǒng):完成人機(jī)交互、問題描述、結(jié)果顯示和系統(tǒng)總控制。
案例庫(kù)系統(tǒng):由案例庫(kù)及案例庫(kù)管理系統(tǒng)組成。
數(shù)據(jù)析取系統(tǒng):對(duì)各種已有的源數(shù)據(jù)庫(kù)的數(shù)據(jù)通過轉(zhuǎn)換而形成所需的數(shù)據(jù)。
多庫(kù)協(xié)同器:根據(jù)問題求解的需要,按照一定的數(shù)據(jù)抽取策略,完成問題求解過程中對(duì)模型庫(kù)系統(tǒng)、方法庫(kù)系統(tǒng)、知識(shí)庫(kù)系統(tǒng)和數(shù)據(jù)庫(kù)系統(tǒng)等資源的調(diào)度與協(xié)調(diào)。
知識(shí)庫(kù)系統(tǒng):由產(chǎn)生式規(guī)則組成,這些知識(shí)包括專家經(jīng)驗(yàn)和以規(guī)則形式表示的有關(guān)知識(shí),也可以是數(shù)據(jù)挖掘結(jié)論,支持案例檢索、案例分析、案例調(diào)整等。 模型庫(kù)系統(tǒng):由模型庫(kù)、算法庫(kù)、模型庫(kù)管理系統(tǒng)組成。完成模型識(shí)別和調(diào)用,并把結(jié)果綜合,送入對(duì)話系統(tǒng)顯示,作為補(bǔ)充信息供案例檢索、調(diào)整使用。
數(shù)據(jù)庫(kù)系統(tǒng):存放待決策支持的所有問題,并完成其維護(hù)與查詢等功能。
由于系統(tǒng)主要應(yīng)用產(chǎn)品的現(xiàn)場(chǎng)實(shí)時(shí)檢測(cè)監(jiān)控或故障診斷,所以系統(tǒng)的檢索時(shí),也必須輸入檢索值,即輸入現(xiàn)場(chǎng)產(chǎn)品的圖像,在通過產(chǎn)品預(yù)處理、圖像的二值化、分割和邊界處理后,進(jìn)行圖像特征描述,根據(jù)圖像描述進(jìn)行分類識(shí)別。根據(jù)案例推理的算法檢索案例庫(kù)中,是否有相似的案例。即確定相似度。相似度確定主要由案例推理的算法確定,如貼近分析法。確定相似度最大作為結(jié)果,并將案例的解輸出,給相關(guān)控制系統(tǒng)進(jìn)行決策。如產(chǎn)品質(zhì)量檢測(cè),確定產(chǎn)品質(zhì)量是否合格,是否有不合格產(chǎn)品,不合格產(chǎn)品是什么原因造成,故障源是什么,如何解決和排除故障,等等。
6 結(jié)論
案例推理方法有效地解決計(jì)算機(jī)視覺技術(shù)中圖像檢索問題。對(duì)提高圖像檢索的效率和準(zhǔn)確度提供了平臺(tái)。
計(jì)算機(jī)視覺技術(shù)也為案例推理系統(tǒng)實(shí)現(xiàn)產(chǎn)品現(xiàn)場(chǎng)實(shí)時(shí)檢測(cè)、監(jiān)控、診斷提供技術(shù)支持。計(jì)算機(jī)視覺技術(shù)現(xiàn)場(chǎng)的數(shù)據(jù)采集、處理為案例推理打好基礎(chǔ)。
兩者的結(jié)合設(shè)計(jì)的系統(tǒng)適用范圍很廣,只要產(chǎn)品需要進(jìn)行質(zhì)量檢測(cè)、監(jiān)控,或設(shè)備需要進(jìn)行故障診斷和維護(hù),都可以適用。
系統(tǒng)提供的實(shí)時(shí)檢測(cè)、監(jiān)控和診斷功能,提高企業(yè)的生產(chǎn)效益,降低了生產(chǎn)成本。
參考文獻(xiàn):
[1](美)??希⊿onka,M).圖像處理分析與機(jī)器視覺[M].人民郵電出版社.
[2]王宏等譯.計(jì)算機(jī)視覺[M].電子工業(yè)出版社.
[3]蔡建榮.自然場(chǎng)景下成熟水果的計(jì)算機(jī)視覺識(shí)別[J].農(nóng)業(yè)機(jī)械,36(2):61-64.
[4]王宇輝.基于計(jì)算機(jī)視覺的錐體零件尺寸在線檢測(cè)算法[J].重型機(jī)械,2005,2:4-6
[5]駱志堅(jiān).基于計(jì)算機(jī)視覺檢測(cè)技術(shù)自動(dòng)計(jì)數(shù)系統(tǒng)的研究與應(yīng)用[J].儀表技術(shù)與傳感器,2005,3:41-43.
[6]左小德.貼近度分析法在案例庫(kù)推理中的應(yīng)用[J],南大學(xué)學(xué)報(bào)(自然科學(xué)版),1997,18(1):21-26.
[7]姜麗紅.案例推理在智能化預(yù)測(cè)支持系統(tǒng)中的應(yīng)用研究[J].決策與決策支持系統(tǒng),1996,6(4):63-69.
近日,國(guó)內(nèi)創(chuàng)業(yè)公司商湯科技宣布獲得4.1億美元B輪融資,這是截至目前為止全球范圍內(nèi)人工智能領(lǐng)域單輪最高融資。至此,這家成立僅三年的公司累計(jì)融資額達(dá)4.5億美元,估值超過15億美元,成為全球融資額最高的人工智能獨(dú)角獸企業(yè)。當(dāng)前,人工智能發(fā)展勢(shì)頭良好,技術(shù)和產(chǎn)品研發(fā)能力大幅提升,市場(chǎng)空間逐步拓展,社會(huì)關(guān)注與投資力度持續(xù)加大,技術(shù)創(chuàng)新驅(qū)動(dòng)的人工智能企業(yè)正成為資本青睞的熱點(diǎn)。
一、商湯融資背景分析
人工智能迎來估值猛漲期。自2014年起,人工智能領(lǐng)域一直都是全球投資熱點(diǎn)。近年來,技術(shù)與產(chǎn)品的迅速成長(zhǎng)帶動(dòng)國(guó)內(nèi)創(chuàng)業(yè)熱情高q,也引發(fā)了資本的高度關(guān)注。據(jù)統(tǒng)計(jì),截至2017年5月31日,我國(guó)人工智能類創(chuàng)業(yè)公司已超過650家,產(chǎn)業(yè)規(guī)模較2016年同期增長(zhǎng)達(dá)到51.2%,投融資事件超過430起,融資總額達(dá)340億元??萍季揞^加大在人工智能領(lǐng)域的布局,投資案例不斷涌現(xiàn)。同時(shí),社會(huì)資本競(jìng)相追逐人工智能領(lǐng)域的優(yōu)質(zhì)項(xiàng)目,整體行業(yè)獲投率偏高,超過一半的人工智能公司成立時(shí)間在兩年之內(nèi),可見資本市場(chǎng)對(duì)人工智能產(chǎn)業(yè)發(fā)展的信心。
計(jì)算機(jī)視覺領(lǐng)域成為熱點(diǎn)聚焦。在大數(shù)據(jù)、深度學(xué)習(xí)等新技術(shù)推動(dòng)下,以計(jì)算機(jī)視覺和語(yǔ)音識(shí)別為代表的感知智能正呈現(xiàn)出高速演進(jìn)態(tài)勢(shì)。目前我國(guó)計(jì)算機(jī)視覺技術(shù)水平已達(dá)到全球領(lǐng)先水平,并在安防、汽車、金融等領(lǐng)域取得了顯著的應(yīng)用成效。在安防領(lǐng)域,智能技術(shù)如人臉識(shí)別、圖形識(shí)別應(yīng)用場(chǎng)景眾多,如車牌識(shí)別、車輛視覺特征識(shí)別、被動(dòng)人像卡口、身份證比對(duì)等應(yīng)用。在汽車領(lǐng)域,圍繞智能駕駛汽車人工智能在環(huán)境感知、路徑規(guī)劃與決策等關(guān)鍵環(huán)節(jié)均有所應(yīng)用和體現(xiàn),在該領(lǐng)域百度、樂視等企業(yè)已開展卓有成效的實(shí)踐。廣泛的商業(yè)化渠道和技術(shù)基礎(chǔ)推動(dòng)計(jì)算機(jī)視覺成為創(chuàng)投熱門領(lǐng)域,據(jù)數(shù)據(jù)顯示,中國(guó)人工智能創(chuàng)業(yè)公司所屬領(lǐng)域分布中,計(jì)算機(jī)視覺領(lǐng)域擁有最多創(chuàng)業(yè)公司。2016年,人臉識(shí)別服務(wù)開發(fā)商曠視科技完成至少1億美元融資,估值超過20億美元,專注圖像識(shí)別的圖普科技獲得千萬美元A輪融資。
商湯科技技術(shù)實(shí)力領(lǐng)先,發(fā)展?jié)摿薮?。商湯科技主攻人臉識(shí)別、視頻監(jiān)控識(shí)別算法、增強(qiáng)現(xiàn)實(shí)、文字識(shí)別、自動(dòng)駕駛識(shí)別算法和醫(yī)療影像識(shí)別算法等技術(shù),基礎(chǔ)研究實(shí)力強(qiáng)大,高質(zhì)量專利數(shù)量、專業(yè)學(xué)術(shù)數(shù)量均保持全國(guó)領(lǐng)先水平。在2015年ImageNet大規(guī)模視覺識(shí)別競(jìng)賽中,商湯科技獲得視頻識(shí)別冠軍,次年在該競(jìng)賽中,商湯科技憑借原創(chuàng)深度神經(jīng)網(wǎng)絡(luò)平臺(tái),獲得3個(gè)項(xiàng)目的冠軍。商湯科技主要業(yè)務(wù)范圍是將計(jì)算機(jī)視覺技術(shù)賦能給安防、金融、機(jī)器人、政府大數(shù)據(jù)分析以及虛擬增強(qiáng)現(xiàn)實(shí)等行業(yè)。
二、由商湯融資帶來的兩點(diǎn)思考
【關(guān)鍵詞】平面測(cè)量技術(shù);鉛球項(xiàng)目;成績(jī)測(cè)量
0 引言
隨著計(jì)算機(jī)處理能力的提高和傳感器技術(shù)的發(fā)展,近年來基于視頻圖像處理的計(jì)算機(jī)視覺技術(shù)已成為圖像處理領(lǐng)域的研究熱點(diǎn),該技術(shù)在眾多的領(lǐng)域中都有十分廣泛的應(yīng)用[1]。
視覺是人類認(rèn)識(shí)世界、觀察世界的重要手段。人類從外界獲取的信息量約有 75%來自視覺系統(tǒng),這表明視覺信息量十分巨大以及人類對(duì)視覺信息有較高的利用率。人類利用視覺的過程可看作是一個(gè)從感覺到知覺的復(fù)雜過程,即從感受到的對(duì)三維世界的投影圖像到依據(jù)投影圖像去認(rèn)知三維世界的內(nèi)容和含義[2]。
計(jì)算機(jī)視覺技術(shù)是指利用計(jì)算機(jī)實(shí)現(xiàn)人的視覺功能,既對(duì)客觀世界的三維場(chǎng)景的識(shí)別、感知和理解。該技術(shù)包括是仿生學(xué)方法及工程方法,仿生學(xué)方法是模仿人類視覺功能的結(jié)構(gòu)及原理,建立相應(yīng)的處理系統(tǒng),完成類似的工作和功能;工程方法是從分析人類視覺系統(tǒng)著手,并采用任何現(xiàn)有的可行手段實(shí)現(xiàn)人類視覺系統(tǒng)的功能[3],該方法的特點(diǎn)是只關(guān)心系統(tǒng)的輸入和輸出。計(jì)算機(jī)視覺的主要研究目標(biāo)是建成計(jì)算機(jī)視覺系統(tǒng),完成各種視覺功能。也就是說,即要能借助各種視覺傳感器(如 CMOS 攝像器件、CCD等)獲取現(xiàn)實(shí)世界的圖像,而感知和恢復(fù) 3D 環(huán)境中物體的幾何性質(zhì)、運(yùn)動(dòng)情況、姿態(tài)結(jié)構(gòu)、相互位置等,并且要對(duì)客觀場(chǎng)景進(jìn)行識(shí)別、解釋、描述、進(jìn)而做出決斷。目前,計(jì)算機(jī)視覺技術(shù)在體育運(yùn)動(dòng)中也得到了廣泛的應(yīng)用,利用該技術(shù)不僅可以從不同的視角觀察運(yùn)動(dòng)員的動(dòng)作,而且能將運(yùn)動(dòng)員速度、加速度、所在位置等數(shù)據(jù)進(jìn)行量化處理,使體育訓(xùn)練及比賽擺脫依靠傳統(tǒng)經(jīng)驗(yàn)分析及判別的狀態(tài),從而進(jìn)入科學(xué)化、數(shù)字化的狀態(tài),而且還可以完成競(jìng)技體育項(xiàng)目的成績(jī)測(cè)試[4-5]。
在測(cè)試項(xiàng)目中鉛球成績(jī)的測(cè)量仍采用皮尺丈量法。這種方法存在著三個(gè)方面的缺陷,一是皮尺本身具有彈性以及易折疊特性,二是受場(chǎng)地的凹凸不平,三是人為因素影響較大。由于這三方面的作用, 故在鉛球成績(jī)的測(cè)量精確度受到極大的限制。針對(duì)這一問題本課題提出了一種基于同視場(chǎng)(鉛球場(chǎng)地)測(cè)量地平面坐標(biāo)的單攝像機(jī)模型[6-7]。該模型利用透視投影幾何關(guān)系,對(duì)攝像機(jī)內(nèi)部參數(shù)進(jìn)行標(biāo)定,然后,建立相應(yīng)的網(wǎng)格匹配數(shù)學(xué)模型,通過單目CCD攝像機(jī)像面坐標(biāo),測(cè)量鉛球落點(diǎn)的地平面坐標(biāo)[8]。成功的解決了鉛球著點(diǎn)測(cè)量在雙目視覺交匯組合測(cè)量存在的死角影響系統(tǒng)的測(cè)量范圍的問題,另外,單目視覺測(cè)量系統(tǒng)也避免了雙目視覺系統(tǒng)存在對(duì)應(yīng)特征點(diǎn)匹配問題。
1 平面測(cè)量原理
圖1 鉛球的2D場(chǎng)景坐標(biāo)系
鉛球場(chǎng)地是一個(gè)扇形區(qū)域(如圖1)。假設(shè)建立一個(gè)如圖1的2D場(chǎng)景坐標(biāo)系,首先要做的事是要確定場(chǎng)地上指定點(diǎn)的真實(shí)坐標(biāo)與采集到的圖片的指定點(diǎn)象素坐標(biāo)之間的對(duì)應(yīng)關(guān)系,即要找到這兩種坐標(biāo)系之間的轉(zhuǎn)換關(guān)系。而這種轉(zhuǎn)換關(guān)系可以用平面測(cè)量的相關(guān)技術(shù)獲得。在計(jì)算機(jī)視覺中,所謂的平面測(cè)量,就是從圖像中獲得2D場(chǎng)景信息。在實(shí)際的測(cè)量中,我們可以通過在圖像上標(biāo)定一定數(shù)量的坐標(biāo)點(diǎn)來確定圖像中場(chǎng)地指定點(diǎn)的象素坐標(biāo)和真實(shí)世界中的指定點(diǎn)的現(xiàn)實(shí)坐標(biāo)之間的單應(yīng)矩陣。
我們獲取一幅2D場(chǎng)景S的圖像I,通過S與I之間的N(N>=4)對(duì)對(duì)應(yīng)點(diǎn),就可以確定它們之間的單應(yīng)矩陣H。
令:
H=h■,h■,h■=h■,h■,h■h■,h■,h■h■,h■,h■(1)
在H的九個(gè)元素中,有八個(gè)獨(dú)立比率,即一個(gè)單應(yīng)有八個(gè)自由度變量,一個(gè)常數(shù)1。因此,在H中,往往設(shè)置h■=1。
令(x■,y■)∈I,x■■,y■■∈S為一對(duì)對(duì)應(yīng)點(diǎn),i=1,2,…N。由每一對(duì)對(duì)應(yīng)點(diǎn),根據(jù)圖像與場(chǎng)景之間的單應(yīng)關(guān)系,我們可以得到兩個(gè)線性方程:
其中,h是矩陣H的向量形式,
于是我們可以得到2N個(gè)方程,寫成矩陣形式為:
AH=0(3)
其中
因此,要求得8個(gè)參數(shù)的單應(yīng)矩陣,至少需要4個(gè)對(duì)應(yīng)點(diǎn)。在實(shí)際的測(cè)量中,為了提高精度,每個(gè)模板平面上提供的對(duì)應(yīng)點(diǎn)數(shù)目都會(huì)超過4個(gè)。
當(dāng)N>4時(shí),我們可以用奇異值分解法(SVD)[14]求最小二乘解h。
求得單應(yīng)矩陣后,利用公式(2),就可以計(jì)算出圖像上指定點(diǎn)對(duì)應(yīng)的真實(shí)坐標(biāo)值,從而計(jì)算出鉛球投擲的距離。
2 實(shí)驗(yàn)結(jié)果與分析
表1
2.1 實(shí)驗(yàn)結(jié)論(下轉(zhuǎn)第38頁(yè))
(上接第21頁(yè))經(jīng)實(shí)際測(cè)量的6個(gè)標(biāo)定點(diǎn)(如圖1)的坐標(biāo)分別為A(700,0)、B(900,0)、C(1100,0)、D(570,407)、E(733,523)、F(895,639) 。為了測(cè)試本文提出的測(cè)量模型,在反復(fù)測(cè)量鉛球投擲實(shí)驗(yàn)中選取了典型的10個(gè)測(cè)試樣本,其中鉛球落點(diǎn)10個(gè)。
2.2 誤差分析
從表1中我們可以看到人工測(cè)量值和系統(tǒng)測(cè)量值有一定的誤差,分析誤差產(chǎn)生的原因有如下幾種:
1)數(shù)字 CCD 鏡頭的光學(xué)性能引起的誤差,如焦距、畸變和光學(xué)中心誤差等通過攝像機(jī)內(nèi)部參數(shù)校正來解決。
2)攝像機(jī)的支架及底座一定要有足夠的穩(wěn)定性和剛度,在視頻圖像獲取過程中應(yīng)保證攝像機(jī)的相對(duì)位置穩(wěn)定不動(dòng),由意外情況所造成的誤差在計(jì)算中應(yīng)予以剔除。
3)環(huán)境的變化將對(duì)測(cè)量結(jié)果產(chǎn)生影響,因此測(cè)量中要及時(shí)修正背景圖像。
4)人工測(cè)量本身就會(huì)與真實(shí)值產(chǎn)生一定的誤差。
3 總結(jié)
本論文首先介紹了課題背景,對(duì)單目視覺測(cè)量的研究現(xiàn)狀和測(cè)量建模在國(guó)內(nèi)外的研究現(xiàn)狀進(jìn)行了分析和歸納,同時(shí)分析了視頻圖像處理技術(shù)在體育項(xiàng)目應(yīng)用現(xiàn)狀,將基于單目視頻圖像處理技術(shù)的鉛球成績(jī)測(cè)量作為切入點(diǎn),對(duì)數(shù)字圖像處理技術(shù)在田徑運(yùn)動(dòng)中應(yīng)用的關(guān)鍵技術(shù)進(jìn)行了研究。結(jié)合鉛球場(chǎng)地的特點(diǎn),提出一種基于視頻圖像的鉛球測(cè)量方法,并通過實(shí)際應(yīng)用證明了該方法的可行性。
【參考文獻(xiàn)】
[1]Criminisi A,Reid I,Zisserman A. A plane measuring device[J].Image and VisionComputing,1999,17(8), 625-634.
[2]Lorenzo Bruzzone, Diego Fernàndez Prieto. Automatic Analysis of the Difference Image for Unsupervised Change Detection[J]. IEEE Transactions on Geoscience and Remote Sensing,2000,5,38(3).
[3]L Sajó, Z Ruttkay, A Fazekas. Turk-2, a multi-modal chess player[J]. International Journal of Human-Computer Studies,2011,7,69(7-8):483-495.
[4]Lichtenberg, D.B., Wills, J.G., Maximizing the range of the shot-put[J]. American Journal of Physics,1978,46:546-549.
[5]Maheras, A.V.. The relationship between the angle of release and the velocity of release in the shot-put, and the application of a theoretical model to estimate the optimum angle of release (throwing)[D].University of Kansas., 1995.
[6]Antonio Plaza, Jon Atli Benediktsson, Joseph W. Boardman. Recent advances in techniques for hyperspectral image processing[J]. Remote Sensing of Environment,2009,9,113(1):S110-S112.
多采用是人工測(cè)量的方式,在誤差的控制上選擇的是多次測(cè)量,反復(fù)操作,再將多次測(cè)量的結(jié)果進(jìn)行加權(quán),最終得到相對(duì)準(zhǔn)確的測(cè)量數(shù)值。這種方法在一定程度上是操作十分復(fù)雜,精度還很難達(dá)到設(shè)計(jì)要求,所以我們?cè)诘V區(qū)土地信息測(cè)量工程中引進(jìn)了GIS技術(shù)這樣的一個(gè)概念,下面我們就如何通過GIS技術(shù)進(jìn)行有效的觀測(cè)測(cè)量來進(jìn)行討論。
[關(guān)鍵詞] GIS技術(shù); 精密測(cè)量; 構(gòu)造幾何模型; 信號(hào)源的接收
地理信息系統(tǒng)(Geographic information system,GIS)是利用計(jì)算機(jī)及其外部設(shè)備采集、存儲(chǔ)、分析、描述與空間和地理分布有關(guān)的數(shù)據(jù)的空間信息系統(tǒng)。GIS融合計(jì)算機(jī)圖形和數(shù)據(jù)庫(kù)于一體,在一定的地域內(nèi),將地理空間信息和一些與該地域地理信息相關(guān)的屬性信息結(jié)合起來,達(dá)到對(duì)地理和屬性信息的綜合管理。從外部來看,GSI表現(xiàn)為計(jì)算機(jī)軟硬件系統(tǒng),而其內(nèi)涵是由計(jì)算機(jī)程序和地理數(shù)據(jù)組織而成的地理空間信息模型,是一個(gè)高度信息化的地理系統(tǒng)。
1)等高線生成及等高線分析:等高線圖是人們傳統(tǒng)上觀測(cè)地形的主要手段??梢栽诘雀呔€圖上精確地獲知地形的起伏程度、區(qū)域內(nèi)各部分的高程等等。等高線圖可以從格網(wǎng)數(shù)字地形模型中獲取相關(guān)的資料信息,也可在不規(guī)則三角形格網(wǎng)T(NI)中生成。
2)立體透視圖分析:當(dāng)用戶需要從直觀上觀察地形的概貌時(shí),用繪制透視圖的方法(還可以用色彩)可以更逼真地顯示地形。
3)坡度分析、地表面積計(jì)算及挖、填土方體積計(jì)算:建立DTM后就可以用之計(jì)算坡度、面積和挖、填土方體積,以其作為土地適宜性評(píng)價(jià)的因子。
一 GIS技術(shù)在信息管理模式中的具體形式
在以往的測(cè)量中,選擇的測(cè)量方式還是完全采用機(jī)械的形式,但是在使用了計(jì)算機(jī)GIS技術(shù)精密測(cè)量后,完成了許多以往技術(shù)所不能達(dá)到的任務(wù)。在我們的研究中,計(jì)算機(jī)GIS技術(shù)測(cè)量的原理是通過攝像機(jī)將被處理的對(duì)象采集進(jìn)行影像采集,在多個(gè)控制點(diǎn)的數(shù)據(jù)采集完成后,系統(tǒng)會(huì)自動(dòng)將這些圖像進(jìn)行整合,得出相關(guān)的幾何多變參數(shù),再在計(jì)算機(jī)上以具體的數(shù)據(jù)顯示出來,以供礦區(qū)技術(shù)人員使用參照。
在上面所說的攝像機(jī)并不是我們通常意義上生活中使用的攝像機(jī)。它是一種可視化較強(qiáng),表針比較敏感的測(cè)試儀。可以將視覺中的二維形態(tài)通過顯影,記錄在機(jī)械的光譜儀上,再將這種的二維圖像做數(shù)學(xué)處理,有二階矩陣轉(zhuǎn)換為三階矩陣,通過播放儀呈現(xiàn)出三維的影像。這時(shí)的圖像變?yōu)榱Ⅲw化,更有層次感,效果上也有了明顯的變化,這是一種顯示方法。此外還有一種造價(jià)較高的儀器,我們不常使用,就是圖像提取器。同樣是采集控制點(diǎn)的數(shù)據(jù),將數(shù)據(jù)整合在系統(tǒng)之內(nèi),然后對(duì)于原始的圖像進(jìn)行預(yù)處理,不再經(jīng)過有曝光這個(gè)程序,將圖像中關(guān)鍵點(diǎn)的坐標(biāo)在整個(gè)內(nèi)部軸面上體現(xiàn)出來,提取數(shù)據(jù)幀數(shù),再運(yùn)用機(jī)器的智能識(shí)別系統(tǒng),對(duì)控制點(diǎn)的坐標(biāo)進(jìn)行數(shù)據(jù)分析,自動(dòng)生成圖形,這也可以用于精密測(cè)量。它的優(yōu)點(diǎn)就是使用上極其的方面,基本只要架立儀器和打開開關(guān),其他的工作機(jī)械系統(tǒng)都會(huì)自動(dòng)的完成。使用的困難就是造價(jià)極其的高,不適合一般企業(yè)使用。在基于計(jì)算機(jī)視覺圖像測(cè)量中使用上的原理如下:
(1)計(jì)算出觀察控制點(diǎn)到計(jì)算機(jī)視覺圖像測(cè)量?jī)x器的有效距離;
(2)得出觀察點(diǎn)到目標(biāo)控制點(diǎn)之間的三維的運(yùn)動(dòng)幾何參數(shù);
(3)推斷出目標(biāo)控制點(diǎn)在整個(gè)平面上的表面特征(大多時(shí)候要求形成立體視覺);
(4)還通過觀察可以判斷出目標(biāo)物體的幾何坐標(biāo)方位。
在整個(gè)計(jì)算機(jī)GIS技術(shù)精密測(cè)量的在礦區(qū)土地信息管理中最關(guān)鍵的元件就是壓力應(yīng)變電阻儀,這也是傳感器的一部分。
所謂的壓力感應(yīng)就是一種新型的傳感器,通過電阻的變化作為一種感應(yīng)值的判斷標(biāo)準(zhǔn)進(jìn)行計(jì)算和采集數(shù)據(jù)。具體的做法是在受力物體上粘貼高靈敏度的感應(yīng)片,通過力的傳遞將物體上受到即時(shí)的力傳遞到感應(yīng)片上,以備技術(shù)人員收集。在物體的中心或者是機(jī)械的隔斷處,使用丙酮溶液進(jìn)行擦拭,以保證物體的表面潔凈和貼合度較高。當(dāng)液體充分風(fēng)干的情況下將感應(yīng)片貼在已涂丙酮的物體上(注意感應(yīng)片的正反),再使用導(dǎo)線和感應(yīng)片相互連接,從而形成了一個(gè)完整的閉合電路體系,在通電的情況下,在計(jì)算機(jī)終端上可以顯示出來。以便技術(shù)人員可以在任何時(shí)候掌握每個(gè)檢測(cè)點(diǎn)的施工使用情況,一旦機(jī)械設(shè)備發(fā)生異常現(xiàn)象,就會(huì)在計(jì)算機(jī)圖形中顯示出來。于此同時(shí),它還可以對(duì)施工人員所處的具置做到應(yīng)力感應(yīng),人自身的重量傳遞到地面上,結(jié)構(gòu)會(huì)出現(xiàn)結(jié)構(gòu)上的略微變化,這個(gè)儀器就能第一時(shí)間以信號(hào)的方式傳送到計(jì)算機(jī)終端,讓技術(shù)人員掌握相關(guān)施工的情況,并結(jié)合數(shù)據(jù)報(bào)告總結(jié)出相關(guān)的可行性分析付諸實(shí)踐。
當(dāng)無法觀察到控制點(diǎn)是,計(jì)算機(jī)GIS技術(shù)測(cè)量可以通過接收信號(hào)或是相關(guān)的頻率波段來收集數(shù)據(jù),不會(huì)因?yàn)橐酝鶞y(cè)量的環(huán)境不好,距離太遠(yuǎn),誤差太大的影響。同時(shí)在信息管理中通過了加密通道,系統(tǒng)可以將數(shù)據(jù)自動(dòng)的保存和轉(zhuǎn)換為視圖模式,對(duì)于數(shù)據(jù)的審計(jì)和運(yùn)行可以同時(shí)進(jìn)行,這樣就可以很好的保證大地測(cè)量中的圖像數(shù)據(jù)安全,利用防護(hù)墻將采集中廢棄的數(shù)據(jù)革除在外,避免數(shù)值之間發(fā)生紊亂的現(xiàn)象,進(jìn)一步改善計(jì)算機(jī)GIS技術(shù)。
二 計(jì)算機(jī)GIS與CAD技術(shù)的結(jié)合
在計(jì)算機(jī)GIS技術(shù)測(cè)量中解決了很多以往很難完成的任務(wù),但是在使用過程中還是發(fā)生了很多的問題。尤其在土地信息的選擇中,無法使用高幀數(shù)的圖片顯示,無法將計(jì)算機(jī)測(cè)量的關(guān)鍵技術(shù)的優(yōu)點(diǎn)發(fā)揮出來。在煤礦生產(chǎn)過程中,對(duì)于生產(chǎn)效率的提高就要對(duì)開采環(huán)境的要求更高。使用繪圖技術(shù)與GIS技術(shù)相互結(jié)合可以將復(fù)雜的地理環(huán)境的具體形狀在電腦當(dāng)中展現(xiàn)出來,用較為直觀的圖形準(zhǔn)確的反應(yīng)出來。而且在使用中,可以在計(jì)算機(jī)中隨時(shí)將圖像進(jìn)行修改,完全可以適應(yīng)復(fù)雜情況下的設(shè)備調(diào)試。在以往傳統(tǒng)的圖像設(shè)計(jì)中,技術(shù)人員在圖紙中很難將地理信息進(jìn)行再次修改,在設(shè)計(jì)后期在計(jì)算機(jī)圖形繪制處理技術(shù)中,對(duì)于圖像的調(diào)試使用的范圍很廣,通過虛擬的模擬和現(xiàn)實(shí)的結(jié)合來實(shí)現(xiàn)煤礦信息的完整,有效的加強(qiáng)了煤礦的信息化管理。
CAD技術(shù)是基于工程圖上的三維建模方式。三維模型是從二維信息中提取的三維模型信息,通過再次分類以后,得到的一系列的相關(guān)處理信息,之后在三維空間建立相應(yīng)的二維信息的三維形狀模型提,使模型本身恢復(fù)點(diǎn),線,面和拓?fù)潢P(guān)系,從而實(shí)現(xiàn)形狀重建工程。計(jì)算機(jī)圖形繪制處理,也可以應(yīng)用于測(cè)繪圖紙和關(guān)于地形的建模。土地信息中包含的地貌和自然資源圖,它是國(guó)民經(jīng)濟(jì)體系的重要組成部分。我們可以畫一個(gè)圖,三維地形圖的存儲(chǔ)信息的產(chǎn)生。為預(yù)測(cè)和決策水平的使用有重大的意義,也為綜合治理和煤炭資源的研究開發(fā)利用提供科學(xué)依據(jù),這些依據(jù),在軍事上也起著非常重要的作用。在煤礦機(jī)械設(shè)備也使用CAD軟件繪制零件圖,利用繪圖軟件在操作更簡(jiǎn)單的菜單式設(shè)計(jì),繪制出圖形更準(zhǔn)確。
三 GIS技術(shù)測(cè)量的關(guān)鍵技術(shù)遇到的困難和使用前景
計(jì)算機(jī)GIS技術(shù)測(cè)量的關(guān)鍵技術(shù)作為一種新興技術(shù)在使用時(shí)間上不過十幾年,其使用的程度已經(jīng)無法估算。正是因?yàn)樗暮?jiǎn)單、使用、精度高以及自動(dòng)化能力卓越的特點(diǎn)受到了礦區(qū)土地信息管理部門的廣泛青睞。在測(cè)量調(diào)控方面的這些可靠性和穩(wěn)定性也是有目共睹的。這項(xiàng)關(guān)鍵技術(shù)中涵蓋的學(xué)科非常的多,涉及到的知識(shí)也很全面,一旦出現(xiàn)了機(jī)器的故障,在維修上還是一個(gè)很大的問題,如何很好的解決計(jì)算機(jī)視覺圖像技術(shù)的相關(guān)核心問題就是當(dāng)下亟待解決的。通過在一些相關(guān)的技術(shù)之間的相互結(jié)合才能使GIS技術(shù)發(fā)揮的更加完美。
我們都知道,人的眼睛是可以受到自身的控制,想要完成礦區(qū)土地觀測(cè)是十分簡(jiǎn)單的,但是在計(jì)算機(jī)GIS技術(shù)中,畢竟是采取攝像機(jī)取景的模式,在取得的點(diǎn)位有的時(shí)候不是特別的有代表性,很難將這些問題具體化、形象化。達(dá)不到我們?cè)O(shè)計(jì)時(shí)的初衷。所以在這些模型的構(gòu)建中和數(shù)據(jù)的轉(zhuǎn)換上必須有嚴(yán)格的規(guī)定和要求,切不可盲目的實(shí)施測(cè)量,每項(xiàng)技術(shù)操作都要按規(guī)程來實(shí)施。
四 結(jié)束語(yǔ)
在煤礦土地工程發(fā)展的今天,很多的測(cè)量技術(shù)已經(jīng)離不了計(jì)算機(jī)GIS技術(shù)的輔助,本文中詳細(xì)的談到了GIS技術(shù)方面的研究,對(duì)于之中可能出現(xiàn)的一些問題也提出了相應(yīng)的解決方案,對(duì)于和CAD繪圖技術(shù)相互結(jié)合的使用方式也做出了詳細(xì)的介紹。測(cè)量工程中使用計(jì)算機(jī)GIS技術(shù)可以很好的解決和完善測(cè)量中遇到的一些問題,但是也暴露出了很多的問題亟需技術(shù)人員不斷去解決完善。
將GIS技術(shù)在礦區(qū)土地管理信息系統(tǒng)中使用,也是加強(qiáng)了礦區(qū)建設(shè)的信息化水平??梢灶A(yù)見的是,在未來使用計(jì)算機(jī)GIS技術(shù)在礦區(qū)土地管理信息系統(tǒng)建立的測(cè)量模型會(huì)得到更多、更好的應(yīng)用。但作為一個(gè)長(zhǎng)期復(fù)雜的技術(shù)工程,在這個(gè)建設(shè)過程中定會(huì)有一些困難的出現(xiàn)。希望通過不斷的發(fā)現(xiàn)問題、總結(jié)經(jīng)驗(yàn),讓GIS技術(shù)在礦區(qū)土地管理信息系統(tǒng)在煤礦的開挖中的作用發(fā)揮的更好。
[參考文獻(xiàn)]
[1] 湯劍,周芳芹,楊繼隆.計(jì)算機(jī)視覺圖像系統(tǒng)的技術(shù)改造[J].機(jī)電產(chǎn)品開發(fā)與創(chuàng)新周刊,2005,14(18):33-36
[2] 段發(fā)階等. 拔絲??仔斡?jì)算機(jī)視覺檢測(cè)技術(shù)[J] . 光電工程時(shí)報(bào), 2006, 23( 13):189-190
關(guān)鍵詞:增強(qiáng)現(xiàn)實(shí);計(jì)算機(jī)視覺;三維注冊(cè)
中圖分類號(hào):TP242 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9599?。?012) 19-0000-02
1 引言
隨著計(jì)算機(jī)技術(shù)的迅速發(fā)展,計(jì)算機(jī)視覺、虛擬現(xiàn)實(shí)技術(shù)、人工智能、計(jì)算機(jī)圖形學(xué)等技術(shù)被廣泛地研究和應(yīng)用,這些技術(shù)引導(dǎo)著人們進(jìn)入了一個(gè)信息數(shù)字化的虛擬時(shí)代。
增強(qiáng)現(xiàn)實(shí)技術(shù)(Augmented Reality,AR)作為虛擬現(xiàn)實(shí)技術(shù)和計(jì)算機(jī)圖形學(xué)相結(jié)合的產(chǎn)物,它是在通過計(jì)算機(jī)渲染生成虛擬的物體或文字信息模型的同時(shí),對(duì)真實(shí)的場(chǎng)景進(jìn)行標(biāo)定,從而使虛擬的物體能夠被準(zhǔn)確地放置到真實(shí)的場(chǎng)景中,最終通過顯示設(shè)備顯示出來,使用戶處于虛擬和現(xiàn)實(shí)相融合的亦真亦幻的新環(huán)境中,無法清楚地分辨出真實(shí)和虛擬。增強(qiáng)現(xiàn)實(shí)技術(shù)增強(qiáng)了用戶的觀感及其與真實(shí)場(chǎng)景之間的交互。
增強(qiáng)現(xiàn)實(shí)技術(shù)作為虛擬現(xiàn)實(shí)的一個(gè)重要分支,是虛擬現(xiàn)實(shí)技術(shù)發(fā)展過程中的產(chǎn)物。如圖1.1所示,該圖為Milgram提出的增強(qiáng)現(xiàn)實(shí)和虛擬現(xiàn)實(shí)關(guān)系的一種分類學(xué)表示方法。由圖我們可以看出,虛擬現(xiàn)實(shí)所創(chuàng)建出來的是一種完全虛擬的三維世界,它與真實(shí)的世界相隔離。而增強(qiáng)現(xiàn)實(shí)是以現(xiàn)實(shí)場(chǎng)景為基礎(chǔ),場(chǎng)景中的虛擬物體隨著真實(shí)物體的變化而變化,提供給用戶的是一種復(fù)合的視覺效果,就好像這些虛擬物體真實(shí)的存在于場(chǎng)景中。
2 增強(qiáng)現(xiàn)實(shí)技術(shù)的應(yīng)用
增強(qiáng)現(xiàn)實(shí)技術(shù)在20世紀(jì)90年代真正興起,其發(fā)展與20世紀(jì)60年代計(jì)算機(jī)圖形學(xué)的迅速發(fā)展密不可分。增強(qiáng)現(xiàn)實(shí)技術(shù)不僅擁有虛擬現(xiàn)實(shí)的各種優(yōu)點(diǎn),同時(shí)又有其獨(dú)特的視覺增強(qiáng)功能,因此成為了國(guó)內(nèi)外研究機(jī)構(gòu)和知名大學(xué)的研究熱點(diǎn),并廣泛的被應(yīng)用于教育、醫(yī)療、工業(yè)、娛樂、軍事等多個(gè)領(lǐng)域。
2.1 教育
增強(qiáng)現(xiàn)實(shí)豐富了教育學(xué)習(xí)生活。傳統(tǒng)的書籍中只存在文字信息,通過增強(qiáng)現(xiàn)實(shí)技術(shù),我們可以透過書籍看見文字相關(guān)的動(dòng)態(tài)畫面或是影像,圖文并茂,極大的增強(qiáng)了學(xué)生的學(xué)習(xí)興趣。目前的魔法書系統(tǒng)就是這一技術(shù)的很好運(yùn)用,用戶通過頭盔顯示器可以看到書中描述的場(chǎng)景,使讀者可以完全沉浸在虛實(shí)結(jié)合的環(huán)境中,提高學(xué)習(xí)興趣和效率。
2.2 醫(yī)療
增強(qiáng)現(xiàn)實(shí)技術(shù)可以幫助醫(yī)生實(shí)現(xiàn)可視化手術(shù)或手術(shù)培訓(xùn)。準(zhǔn)確地定位真實(shí)場(chǎng)景是增強(qiáng)現(xiàn)實(shí)技術(shù)的一個(gè)重要方面,在醫(yī)療中,運(yùn)用增強(qiáng)現(xiàn)實(shí)技術(shù)可以進(jìn)行手術(shù)定位,實(shí)時(shí)地收集病人體內(nèi)的3D影像,并將其與真實(shí)的人體相結(jié)合,使得醫(yī)生可以“透視”病人體內(nèi),從而減少手術(shù)的風(fēng)險(xiǎn),該技術(shù)對(duì)微創(chuàng)手術(shù)也有著深遠(yuǎn)的意義。手術(shù)培訓(xùn)方面,通過加入虛擬的提示注解,可以提醒醫(yī)生手術(shù)中的一些必要步驟,降低手術(shù)風(fēng)險(xiǎn)。
2.3 工業(yè)
增強(qiáng)現(xiàn)實(shí)的另一個(gè)應(yīng)用是工業(yè)組裝和維修。通過增強(qiáng)現(xiàn)實(shí)技術(shù)可以顯示出各種設(shè)備零件的內(nèi)部結(jié)構(gòu)圖、使用說明等,方便安裝和維修。顯示的內(nèi)容可以不僅僅是簡(jiǎn)單的文字或圖片,更能直接渲染生成3D的圖形,并按步驟一步一步的顯示出來,方便操作。
2.4 娛樂
電影、廣告、游戲、體育比賽轉(zhuǎn)播中,增強(qiáng)現(xiàn)實(shí)技術(shù)也得到了廣泛的運(yùn)用。體育比賽中,能夠在直播現(xiàn)場(chǎng)實(shí)時(shí)地插入三維的圖形、動(dòng)畫、視頻等虛擬的比賽相關(guān)信息或廣告。日常生活中,出現(xiàn)一種增強(qiáng)現(xiàn)實(shí)瀏覽器,它利用多種傳感器將日常需求通過實(shí)景與虛景結(jié)合后呈現(xiàn)在用戶面前,用戶可以通過增強(qiáng)現(xiàn)實(shí)瀏覽器看到實(shí)景的文字介紹、三維模型等,并可以搜索定位。
3 增強(qiáng)現(xiàn)實(shí)相關(guān)技術(shù)
增強(qiáng)現(xiàn)實(shí)系統(tǒng)具有虛實(shí)結(jié)合、三維注冊(cè)、實(shí)時(shí)交互三個(gè)特點(diǎn)。三個(gè)特點(diǎn)之間緊密聯(lián)系,要求在合成的場(chǎng)景中虛擬的物體能夠擁有真實(shí)的存在感和位置感。因此顯示技術(shù)、定位技術(shù)、虛實(shí)融合技術(shù)、用戶交互技術(shù)是實(shí)現(xiàn)增強(qiáng)現(xiàn)實(shí)系統(tǒng)的基礎(chǔ)支撐技術(shù)。
3.1 顯示技術(shù)
理想的AR系統(tǒng)的顯示器具有體積小、移動(dòng)方便、圖像繪制清晰、交互自然等特點(diǎn),但是目前仍不能制造出完成符合這些特點(diǎn)的顯示器。常用的顯示設(shè)備可以分為四類:普通液晶現(xiàn)實(shí)器;頭戴式顯示器;手持式顯示器;投影式顯示器。
液晶顯示器是最為常見,也最容易得到的顯示設(shè)備。但是液晶顯示器體積較大,移動(dòng)不方便,限制了用戶的活動(dòng)范圍。頭戴式顯示器,佩戴于用戶的頭部,這種顯示器本身提供了一路或兩路攝像機(jī),采用視頻合成技術(shù),為用戶提供場(chǎng)景的顯示。但是頭戴式顯示器在戶外長(zhǎng)時(shí)間佩戴很不舒服,因此也不能為用戶廣泛接受。手持式顯示器,較頭戴式顯示器稍有改進(jìn),但是也限制了用戶手部的活動(dòng)。投影式顯示器能夠?qū)?chǎng)景投影到較大范圍的環(huán)境中,位置固定,適合于室內(nèi)的AR系統(tǒng)。
3.2 定位技術(shù)
增強(qiáng)現(xiàn)實(shí)系統(tǒng)需要將虛擬的物體準(zhǔn)確地放置到真實(shí)的場(chǎng)景中,因此定位技術(shù)顯得尤為重要。目前的定位技術(shù)主要分為兩種:一種是基于硬件的定位技術(shù);一種是基于計(jì)算機(jī)視覺技術(shù)的定位技術(shù)。
基于硬件的定位技術(shù)一般使用硬件設(shè)備定位,主要包括:全球衛(wèi)星定位系統(tǒng)、測(cè)距儀、導(dǎo)航儀、機(jī)械裝置等。
基于計(jì)算機(jī)視覺的定位技術(shù)一般是從真實(shí)場(chǎng)景中獲得一幅或多幅圖像,根據(jù)圖像中的信息,計(jì)算出攝像機(jī)和圖形中物體的相對(duì)信息,最終恢復(fù)出三維場(chǎng)景的結(jié)構(gòu),從而達(dá)到定位的目的。
基于計(jì)算機(jī)視覺的定位技術(shù)主要包括以下幾種:
(1)單視圖法:在一幅圖像中找到六個(gè)以上特征點(diǎn)進(jìn)行跟蹤,通過已知的特征點(diǎn)的三維坐標(biāo)和其成像坐標(biāo)進(jìn)行定位。
(2)多視圖法:從多個(gè)角度拍攝場(chǎng)景,根據(jù)常用的角點(diǎn)檢測(cè)法,檢測(cè)多幅圖像的角點(diǎn)并進(jìn)行匹配,從而計(jì)算出真實(shí)場(chǎng)景中物體的景深,最終實(shí)現(xiàn)定位。
(3)運(yùn)動(dòng)目標(biāo)的序列圖像:根據(jù)序列圖像估算運(yùn)動(dòng)目標(biāo)的各項(xiàng)參數(shù)。
(4)模板匹配法:從多個(gè)視角出發(fā)尋找真實(shí)圖像中的物體作為模板數(shù)字化圖像,繼而將虛擬物體疊加到真實(shí)場(chǎng)景。
3.3 虛實(shí)融合技術(shù)
增強(qiáng)現(xiàn)實(shí)技術(shù)中的虛擬融合主要指虛擬物體在真實(shí)場(chǎng)景中的配準(zhǔn),以及虛擬物體與真實(shí)場(chǎng)景的一致性。
在增強(qiáng)現(xiàn)實(shí)系統(tǒng)的實(shí)現(xiàn)過程中,一致性是一個(gè)關(guān)鍵性問題。虛實(shí)融合的一致性包括動(dòng)態(tài)一致性和靜態(tài)一致性。其中,動(dòng)態(tài)一致性通常指場(chǎng)景的實(shí)時(shí)繪制,跟蹤過程中虛擬物體和真實(shí)場(chǎng)景的空間位置的一致性等;靜態(tài)一致性通常指虛擬物體與真實(shí)場(chǎng)景外觀的一致性變化等。
另一方面,為了實(shí)現(xiàn)很好的虛實(shí)融合效果,必須對(duì)拍攝真實(shí)場(chǎng)景的相機(jī)進(jìn)行標(biāo)定,并與繪制虛擬物體的虛擬相機(jī)參數(shù)進(jìn)行匹配。攝像機(jī)標(biāo)定主要是對(duì)攝像機(jī)的內(nèi)外參數(shù)的確定。目前,攝像機(jī)標(biāo)定技術(shù)已經(jīng)較為成熟,主要可以分為三類:傳統(tǒng)的標(biāo)定法,如張正友標(biāo)定法;自標(biāo)定法,如基于Kruppa方程的自標(biāo)定法;基于主動(dòng)視覺的標(biāo)定法,如基于射影重建的標(biāo)定法。三類標(biāo)定法各有利弊,并沒有一種可以普遍適用,因此攝像機(jī)標(biāo)定技術(shù)仍是一個(gè)研究重點(diǎn)。
3.4 用戶交互技術(shù)
人們總是向往能夠使用自然的方式和虛擬的物體交互,但這是十分困難的,增強(qiáng)現(xiàn)實(shí)系統(tǒng)根據(jù)跟蹤定位獲得的有關(guān)真實(shí)場(chǎng)景的信息對(duì)虛擬物體發(fā)出指令。目前,交互技術(shù)主要使用以下三種方式:
(1)在場(chǎng)景中選擇一個(gè)或多個(gè)特征點(diǎn)作為標(biāo)記點(diǎn),這是增強(qiáng)現(xiàn)實(shí)系統(tǒng)中最基本的交互方式。
(2)使用計(jì)算機(jī)識(shí)別出人或物體的姿態(tài),進(jìn)而交互操作。
(3)制作特殊工具,能夠通過按鍵等簡(jiǎn)單方式觸發(fā)事件。
4 結(jié)束語(yǔ)
本文總結(jié)了現(xiàn)階段增強(qiáng)現(xiàn)實(shí)技術(shù)的應(yīng)用領(lǐng)域,并對(duì)其涉及到的關(guān)鍵技術(shù)進(jìn)行了闡述。增強(qiáng)現(xiàn)實(shí)技術(shù)作為一個(gè)多學(xué)科交叉的研究領(lǐng)域,必將飛速發(fā)展,更多的融入到我們的生活中。
參考文獻(xiàn):
[1]紀(jì)慶革,潘志庚,李祥晨.虛擬現(xiàn)實(shí)在體育體育仿真中的應(yīng)用綜述[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2003,15(11):1333-1338.
[2]陳靖,王涌天,閆達(dá)遠(yuǎn).增強(qiáng)現(xiàn)實(shí)系統(tǒng)及其應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2001,15:72-75.
[3]Milgram Pand Kishino F.A taxonomy of mixed reality visual displays[J].IEICE Trans.Information Systems,1994,E772D(12):1321-1329.
【關(guān)鍵詞】機(jī)器視覺;VisionPro;識(shí)別定位;
1.引言
自20世紀(jì)80年代以來,機(jī)器視覺技術(shù)開始高速發(fā)展,已經(jīng)從實(shí)驗(yàn)室走向了人們生產(chǎn)生活的各個(gè)方面。機(jī)器視覺系統(tǒng)的特點(diǎn)是提高生產(chǎn)的柔性和自動(dòng)化程度。在一些不適合于人工作業(yè)的危險(xiǎn)工作環(huán)境或人工視覺難以滿足要求的場(chǎng)合,常用機(jī)器視覺來替代人工視覺;同時(shí)在大批量工業(yè)生產(chǎn)過程中用機(jī)器視覺檢測(cè)方法可以大大提高生產(chǎn)效率和生產(chǎn)的自動(dòng)化程度。而且機(jī)器視覺易于實(shí)現(xiàn)信息集成,是實(shí)現(xiàn)計(jì)算機(jī)集成制造的基礎(chǔ)技術(shù)。現(xiàn)今,在機(jī)器視覺領(lǐng)域已經(jīng)有了一些成熟的視覺開發(fā)軟件,其封裝了很多可靠、高效的算法和工具。本文選用美國(guó)康耐視公司的VisionPro軟件,這是一套基于PC架構(gòu)的視覺系統(tǒng)軟件開發(fā)包,主要應(yīng)用于各種復(fù)雜的機(jī)器視覺領(lǐng)域。它集成了用于定位、檢測(cè)、識(shí)別和通訊等任務(wù)的工具庫(kù),可用C#、VB和VC等語(yǔ)言進(jìn)行二次開發(fā)。本文基于VisionPro利用語(yǔ)言進(jìn)行視覺定位系統(tǒng)的軟件開發(fā)[1]。
2.視覺定位系統(tǒng)
2.1 硬件組成
在圖像處理前首先要得到清晰、有效的圖像,這就需要有一套完整的硬件設(shè)備。一般主要包括照明用的光源、調(diào)節(jié)圖像清晰度的鏡頭、將圖像轉(zhuǎn)換為數(shù)字信號(hào)的攝像機(jī)和進(jìn)行圖像處理的計(jì)算機(jī)。其中攝像機(jī)與計(jì)算機(jī)之間的接口也比很重要的,主要分為IEEE1394和采集卡,USB2.0或Gigabit Ethernet千兆網(wǎng)三種[2]。
本視覺系統(tǒng)采用的是日本FUJINON工業(yè)攝像頭,德國(guó)BASLER工業(yè)像機(jī)ACA1600-20GM,GigE千兆網(wǎng)接口。
2.2 基于VisionPro的軟件開發(fā)
本視覺定位系統(tǒng)利用編寫適合實(shí)驗(yàn)需要的界面,界面中只包含需要的操作功能和數(shù)據(jù),使整個(gè)界面看起來更加清楚簡(jiǎn)單,操作起來更方便。
(1)圖像采集
本視覺系統(tǒng)通過GigE千兆網(wǎng)作為接口控制相機(jī)進(jìn)行圖像采集。打開軟件并連接相機(jī),設(shè)置好參數(shù)后,就可以通過可視化工具Image Source直接獲取圖像。
(2)相機(jī)的標(biāo)定
機(jī)器視覺的基本任務(wù)之一是從攝像機(jī)獲取的圖像信息出發(fā)計(jì)算三維空間中物體的幾何信息,并由此重建和識(shí)別物體??臻g物體表面某點(diǎn)的三維幾何位置與其在圖像中對(duì)應(yīng)點(diǎn)之間的相互關(guān)系是由攝像機(jī)成像的幾何模型決定的,這些幾何模型參數(shù)就是攝像機(jī)參數(shù)。在大多數(shù)條件下,這些參數(shù)必須通過實(shí)驗(yàn)與計(jì)算才能得到,這個(gè)過程被稱為攝像機(jī)標(biāo)定[3]。
本文利用VisionPro的CalibChecker-boardTool工具進(jìn)行攝像機(jī)標(biāo)定。首先需要一個(gè)棋盤板,棋盤板必須滿足以下條件:必須由大小相同的黑白格子交替組成;格子最好是正方形,如果達(dá)不到的話,格子長(zhǎng)寬比也要在0.9和1.0之間。本系統(tǒng)采用康耐視公司提供的標(biāo)準(zhǔn)棋盤板進(jìn)行標(biāo)定[4,5]。圖1是標(biāo)定的結(jié)果。
(3)目標(biāo)識(shí)別與定位
視覺定位的目的就是找出目標(biāo)物的坐標(biāo)位置。本文利用VisionPro的PMAlignTool工具對(duì)目標(biāo)物體進(jìn)行識(shí)別定位。PMAlignTool工具是基于PatMax算法,該算法采用模板定位技術(shù)(pattern-location technology),先訓(xùn)練模板,然后根據(jù)模板對(duì)采集圖像進(jìn)行模板匹配,實(shí)現(xiàn)定位。在訓(xùn)練模板和定位過程中,PatMax不是基于像素柵格(Pixel grid)分析圖像,而是采用基于幾何外形(Features based)的定位方法,通過圖像的幾何特征信息和特征之間的空間位置關(guān)系進(jìn)行模板訓(xùn)練和匹配,使其能夠保證很高的精度和抗干擾性,而且可以高速定位發(fā)生旋轉(zhuǎn)、縮放、甚至拉伸形變的物體[1]。PMAlignTool工具定位的流程如圖2。
通過PMAlignTool工具對(duì)目標(biāo)物體識(shí)別定位后,利用VB調(diào)用該工具下的Results.Item(i).GetPose().TranslationX和Results.Item(i).GetPose().Transl-ationY。這兩個(gè)值就是序號(hào)為i的目標(biāo)物在圖像上的X、Y坐標(biāo)值,其中i為識(shí)別的各個(gè)目標(biāo)物的序號(hào)。
3.實(shí)驗(yàn)
3.1 PatMax識(shí)別定位
在對(duì)攝像機(jī)完成標(biāo)定校正后,運(yùn)用自己編寫的人機(jī)交互界面完成對(duì)目標(biāo)物體進(jìn)行識(shí)別定位,并將所需要的目標(biāo)位置坐標(biāo)顯示在界面上。同時(shí)又將識(shí)別到的所有目標(biāo)物體的坐標(biāo)信息保存到了文本文檔中,方便調(diào)用。主要操作如下:
(1)模型訓(xùn)練。實(shí)驗(yàn)以一元硬幣為目標(biāo)物,圖3為訓(xùn)練完成的模型。
(2)目標(biāo)識(shí)別定位。圖4是利用編寫的界面,在圖像上能夠清楚的顯示出所識(shí)別出的目標(biāo)輪廓和形心位置,界面右方結(jié)果顯示區(qū)內(nèi)可以看到所識(shí)別的目標(biāo)數(shù)量和所需要的目標(biāo)物的坐標(biāo)。
3.2 對(duì)比實(shí)驗(yàn)
視覺定位可以用的軟件和工具包很多,其中應(yīng)用最廣泛的就是Opencv,它是一個(gè)基于(開源)發(fā)行的跨平臺(tái)計(jì)算機(jī)視覺庫(kù),可以運(yùn)行在Linux、Windows和Mac OS操作系統(tǒng)上。它輕量級(jí)而且高效——由一系列 C 函數(shù)和少量 C++ 類構(gòu)成,同時(shí)提供了Python、Ruby、MATLAB等語(yǔ)言的接口,實(shí)現(xiàn)了圖像處理和計(jì)算機(jī)視覺方面的很多通用算法。為了驗(yàn)證PatMax算法定位的準(zhǔn)確性,本文利用Opencv對(duì)相同的圖像進(jìn)行目標(biāo)識(shí)別定位,對(duì)得到的效果圖和坐標(biāo)進(jìn)行對(duì)比[6]。如圖5所示,其中藍(lán)色為輪廓曲線,綠色十字為目標(biāo)形心。
圖6為VisionPro識(shí)別硬幣的效果圖,輪廓和形心均用綠色線標(biāo)識(shí)。對(duì)比兩圖可以看出VisionPro對(duì)輪廓的識(shí)別效果要更好一些。由于形心坐標(biāo)是由輪廓曲線上的點(diǎn)計(jì)算得到的,所以VisionPro獲得的形心坐標(biāo)值也會(huì)比Opencv的更加準(zhǔn)確,而且精確度更高。下表是兩種方法得到的形心坐標(biāo)。
4.結(jié)束語(yǔ)
本文基于VisionPro采用對(duì)其進(jìn)行開發(fā),首先利用VisionPro中的工具進(jìn)行圖像的采集,攝像機(jī)的標(biāo)定,運(yùn)用PatMax算法進(jìn)行目標(biāo)物的識(shí)別與定位,然后運(yùn)用編寫人機(jī)交互界面,可以更加方便快捷的得到所需要的目標(biāo)物坐標(biāo)值。本文利用Opencv對(duì)相同的圖像進(jìn)行目標(biāo)的識(shí)別定位,與VisionPro得到的結(jié)果進(jìn)行實(shí)驗(yàn)對(duì)比。結(jié)果證明基于VisionPro的視覺定位系統(tǒng)對(duì)目標(biāo)的識(shí)別效果更好,定位的數(shù)據(jù)更加準(zhǔn)確。基于該軟件使應(yīng)用程序的開發(fā)更加快速方便,得到的數(shù)據(jù)結(jié)果誤差較小,具有應(yīng)用價(jià)值。
參考文獻(xiàn)
[1]威洛斯,焦宗夏.基于VisionPro的焊膏印刷機(jī)視覺定位系統(tǒng)[C].第十二屆中國(guó)體視學(xué)與圖像分析學(xué)術(shù)年會(huì)論文集,2008.
[2]Carsten Steger,Markus Ulrich,Christean Wiedemann,著.機(jī)器視覺算法與應(yīng)用[M].楊少榮,吳迪靖,段德山,譯.北京:清華大學(xué)出版社,2008.
[3]邱茂林,馬頌德,李毅.計(jì)算機(jī)視覺中攝像機(jī)定標(biāo)綜述[J].自動(dòng)化學(xué)報(bào),2000,26(1):47-59.
[4]Cognex,Cognex MVS-8100D and CDC Cameras Hardware Manual,2006.
[5]Cognex,VisionPro,Net Help,2006.
[6]Bradski G.,Kaehler A.著.學(xué)習(xí)OpenCV[M].于仁琪,劉瑞禎,譯.北京:清華大學(xué)出版社,2009.
作者簡(jiǎn)介:
韓慶瑤(1953—),男,華北電力大學(xué)教授。
張志遠(yuǎn)(1986—),男,華北電力大學(xué)能源動(dòng)力與機(jī)械工程學(xué)院碩士研究生。
關(guān)鍵詞:數(shù)據(jù)融合傳感器無損檢測(cè)精確林業(yè)應(yīng)用
多傳感器融合系統(tǒng)由于具有較高的可靠性和魯棒性,較寬的時(shí)間和空間的觀測(cè)范圍,較強(qiáng)的數(shù)據(jù)可信度和分辨能力,已廣泛應(yīng)用于軍事、工業(yè)、農(nóng)業(yè)、航天、交通管制、機(jī)器人、海洋監(jiān)視和管理、目標(biāo)跟蹤和慣性導(dǎo)航等領(lǐng)域。筆者在分析數(shù)據(jù)融合技術(shù)概念和內(nèi)容的基礎(chǔ)上,對(duì)該技術(shù)在林業(yè)工程中的應(yīng)用及前景進(jìn)行了綜述。
一、數(shù)據(jù)融合
1.1概念的提出
1973年,數(shù)據(jù)融合技術(shù)在美國(guó)國(guó)防部資助開發(fā)的聲納信號(hào)理解系統(tǒng)中得到了最早的體現(xiàn)。
70年代末,在公開的技術(shù)文獻(xiàn)中開始出現(xiàn)基于多系統(tǒng)的信息整合意義的融合技術(shù)。1984年美國(guó)國(guó)防部數(shù)據(jù)融合小組(DFS)定義數(shù)據(jù)融合為:“對(duì)多源的數(shù)據(jù)和信息進(jìn)行多方的關(guān)聯(lián)、相關(guān)和綜合處理,以更好地進(jìn)行定位與估計(jì),并完全能對(duì)態(tài)勢(shì)及帶來的威脅進(jìn)行實(shí)時(shí)評(píng)估”。
1998年1月,Buchroithner和Wald重新定義了數(shù)據(jù)融合:“數(shù)據(jù)融合是一種規(guī)范框架,這個(gè)框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數(shù)據(jù),以獲得實(shí)際需要的信息”。
Wald定義的數(shù)據(jù)融合的概念原理中,強(qiáng)調(diào)以質(zhì)量作為數(shù)據(jù)融合的明確目標(biāo),這正是很多關(guān)于數(shù)據(jù)融合的文獻(xiàn)中忽略但又是非常重要的方面。這里的“質(zhì)量”指經(jīng)過數(shù)據(jù)融合后獲得的信息對(duì)用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關(guān)的信息,甚至可更好地用于開發(fā)項(xiàng)目的資金、人力資源等。
1.2基本內(nèi)容
信息融合是生物系統(tǒng)所具備的一個(gè)基本功能,人類本能地將各感官獲得的信息與先驗(yàn)知識(shí)進(jìn)行綜合,對(duì)周圍環(huán)境和發(fā)生的事件做出估計(jì)和判斷。當(dāng)運(yùn)用各種現(xiàn)代信息處理方法,通過計(jì)算機(jī)實(shí)現(xiàn)這一功能時(shí),就形成了數(shù)據(jù)融合技術(shù)。
數(shù)據(jù)融合就是充分利用多傳感器資源,通過對(duì)這些多傳感器及觀測(cè)信息的合理支配和使用,把多傳感器在空間或時(shí)間上的冗余或互補(bǔ)信息依據(jù)某些準(zhǔn)則進(jìn)行組合,以獲得被測(cè)對(duì)象的一致性解釋或描述。數(shù)據(jù)融合的內(nèi)容主要包括:
(1)數(shù)據(jù)關(guān)聯(lián)。確定來自多傳感器的數(shù)據(jù)反映的是否是同源目標(biāo)。
(2)多傳感器ID/軌跡估計(jì)。假設(shè)多傳感器的報(bào)告反映的是同源目標(biāo),對(duì)這些數(shù)據(jù)進(jìn)行綜合,改進(jìn)對(duì)該目標(biāo)的估計(jì),或?qū)φ麄€(gè)當(dāng)前或未來情況的估計(jì)。
(3)采集管理。給定傳感器環(huán)境的一種認(rèn)識(shí)狀態(tài),通過分配多個(gè)信息捕獲和處理源,最大限度地發(fā)揮其性能,從而使其操作成本降到最低。傳感器的數(shù)據(jù)融合功能主要包括多傳感器的目標(biāo)探測(cè)、數(shù)據(jù)關(guān)聯(lián)、跟蹤與識(shí)別、情況評(píng)估和預(yù)測(cè)。
根據(jù)融合系統(tǒng)所處理的信息層次,目前常將信息融合系統(tǒng)劃分為3個(gè)層次:
(l)數(shù)據(jù)層融合。直接將各傳感器的原始數(shù)據(jù)進(jìn)行關(guān)聯(lián)后,送入融合中心,完成對(duì)被測(cè)對(duì)象的綜合評(píng)價(jià)。其優(yōu)點(diǎn)是保持了盡可能多的原始信號(hào)信息,但是該種融合處理的信息量大、速度慢、實(shí)時(shí)性差,通常只用于數(shù)據(jù)之間配準(zhǔn)精度較高的圖像處理。
(2)特征層融合。從原始數(shù)據(jù)中提取特征,進(jìn)行數(shù)據(jù)關(guān)聯(lián)和歸一化等處理后,送入融合中心進(jìn)行分析與綜合,完成對(duì)被測(cè)對(duì)象的綜合評(píng)價(jià)。這種融合既保留了足夠數(shù)量的原始信息,又實(shí)現(xiàn)了一定的數(shù)據(jù)壓縮,有利于實(shí)時(shí)處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應(yīng)用較多的一種技術(shù)。但是該技術(shù)在復(fù)雜環(huán)境中的穩(wěn)健性和系統(tǒng)的容錯(cuò)性與可靠性有待進(jìn)一步改善。
(3)決策層融合。首先每一傳感器分別獨(dú)立地完成特征提取和決策等任務(wù),然后進(jìn)行關(guān)聯(lián),再送入融合中心處理。這種方法的實(shí)質(zhì)是根據(jù)一定的準(zhǔn)則和每個(gè)決策的可信度做出最優(yōu)的決策。其優(yōu)點(diǎn)是數(shù)據(jù)通訊量小、實(shí)時(shí)性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個(gè)或幾個(gè)傳感器失效時(shí),系統(tǒng)仍能繼續(xù)工作,具有良好的容錯(cuò)性,系統(tǒng)可靠性高,因此是目前信息融合研究的一個(gè)熱點(diǎn)。但是這種技術(shù)也有不足,如原始信息的損失、被測(cè)對(duì)象的時(shí)變特征、先驗(yàn)知識(shí)的獲取困難,以及知識(shí)庫(kù)的巨量特性等。
1.3處理模型
美國(guó)數(shù)據(jù)融合工作小組提出的數(shù)據(jù)融合處理模型,當(dāng)時(shí)僅應(yīng)用于軍事方面,但該模型對(duì)人們理解數(shù)據(jù)融合的基本概念有重要意義。模型每個(gè)模塊的基本功能如下:
數(shù)據(jù)源。包括傳感器及其相關(guān)數(shù)據(jù)(數(shù)據(jù)庫(kù)和人的先驗(yàn)知識(shí)等)。
源數(shù)據(jù)預(yù)處理。進(jìn)行數(shù)據(jù)的預(yù)篩選和數(shù)據(jù)分配,以減輕融合中心的計(jì)算負(fù)擔(dān),有時(shí)需要為融合中心提供最重要的數(shù)據(jù)。目標(biāo)評(píng)估。融合目標(biāo)的位置、速度、身份等參數(shù),以達(dá)到對(duì)這些參數(shù)的精確表達(dá)。主要包括數(shù)據(jù)配準(zhǔn)、跟蹤和數(shù)據(jù)關(guān)聯(lián)、辨識(shí)。
態(tài)勢(shì)評(píng)估。根據(jù)當(dāng)前的環(huán)境推斷出檢測(cè)目標(biāo)與事件之間的關(guān)系,以判斷檢測(cè)目標(biāo)的意圖。威脅評(píng)估。結(jié)合當(dāng)前的態(tài)勢(shì)判斷對(duì)方的威脅程度和敵我雙方的攻擊能力等,這一過程應(yīng)同時(shí)考慮當(dāng)前的政治環(huán)境和對(duì)敵策略等因素,所以較為困難。
處理過程評(píng)估。監(jiān)視系統(tǒng)的性能,辨識(shí)改善性能所需的數(shù)據(jù),進(jìn)行傳感器資源的合理配置。人機(jī)接口。提供人與計(jì)算機(jī)間的交互功能,如人工操作員的指導(dǎo)和評(píng)價(jià)、多媒體功能等。
二、多傳感器在林業(yè)中的應(yīng)用
2.1在森林防火中的應(yīng)用
在用MODIS(ModerateResolutionImagingSpectroradiometer)數(shù)據(jù)測(cè)定森林火點(diǎn)時(shí)的20、22、23波段的傳感器輻射值已達(dá)飽和狀態(tài),用一般圖像增強(qiáng)處理方法探測(cè)燃燒區(qū)火點(diǎn)的結(jié)果不理想。余啟剛運(yùn)用數(shù)據(jù)融合技術(shù),在空間分辨率為1000m的熱輻射通道的數(shù)據(jù)外加入空間分辨率為250m的可見光通道的數(shù)據(jù),較好地進(jìn)行了不同空間分辨率信息的數(shù)據(jù)融合,大大提高了對(duì)火點(diǎn)位置的判斷準(zhǔn)確度。為進(jìn)一步提高衛(wèi)星光譜圖像數(shù)據(jù)分析的準(zhǔn)確性與可靠性,利用原有森林防火用的林區(qū)紅外探測(cè)器網(wǎng),將其與衛(wèi)星光譜圖像數(shù)據(jù)融合,可以使計(jì)算機(jī)獲得GPS接收機(jī)輸出的有關(guān)信息通過與RS實(shí)現(xiàn)高效互補(bǔ)性融合,從而彌補(bǔ)衛(wèi)星圖譜不理想的缺失區(qū)數(shù)據(jù)信息,大大提高燃燒區(qū)火點(diǎn)信息準(zhǔn)確度和敏感性。
2.2森林蓄積特征的估計(jì)
HampusHolmstrom等在瑞典南部的試驗(yàn)區(qū)將SPOT-4×S衛(wèi)星數(shù)據(jù)和CARABAS-IIVHFSAR傳感器的雷達(dá)數(shù)據(jù)進(jìn)行了融合,采用KNN(knearestneighbor)方法對(duì)森林的蓄積特征(林分蓄積、樹種組成與年齡)進(jìn)行了估計(jì)。
KNN方法就是采用目標(biāo)樣地鄰近k個(gè)(k=10)最近樣地的加權(quán)來估計(jì)目標(biāo)樣地的森林特征。研究者應(yīng)用衛(wèi)星光譜數(shù)據(jù)、雷達(dá)數(shù)據(jù)融合技術(shù)對(duì)試驗(yàn)區(qū)的不同林分的蓄積特征進(jìn)行估計(jì),并對(duì)三種不同的數(shù)據(jù)方法進(jìn)行誤差分析。試驗(yàn)表明,融合后的數(shù)據(jù)作出的估計(jì)比單一的衛(wèi)星數(shù)據(jù)或雷達(dá)數(shù)據(jù)的精度高且穩(wěn)定性好。
2.3用非垂直航空攝像數(shù)據(jù)融合GIS信息更新調(diào)查數(shù)據(jù)
森林資源調(diào)查是掌握森林資源現(xiàn)狀與變化的調(diào)查方法,一般以地面調(diào)查的方法為主,我國(guó)5年復(fù)查一次。由于森林資源調(diào)查的工作量巨大,且要花費(fèi)大量的人力、物力和資金。國(guó)內(nèi)外許多學(xué)者都在探索航空、航天的遙感調(diào)查與估計(jì)方法。
TrevorJDavis等2002年提出采用非垂直的航空攝影數(shù)據(jù)融合對(duì)應(yīng)的GIS數(shù)據(jù)信息實(shí)現(xiàn)森林調(diào)查數(shù)據(jù)的快速更新,認(rèn)為對(duì)森林資源整體而言,僅某些特殊地區(qū)的資源數(shù)據(jù)需要更新。在直升飛機(jī)側(cè)面裝上可視的數(shù)字?jǐn)z像裝置,利用GPS對(duì)測(cè)點(diǎn)進(jìn)行定位,對(duì)特殊地區(qū)的攝像進(jìn)行拍攝,同時(shí)與對(duì)應(yīng)的GIS數(shù)據(jù)進(jìn)行融合,做出資源變化的估計(jì)或影像的修正。
試驗(yàn)表明,融合后的數(shù)據(jù)可以同高分辨率矯正圖像相比,該方法花費(fèi)少,精度高,能充分利用影像的可視性,應(yīng)用于偏遠(yuǎn)、地形復(fù)雜、不易操作、成本高的區(qū)域,同時(shí)可避免遙感圖像受云層遮蓋。
三、數(shù)據(jù)融合在林業(yè)中的應(yīng)用展望
3.1在木材檢測(cè)中的應(yīng)用
3.1.1木材缺陷及其影響
木材是天然生長(zhǎng)的有機(jī)體,生長(zhǎng)過程中不可避免地有尖削度、彎曲度、節(jié)子等生長(zhǎng)缺陷,這些缺陷極大地影響了木材及其制品的優(yōu)良特性,以及木材的使用率、強(qiáng)度、外觀質(zhì)量,并限制了其應(yīng)用領(lǐng)域。在傳統(tǒng)木制品生產(chǎn)過程中,主要依靠人的肉眼來識(shí)別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識(shí)別起來非常困難,勞動(dòng)強(qiáng)度大,效率低,同時(shí)由于熟練程度、標(biāo)準(zhǔn)掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識(shí)別嚴(yán)重影響了生產(chǎn)線的生產(chǎn)節(jié)拍。因此必須開發(fā)一種能夠?qū)Π宀碾p面缺陷進(jìn)行在線識(shí)別和自動(dòng)剔除技術(shù),以解決集成材加工中節(jié)子人工識(shí)別誤差大、難以實(shí)現(xiàn)雙面識(shí)別、剔除機(jī)械調(diào)整時(shí)間長(zhǎng)等問題。
3.1.2單一傳感器在木材檢測(cè)中的應(yīng)用
對(duì)木材及人造板進(jìn)行無損檢測(cè)的方法很多,如超聲波、微波、射線、機(jī)械應(yīng)力、震動(dòng)、沖擊應(yīng)力波、快速傅立葉變換分析等檢測(cè)方法。超聲技術(shù)在木材工業(yè)中的應(yīng)用研究主要集中在研究聲波與木材種類、木材結(jié)構(gòu)和性能之間的關(guān)系、木材結(jié)構(gòu)及缺陷分析、膠的固化過程分析等。
隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展,人們也將視覺傳感器應(yīng)用于木材檢測(cè)中。新西蘭科學(xué)家用視頻傳感器研究和測(cè)量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時(shí)準(zhǔn)確地測(cè)量單個(gè)纖維和全部纖維的幾何尺寸及其變化趨勢(shì),能夠區(qū)分不同紙漿類型,測(cè)定木材纖維材料加固結(jié)合力,并動(dòng)態(tài)地觀察木材纖維在材料中的結(jié)合機(jī)理。
新西蘭的基于視覺傳感器的板材缺陷識(shí)別的軟件已經(jīng)產(chǎn)業(yè)化,該軟件利用數(shù)碼相機(jī)或激光掃描儀采集板材的圖像,自動(dòng)識(shí)別板材節(jié)子和缺陷的位置,控制板材的加工。該軟件還具有進(jìn)行原木三維模型真實(shí)再現(xiàn)的計(jì)算機(jī)視覺識(shí)別功能,利用激光掃描儀自動(dòng)采集原木的三維幾何數(shù)據(jù)。
美國(guó)林產(chǎn)品實(shí)驗(yàn)室利用計(jì)算機(jī)視覺技術(shù)對(duì)木材刨花的尺寸大小進(jìn)行分級(jí),確定各種刨花在板中的比例和刨花的排列方向;日本京都大學(xué)基于視覺傳感器進(jìn)行了定向刨花板內(nèi)刨花定向程度的檢測(cè),從而可以通過調(diào)整定向鋪裝設(shè)備優(yōu)化刨花的排列方向來提高定向刨花板的強(qiáng)度。
在制材加工過程中,利用計(jì)算機(jī)視覺技術(shù)在線實(shí)時(shí)檢測(cè)原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時(shí)可對(duì)鋸材的質(zhì)量進(jìn)行分級(jí),實(shí)現(xiàn)木材的優(yōu)化使用;在膠合板的生產(chǎn)過程中,利用計(jì)算機(jī)視覺技術(shù)在線實(shí)時(shí)檢測(cè)單板上的各種缺陷,實(shí)現(xiàn)單板的智能和自動(dòng)剪切,并可測(cè)量在剪切過程中的單板破損率,對(duì)單板進(jìn)行分等分級(jí),實(shí)現(xiàn)自動(dòng)化生產(chǎn)過程。Wengert等在綜合了大量的板材分類經(jīng)驗(yàn)的基礎(chǔ)上,建立了板材分級(jí)分類的計(jì)算機(jī)視覺專家系統(tǒng)。在國(guó)內(nèi)這方面的研究較少,王金滿等用計(jì)算機(jī)視覺技術(shù)對(duì)刨花板施膠效果進(jìn)行了定量分析。
X射線對(duì)木材及木質(zhì)復(fù)合材料的性能檢測(cè)已得到了廣泛的應(yīng)用,目前該技術(shù)主要應(yīng)用于對(duì)木材密度、含水率、纖維素相對(duì)結(jié)晶度和結(jié)晶區(qū)大小、纖維的化學(xué)結(jié)構(gòu)和性質(zhì)等進(jìn)行檢測(cè),并對(duì)木材內(nèi)部的各種缺陷進(jìn)行檢測(cè)。
3.1.3數(shù)據(jù)融合在木材檢測(cè)中的應(yīng)用展望
單一傳感器在木材工業(yè)中已得到了一定程度的應(yīng)用,但各種單項(xiàng)技術(shù)在應(yīng)用上存在一定的局限性。如視覺傳感器不能檢測(cè)到有些與木材具有相同顏色的節(jié)子,有時(shí)會(huì)把木板上的臟物或油脂當(dāng)成節(jié)子,造成誤判,有時(shí)也會(huì)受到木材的種類或粗糙度和濕度的影響,此外,這種技術(shù)只能檢測(cè)部分表面缺陷,而無法檢測(cè)到內(nèi)部缺陷;超聲、微波、核磁共振和X射線技術(shù)均能測(cè)量密度及內(nèi)部特征,但是它們不能測(cè)定木材的顏色和瑕疵,因?yàn)檫@些缺陷的密度往往同木板相同。因此,一個(gè)理想的檢測(cè)系統(tǒng)應(yīng)該集成各種傳感技術(shù),才能準(zhǔn)確、可靠地檢測(cè)到木材的缺陷。
基于多傳感器(機(jī)器視覺及X射線等)數(shù)據(jù)融合技術(shù)的木材及木制品表面缺陷檢測(cè),可以集成多個(gè)傳統(tǒng)單項(xiàng)技術(shù),更可靠、準(zhǔn)確地實(shí)時(shí)檢測(cè)出木材表面的各種缺陷,為實(shí)現(xiàn)木材分級(jí)自動(dòng)化、智能化奠定基礎(chǔ),同時(shí)為集裁除鋸、自動(dòng)調(diào)整、自動(dòng)裁除節(jié)子等為一身的新型視頻識(shí)別集成材雙面節(jié)子數(shù)控自動(dòng)剔除成套設(shè)備提供技術(shù)支持。
3.2在精確林業(yè)中的應(yīng)用
美國(guó)華盛頓大學(xué)研究人員開展了樹形自動(dòng)分析、林業(yè)作業(yè)規(guī)劃等研究工作;Auburn大學(xué)的生物系統(tǒng)工程系和USDA南方林業(yè)實(shí)驗(yàn)站與有關(guān)公司合作開展用GPS和其他傳感器研究林業(yè)機(jī)器系統(tǒng)的性能和生產(chǎn)效率。
目前單項(xiàng)的GPS、RS、GIS正從“自動(dòng)化孤島”形式應(yīng)用于林業(yè)生產(chǎn)向集成技術(shù)轉(zhuǎn)變。林業(yè)生產(chǎn)系統(tǒng)作為一個(gè)多組分的復(fù)雜系統(tǒng),是由能量流動(dòng)、物質(zhì)循環(huán)、信息流動(dòng)所推動(dòng)的具有一定的結(jié)構(gòu)和功能的復(fù)合體,各組分間的關(guān)系和結(jié)合方式影響系統(tǒng)整體的結(jié)構(gòu)和功能。因此應(yīng)該在計(jì)算機(jī)集成系統(tǒng)框架下,有效地融合GPS、GIS、RS等數(shù)據(jù),解決這些信息在空間和時(shí)間上的質(zhì)的差異及空間數(shù)據(jù)類型的多樣性,如地理統(tǒng)計(jì)數(shù)據(jù)、柵格數(shù)據(jù)、點(diǎn)數(shù)據(jù)等。利用智能DSS(決策支持系統(tǒng))以及VRT(可變量技術(shù))等,使林業(yè)生產(chǎn)成為一個(gè)高效、柔性和開放的體系,從而實(shí)現(xiàn)林業(yè)生產(chǎn)的標(biāo)準(zhǔn)化、規(guī)范化、開放性,建立基于信息流融合的精確林業(yè)系統(tǒng)。
南京林業(yè)大學(xué)提出了“精確林業(yè)工程系統(tǒng)”。研究包括精確林業(yè)工程系統(tǒng)的領(lǐng)域體系結(jié)構(gòu)、隨時(shí)空變化的數(shù)據(jù)采集處理與融合技術(shù)、精確控制林業(yè)生產(chǎn)的智能決策支持系統(tǒng)、可變量控制技術(shù)等,實(shí)現(xiàn)基于自然界生物及其所賴以生存的環(huán)境資源的時(shí)空變異性的客觀現(xiàn)實(shí),以最小資源投入、最小環(huán)境危害和最大產(chǎn)出效益為目標(biāo),建立關(guān)于林業(yè)管理系統(tǒng)戰(zhàn)略思想的精確林業(yè)微觀管理系統(tǒng)。
[參考文獻(xiàn)]
級(jí)別:北大期刊
榮譽(yù):Caj-cd規(guī)范獲獎(jiǎng)期刊
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:北大期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)