&

前言：一篇好文章的誕生，需要你不斷地搜集資料、整理思路，本站小編為你收集了豐富的計算機視覺研究的目的主題范文，僅供參考，歡迎閱讀并收藏。

計算機視覺研究的目的

第1篇：計算機視覺研究的目的范文

關鍵詞：雙目視覺；匹配算法；計算機視覺；立體匹配；相位一致性

1.計算機視覺系統分析研究

1.1計算機視覺技術及雙目立體視覺

計算機視覺是通過計算機技術實現對視覺信息處理的整個過程，是一門新的學科。視覺是人們認知事物的重要途徑，視覺是人們對視覺信息獲取、處理和存儲的過程。隨著計算機技術的發展，信號處理技術的應用，人們通過照相機來把實際的事物拍攝下來轉變為數字信息，并通過計算機信號處理技術隊獲取的視覺信號進行處理。計算機視覺技術對圖像的處理分為獲取圖像、特征抽象選取、事物識別及分類和對三維信息的理解。獲取圖像主要是通過攝像機和紅外線等技術對周圍視覺事物進行獲取，并通過計算得到和真實事物相應的二維圖像，二維圖像主要是數字圖像。計算機視覺系統的最基本的功能是數字圖像的獲取。可以看出計算機視覺研究最基本內容是三維場景距離信息的獲取。在計算機被動測量距離方法中，有一種重要的距離感知技術叫作雙目立體視覺。雙目立體視覺技術是其他計算機視覺技術無法取代的一種技術，對雙目立體視覺技術的研究在計算機視覺技術和工程應用方面都是非常重要的。

1.2計算機視覺理論框架

第一個視覺系統理論框架的提出是以信息處理為基礎，綜合了圖像處理和神經生理學等研究內容而建立的。這個視覺系統理論框架是計算機視覺系統的基本框架，與計算機視覺技術有著密切的關系。視覺系統的研究是以信息處理為基礎的，從理論層次、算法層次和硬件層次3個層次進行研究。計算機理論層次主要是表達系統各個部分計算的目的和方法，對視覺系統的輸入和輸出進行規定，輸入作為二維圖像，輸出是以二維圖像為基礎建立起來的三維物體，視覺系統的目的就是對三維物體進行分析和識別，通過計算對二維物置和形狀進行重新建立。算法層次對計算機規定的目標進行計算，算法和計算機表達有關，不同的表達可以通過不同的算法進行實現，在計算機理論的層次上，算法和表達比計算機理論的層次要低。硬件層次是通過硬件來實現算法的一種表達方法。計算機理論層次在計算機信息處理中時最高的層次，取決于計算機的本質是解決計算機的自身問題，不是取決于計算問題的計算機硬件。要更好地對計算機系統和框架進行理解最好的方法就是要區分3個不同的層次，計算機理論的含義和主要解決的問題是計算機的目的，表達算法含義和主要解決的問題是實現計算理論的方法和輸入輸出的表達，硬件的實現的含義和主要解決的問題是如何在物理上對表達和算法進行實現。計算機視覺處理的可以分為3個階段，對視覺信息的處理過程從最初的二維圖像的原始數據，到三維環境的表達。第一階段基元圖的構成，基元圖是用來表示二維圖像中的重要信息，主要是圖像中亮度變化位置及其幾何分布和組織結構，圖像中每點的亮度值包括零交叉、斑點、端點和不連續點、邊緣等。第二階段2.5維圖描述，在以觀測者為中心的坐標中，表示可見表面的方向、深度值和不連續的輪廓，基元是局部表面朝向離觀測者的距離深度上的不連續點表面朝向的不連續點。第三階段三維模型表示，在以物體為中心的坐標系中，有由體積單元和面積單元構成的模塊化多層次表示，描述形狀及其空間組織形式，分層次組成若干三維模型，每個三維模型都是在幾個軸線空間的基礎上構成的，所有體積單元或面積形狀基元都附著在軸線上。視覺理論框架圖如圖1所示。

2.基于計算機的視覺立體匹配算法研究

視覺立體匹配算法是基于人類視覺系統的一種計算機算法。立體匹配算法作為計算機立體視覺問題研究的重點，快速地實現圖像對應點的匹配來獲得視差圖是當今研究的熱點問題。立體視覺匹配算法根據基元匹配的不同可以分為相位匹配、區域匹配和特征匹配3種，其中區域匹配算法可以減少計算負擔，區域匹配算法實時性高，應用前景廣闊。計算機立體視覺通過對人的雙眼進行模仿，在雙眼的立體感知中獲得信息，從攝像機拍攝的圖像中獲取物體的三維深度信息，這就是深度圖的獲取，把深度圖經過處理得到三維空間信息數據，二維圖像到三維空間實現轉換。深度的獲取在雙目立體成像視覺系統中分為兩步，首先在雙目立體圖像與圖像之間建立點對點的對象關系，雙目立體視覺算法研究的重點問題是解決對應點之間的匹配問題。其次以對應點之間的視差為依據對深度值進行計算。雙目成像是獲取同一場景中兩幅不同的圖像，兩個單目成像模型構成一個雙目成像模型。雙目成像示意圖如圖2所示。系統的基線B是兩個鏡頭中心的連接線，空間點w（z，y，z）作為世界坐標的值由（x1，y1）與（x2，y2）進行確定，如果攝像機的坐標位置和空間點w世界坐標的位置重合，圖像平面和世界坐標軸xY的平面就是平行的。如果兩個攝像機在坐標系統中的原點不同但是它們的光軸平行，那么雙目成像計算人們可以看圖3所示，圖3表示的是兩個攝像頭連線在平臺xY的示意。

立體視覺的成像過程是成像的逆過程，具有一定的不確定性。大量的數據信息在從三維影像向二維圖像進行投影的過程會出現丟失的現象，所以視覺系統要通過自然的約束條件才能保證獲取正確的解。這些約束條件在減少匹配的計算量方面可以提供有利的幫助。針對基于區域匹配快速算法，還可以應用基于視差梯度的匹配算法，這種匹配算法應用較大的搜索范圍在邊緣的特征點上進行搜索，采用視差梯度在非邊緣區減少搜索范圍。應用計算機視覺立體匹配算法可以減少成像匹配時間，大大提高了工作效率。計算機立體匹配算法征點的提取是算法的關鍵問題，今后的研究方向重點是對有效特征點提取方法的研究。

第2篇：計算機視覺研究的目的范文

關鍵詞：計算機視覺；快速開發；框架；模塊化；模塊耦合；底層剝離

中圖分類號：TP311 文獻標識碼：A 文章編號：1009-3044（2012）29-7084-04

在視覺分析實際應用項目中，如何通過建立計算機視覺分析快速開發框架，搭建一個分工明確，快捷有效的圖像學應用處理平臺，提高開發效率，縮短開發時間，已成為項目開發人員關注的重點內容之一。本框架從項目應用和實際需求出發，將計算機視覺技術的核心算法從底層研究工作中剝離，可極大的縮短開發時間，提高開發效率。

在本框架下，開發人員可各司其職，分工、構成和職能劃分明確，框架開發人員只專注于框架接口的定義；算法開發人員只專注于圖像處理與識別等算法的開發；上層應用開發人員只負責抽取出一般的處理流程，專注于項目的具體實現和功能模塊的組合應用。

1 研究與應用

1.1背景

計算機視覺是用攝像機和電腦代替人眼對目標進行識別、跟蹤和測量的機器視覺。系統將獲取的視頻或圖像資料，通過計算機處理成為更適合人眼觀察或傳送給儀器檢測的圖像，其中包括圖像處理、模式識別或圖像識別、景物分析、圖像理解等相關內容，它們之間既有差別，又有相互重疊。

在計算機視覺分析技術中，對于一些復雜的問題，往往不是某單一學科能夠解決的，它需要一系列相關技術的支持。例如：對航道中船舶的識別，獲取的視頻流往往要經過平滑、去噪等圖像處理操作后，便于下一步運用基于直方圖分類器的圖像識別算法來區分船舶和水面，通過圖像分割技術來提取檢測目標。而這些方案的實現中，同一個問題的解決又往往需要有一系列的算法來支持。還是以船舶識別為例，圖像平滑有領域平均、低通濾波等算法；圖像去噪有各種濾波器算法；基于直方圖的分類器也存在決策樹、貝葉斯、SVM等等算法。雖然上述的算法本身沒有優劣之分，但在特定的環境下一定會有某個最佳算法。

因此，在實際應用項目中如何找出其最優路徑，除了需要開發者擁有深厚的圖像學功底，更需要的是通過大量的對比實驗來找出該最優路徑的解決方案。即便如此，也只能解決特定環境下的計算機視覺需求，換個應用場景，上述步驟又需要重新進行，此類過程的重復，既增加了開發成本，又延長了開發時間。

本框架從工程化的角度出發，在不同項目中的計算機視覺軟件開發中，研究如何提高開發結果的復用性，盡量降低上述各條件間的相互依賴關系，將視覺技術的核心算法從底層研究中剝離，達到縮短開發時間，提高開發效率的目的。

1.2研究目標

1）框架系統的扁平化、模塊化；

2）完成處理過程的任意組合，使圖像處理模塊單一化；

3）理行為在處理模塊內部完成，處理結果可通過接口方式進行輸出；

4）處理模塊間的數據流動定義在框架之中，框架負責配置數據流；

5）置好的數據流，通過指定圖像處理模塊實現對物體的識別、行為的識別。

1.3.5框架的效果演示

從右側功能區中選取兩個輸入模塊：MediaOpen00和MediaOpen01，分別打開視頻文件“.＼公司監控視頻.avi”和圖片“.＼Lena.jpg”，任意添加一些圖像處理模塊或者圖像識別模塊，這里我們選取了行人檢測算法、基本全局閾值二值算法、人臉檢測算法、輪廓檢測算法，加入輸出展示模塊用于顯示處理結果。最后我們用曲線將模塊間的輸入輸出點連起來，完成數據流向的配置過程。其中一個輸出點可以連接多個輸入點，但一個輸入點只能接入一個輸出點。

2 結論

隨著計算機視覺技術發展的日新月異，算法的更新和積累將會越來越多。計算機視覺快速開發框架從實際應用工程的角度出發，在不同項目計算機視覺軟件的開發過程中，將視覺技術的核心算法從底層研究中剝離，使視覺分析應用項目中的框架開發人員專注于框架接口定義的開發，而項目中的算法、上層應用等開發人員各司其職，分工明確，不但提高了開發結果的復用性，同時，也降低了項目開發中各條件間的相互依賴關系，縮短了開發時間，提高了開發效率。

參考文獻：

[1] Gary bradski，Adrian Kaebler.《Learning OpenCV》[M].O’Reilly Media Inc，2008.

[2] 張廣軍.機器視覺[M].北京：科學出版社，2005.

[3] 張少輝，沈曉蓉，范耀祖.一種基于圖像特征點提取及匹配的方法[J].北京航空航天大學學報，2008，34（5）.

[4] 劉立，彭復員，趙坤，萬亞平.采用簡化SIFT算法實現快速圖像匹配[J].紅外與激光工程，2008，37（1）.

[5] 戴斌，方宇強，孫振平，王亮.基于光流技術的運動目標檢測和跟蹤方法研究[D].國防科學技術大學機電工程與自動化學院.

[6] 陳勝勇，劉盛.基于OpenCV的計算機視覺技術實現[M].科學出版社.

第3篇：計算機視覺研究的目的范文

關鍵詞：計算機視覺；案例推理；圖像處理；圖像描述

中圖分類號：TP391.41 文獻標識碼：A文章編號：1009-3044(2007)04-11102-03

1 引言

基于案例推理(case-base reasoning)是人工智能中正不斷發展的一項重要推理技術。基于案例推理與類比推理方法相似，案例推理將舊經驗或教訓轉換為知識，出現新問題時，首先查找以前是否有相似的案例，并用相似案例解決新問題。如果沒遇到相似案例的,經過推理后解決新問題的方法，又會成為新的案例或新經驗，下一次再遇到相同問題時，就可以復用這些案例或經驗。

這與人遇到問題時，首先會用經驗思考解決問題的方式相似，這也是解決問題較好的方法。基于案例推理應用于工業產品檢測或故障診斷時具有以下特點：

CBR智能化程度較高。利用案例中隱含的難以規則化的知識，以輔助規則推理的不足，提高故障診斷系統的智能化程度。

CBR較好解決“知識獲取”的瓶頸。CBR知識表示以案例為基礎，案例的獲取比規則獲取要容易，大大簡化知識獲取的過。

CBR求解效率較高。是對過去的求解結果進行復用，而不是再次從頭開始推導，可以提高對新問題的求解效率。

CBR求解的質量較高。CBR以過去求解成功或失敗的經歷，可以指導當前求解時該怎樣走向成功或避開失敗。

CBR持續不斷的學習能力，使得它可以適應于將來問題的解決。

所以基于案例推理方法正不斷應用在產品質量檢測和設備故障診斷方面，并取得較好的經濟效益。為了產品檢測和設備故障診斷中，更為智能化，更容易實現現場檢測和診斷，計算機視覺技術起到很大的作用。

計算機視覺是研究用計算機來模擬人和生物的視覺系統功能的技術學科，使計算機具有感知周圍視覺世界的能力。通過計算機視覺，進行圖像的獲取預處理、圖像分割與特征抽取、識別與分類、三維信息理解、景物描述、圖像解釋，讓計算機具有對周圍世界的空間物體進行傳感、抽象、判斷的能力，從而達到識別、理解的目的。

計算機視覺隨著科學技術發展，特別計算機技術、通信技術、圖像采集技術、傳感器技術等，以及神經網絡理論、模糊數學理論、小波的分析理論等計算機視覺理論的不斷發展和日趨成熟，使計算機視覺從上世紀60年代開始興起發展到現在，取得快速發展，已經從簡單圖像質量處理發展到圍繞著紋理分析、圖像編碼、圖像分割和濾波等研究。圖像的分析與處理，也由靜止轉向運動，由二維轉向三維，并主要著眼于對圖像的識別和理解上，也使計算機視覺的應用領域更為廣泛，為案例推理中運用計算機視覺打下基礎。

2 案例推理系統的主要關鍵技術

（1）案例的表示與組織

案例的表示與組織即是如何抽取案例的特征變量，并以一定的結構在計算機中組織存儲。如何將信息抽取出特征變量，選擇什么語言描述案例和選擇什么內容存放在案例中，案例按什么組織結構存放在存儲器中，這關系到基于案例推理方法的效率，而且對于案例數量越來越多，結構十分復雜的案例庫，尤其重要。

（2）案例的索引與檢索

案例的索引與檢索即是為了查找最佳相似案例，如何建立案例索引和相似度算法，利用檢索信息從案例庫中檢索并選擇潛在可用相似案例。后面的工作能否發揮出應有的作用，很大程度上依賴于這一階段得到的案例質量的高低，因此這一步非常關鍵。

（3）案例的復用和調整

案例的復用即是如何根據舊案例得出新解，涉及到找出案例與新問題之間的不同之處，案例中的哪些部分可以用于新問題，哪些部分不適合應用于新問題的解決。而復用還分案例的結果復用，案例的求解方法復用。

（4）案例的學習

案例的學習即是將新解添加到案例庫中，擴充案例庫的案例種類與數量，這過程也是知識獲取。此過程涉及選取哪些信息保留，以及如何把新案例有機集成到案例庫中，包括如何存儲，如何建立索引等等。

針對案例推理的關鍵技術，根據檢測和故障診斷系統的特點，計算機視覺主要解決如何將產品圖像輸入系統，如何將產品圖像特征進行抽取和描述，如何區別產品不同之處。以便案例推理系統進行案例建模，確立案例的表示形成和案例相似度的計算。本文主要從計算機視覺如何運用在案例推理系統進行探討。

3 產品輸入系統

產品輸入系統在不同產品類型和生產環境可能有不同之處，主要應有傳感器單元和圖像采集單元。如圖1。

圖1 產品輸入系統結構

傳感器單元主要判斷是否有產品存在，是否需要進行圖像采集，是否繼續下一個產品圖像的采集。這簡單傳感器可使用光電開關，配合光源，當產品經過時，產品遮擋住光源，使光電開關產生一個0值，而沒有產品經過時，光電開關產生相反的1值，系統通過判斷光電開關的值，從而判斷是否有產品。

圖像采集單元簡單地說是將產品拍攝并形成數字化圖像，主要包括光源、反射鏡、CCD相機和圖像采集卡等組成。光源和反射鏡作用主要使圖像中的物體和背景之間有較大灰度。CCD相機主要是拍攝設備。圖像采集卡主要是將圖像數字化。通過傳感器判斷有產品后，光源發出的光均勻地照在被測件上，CCD相機拍攝，拍攝圖像經過圖像采集卡數字化后輸入存儲設備。存儲設備即為計算機硬盤。存放原始圖像、數據、處理結果等。

這是案例推理系統的原始數據,是圖像處理、圖像特征抽取描述的基礎。

4 圖像處理

在案例推理系統中，需要對案例的組織和案例建模，案例的組織即案例的表示，相對計算機而言，即圖像特征的抽取，即某圖像具有與其它圖像不同之處，用于區別其它圖像，具有唯一性。同時，又能完整地表示該圖像。所以案例的表示要體現案例的完整性、唯一性、操作容易性。

圖像中有顏色區別、又有物體大小之分以及圖像由不同的物體組成。如何表示圖像，或說圖像內部包含表示的本質，即圖像的描述。根據圖像特點，確立圖像案例的表示，以圖像的像素、圖像的數字化外觀、圖像物體的數字組成等屬性。這需要對產品輸入的原始圖像進行處理。

在計算機視覺技術中，對原始圖像主要進行圖像增強、平滑、邊緣銳化、分割、特征抽取、圖像識別與理解等內容。經過這些處理后，輸出圖像的質量得到相當程度的改善，既改善了圖像的視覺效果，又便于計算機對圖像進行分析、處理和識別。具體工作流程如圖2所示：

圖2 計算機視覺的任務與工作流程

圖像預處理是將產品的數字圖像輸入計算機后，首先要進行圖像的預處理，主要完成對圖像噪聲的消除以及零件的邊緣提取。預處理的步驟為：圖像二值化處理；圖像的平滑處理；圖像的邊緣提取。

圖像二值化處理主將灰度圖形二值化的關鍵是閾值的選取，由于物體與背景有明顯的灰度差，可以選取根據灰度直方圖中兩峰之間的谷值作為閾值來分割目標和背景。

圖像的平滑處理技術即圖像的去噪聲處理，主要是為了去除實際成像過程中因成像設備和環境所造成的圖像失真，提取有用信息。

圖像邊緣提取是為了將圖像中有意義的對象與其背景分開，并使之具有某種指定的數學或符號表達形式，使計算機能夠理解對象的具體含義，檢測出邊緣的圖像就可以進行特征提取和形狀分析了。可采用多種算法，如采用Sobel算子提取邊緣。

圖像預處理是為下一步的特征描述打基礎，預處理的好壞直接影響案例推理的結果和檢測診斷的效率。

特征提取是對圖像進行描述，是案例建模關鍵，案例建模是根據案例組織要求抽取圖像特征，是建立案例索引和檢索的關鍵。如果圖像沒有特征，就談不上進行檢索。圖像特征可通過圖像邊界、圖像分割、圖像的紋理等方法，確定圖像特征，包括是什么產品、產品形狀大小、產品顏色，產品有什么缺陷、產品缺陷在什么位置等特征，根據這些圖像特征進行描述，形成計算機中屬性值，并從數據庫查找相應信息資料，從而確定產品之間的關系，相似度，也就是案例推理的方向。

5 系統的檢索

根據案例推理原理和相應算法，建立案例推理系統模型，如圖3所示。

圖3 案例推理系統

對話系統：完成人機交互、問題描述、結果顯示和系統總控制。

案例庫系統：由案例庫及案例庫管理系統組成。

數據析取系統：對各種已有的源數據庫的數據通過轉換而形成所需的數據。

多庫協同器：根據問題求解的需要，按照一定的數據抽取策略，完成問題求解過程中對模型庫系統、方法庫系統、知識庫系統和數據庫系統等資源的調度與協調。

知識庫系統：由產生式規則組成，這些知識包括專家經驗和以規則形式表示的有關知識，也可以是數據挖掘結論，支持案例檢索、案例分析、案例調整等。模型庫系統：由模型庫、算法庫、模型庫管理系統組成。完成模型識別和調用，并把結果綜合，送入對話系統顯示，作為補充信息供案例檢索、調整使用。

數據庫系統：存放待決策支持的所有問題，并完成其維護與查詢等功能。

由于系統主要應用產品的現場實時檢測監控或故障診斷，所以系統的檢索時，也必須輸入檢索值，即輸入現場產品的圖像，在通過產品預處理、圖像的二值化、分割和邊界處理后，進行圖像特征描述，根據圖像描述進行分類識別。根據案例推理的算法檢索案例庫中，是否有相似的案例。即確定相似度。相似度確定主要由案例推理的算法確定，如貼近分析法。確定相似度最大作為結果，并將案例的解輸出，給相關控制系統進行決策。如產品質量檢測，確定產品質量是否合格，是否有不合格產品，不合格產品是什么原因造成，故障源是什么，如何解決和排除故障，等等。

6 結論

案例推理方法有效地解決計算機視覺技術中圖像檢索問題。對提高圖像檢索的效率和準確度提供了平臺。

計算機視覺技術也為案例推理系統實現產品現場實時檢測、監控、診斷提供技術支持。計算機視覺技術現場的數據采集、處理為案例推理打好基礎。

兩者的結合設計的系統適用范圍很廣，只要產品需要進行質量檢測、監控，或設備需要進行故障診斷和維護，都可以適用。

系統提供的實時檢測、監控和診斷功能，提高企業的生產效益，降低了生產成本。

參考文獻：

[1]（美）桑肯（Sonka,M）.圖像處理分析與機器視覺[M].人民郵電出版社.

[2]王宏等譯.計算機視覺[M].電子工業出版社.

[3]蔡建榮.自然場景下成熟水果的計算機視覺識別[J].農業機械，36(2)：61-64.

[4]王宇輝.基于計算機視覺的錐體零件尺寸在線檢測算法[J].重型機械，2005,2：4-6

[5]駱志堅.基于計算機視覺檢測技術自動計數系統的研究與應用[J].儀表技術與傳感器,2005,3：41-43.

[6]左小德.貼近度分析法在案例庫推理中的應用[J],南大學學報(自然科學版)，1997，18(1):21-26.

[7]姜麗紅.案例推理在智能化預測支持系統中的應用研究[J].決策與決策支持系統,1996,6(4):63-69.

第4篇：計算機視覺研究的目的范文

近日，國內創業公司商湯科技宣布獲得4.1億美元B輪融資，這是截至目前為止全球范圍內人工智能領域單輪最高融資。至此，這家成立僅三年的公司累計融資額達4.5億美元，估值超過15億美元，成為全球融資額最高的人工智能獨角獸企業。當前，人工智能發展勢頭良好，技術和產品研發能力大幅提升，市場空間逐步拓展，社會關注與投資力度持續加大，技術創新驅動的人工智能企業正成為資本青睞的熱點。

一、商湯融資背景分析

人工智能迎來估值猛漲期。自2014年起，人工智能領域一直都是全球投資熱點。近年來，技術與產品的迅速成長帶動國內創業熱情高q，也引發了資本的高度關注。據統計，截至2017年5月31日，我國人工智能類創業公司已超過650家，產業規模較2016年同期增長達到51.2%，投融資事件超過430起，融資總額達340億元。科技巨頭加大在人工智能領域的布局，投資案例不斷涌現。同時，社會資本競相追逐人工智能領域的優質項目，整體行業獲投率偏高，超過一半的人工智能公司成立時間在兩年之內，可見資本市場對人工智能產業發展的信心。

計算機視覺領域成為熱點聚焦。在大數據、深度學習等新技術推動下，以計算機視覺和語音識別為代表的感知智能正呈現出高速演進態勢。目前我國計算機視覺技術水平已達到全球領先水平，并在安防、汽車、金融等領域取得了顯著的應用成效。在安防領域，智能技術如人臉識別、圖形識別應用場景眾多，如車牌識別、車輛視覺特征識別、被動人像卡口、身份證比對等應用。在汽車領域，圍繞智能駕駛汽車人工智能在環境感知、路徑規劃與決策等關鍵環節均有所應用和體現，在該領域百度、樂視等企業已開展卓有成效的實踐。廣泛的商業化渠道和技術基礎推動計算機視覺成為創投熱門領域，據數據顯示，中國人工智能創業公司所屬領域分布中，計算機視覺領域擁有最多創業公司。2016年，人臉識別服務開發商曠視科技完成至少1億美元融資，估值超過20億美元，專注圖像識別的圖普科技獲得千萬美元A輪融資。

商湯科技技術實力領先，發展潛力巨大。商湯科技主攻人臉識別、視頻監控識別算法、增強現實、文字識別、自動駕駛識別算法和醫療影像識別算法等技術，基礎研究實力強大，高質量專利數量、專業學術數量均保持全國領先水平。在2015年ImageNet大規模視覺識別競賽中，商湯科技獲得視頻識別冠軍，次年在該競賽中，商湯科技憑借原創深度神經網絡平臺，獲得3個項目的冠軍。商湯科技主要業務范圍是將計算機視覺技術賦能給安防、金融、機器人、政府大數據分析以及虛擬增強現實等行業。

二、由商湯融資帶來的兩點思考

第5篇：計算機視覺研究的目的范文

【關鍵詞】平面測量技術;鉛球項目;成績測量

0 引言

隨著計算機處理能力的提高和傳感器技術的發展，近年來基于視頻圖像處理的計算機視覺技術已成為圖像處理領域的研究熱點，該技術在眾多的領域中都有十分廣泛的應用[1]。

視覺是人類認識世界、觀察世界的重要手段。人類從外界獲取的信息量約有 75%來自視覺系統，這表明視覺信息量十分巨大以及人類對視覺信息有較高的利用率。人類利用視覺的過程可看作是一個從感覺到知覺的復雜過程，即從感受到的對三維世界的投影圖像到依據投影圖像去認知三維世界的內容和含義[2]。

計算機視覺技術是指利用計算機實現人的視覺功能，既對客觀世界的三維場景的識別、感知和理解。該技術包括是仿生學方法及工程方法，仿生學方法是模仿人類視覺功能的結構及原理，建立相應的處理系統，完成類似的工作和功能;工程方法是從分析人類視覺系統著手，并采用任何現有的可行手段實現人類視覺系統的功能[3]，該方法的特點是只關心系統的輸入和輸出。計算機視覺的主要研究目標是建成計算機視覺系統，完成各種視覺功能。也就是說，即要能借助各種視覺傳感器（如 CMOS 攝像器件、CCD等）獲取現實世界的圖像，而感知和恢復 3D 環境中物體的幾何性質、運動情況、姿態結構、相互位置等，并且要對客觀場景進行識別、解釋、描述、進而做出決斷。目前，計算機視覺技術在體育運動中也得到了廣泛的應用，利用該技術不僅可以從不同的視角觀察運動員的動作，而且能將運動員速度、加速度、所在位置等數據進行量化處理，使體育訓練及比賽擺脫依靠傳統經驗分析及判別的狀態，從而進入科學化、數字化的狀態，而且還可以完成競技體育項目的成績測試[4-5]。

在測試項目中鉛球成績的測量仍采用皮尺丈量法。這種方法存在著三個方面的缺陷，一是皮尺本身具有彈性以及易折疊特性，二是受場地的凹凸不平，三是人為因素影響較大。由于這三方面的作用，故在鉛球成績的測量精確度受到極大的限制。針對這一問題本課題提出了一種基于同視場（鉛球場地）測量地平面坐標的單攝像機模型[6-7]。該模型利用透視投影幾何關系，對攝像機內部參數進行標定，然后，建立相應的網格匹配數學模型，通過單目CCD攝像機像面坐標，測量鉛球落點的地平面坐標[8]。成功的解決了鉛球著點測量在雙目視覺交匯組合測量存在的死角影響系統的測量范圍的問題，另外，單目視覺測量系統也避免了雙目視覺系統存在對應特征點匹配問題。

1 平面測量原理

圖1 鉛球的2D場景坐標系

鉛球場地是一個扇形區域（如圖1）。假設建立一個如圖1的2D場景坐標系，首先要做的事是要確定場地上指定點的真實坐標與采集到的圖片的指定點象素坐標之間的對應關系，即要找到這兩種坐標系之間的轉換關系。而這種轉換關系可以用平面測量的相關技術獲得。在計算機視覺中，所謂的平面測量，就是從圖像中獲得2D場景信息。在實際的測量中，我們可以通過在圖像上標定一定數量的坐標點來確定圖像中場地指定點的象素坐標和真實世界中的指定點的現實坐標之間的單應矩陣。

我們獲取一幅2D場景S的圖像I，通過S與I之間的N（N>=4）對對應點，就可以確定它們之間的單應矩陣H。

令：

H=h■，h■，h■=h■，h■，h■h■，h■，h■h■，h■，h■（1）

在H的九個元素中，有八個獨立比率，即一個單應有八個自由度變量，一個常數1。因此，在H中，往往設置h■=1。

令（x■，y■）∈I，x■■，y■■∈S為一對對應點，i=1，2，…N。由每一對對應點，根據圖像與場景之間的單應關系，我們可以得到兩個線性方程：

其中，h是矩陣H的向量形式，

于是我們可以得到2N個方程，寫成矩陣形式為：

AH=0（3）

其中

因此，要求得8個參數的單應矩陣，至少需要4個對應點。在實際的測量中，為了提高精度，每個模板平面上提供的對應點數目都會超過4個。

當N>4時，我們可以用奇異值分解法（SVD）[14]求最小二乘解h。

求得單應矩陣后，利用公式（2），就可以計算出圖像上指定點對應的真實坐標值，從而計算出鉛球投擲的距離。

2 實驗結果與分析

表1

2.1 實驗結論（下轉第38頁）

（上接第21頁）經實際測量的6個標定點（如圖1）的坐標分別為A（700，0）、B（900，0）、C（1100，0）、D（570，407）、E（733，523）、F（895，639）。為了測試本文提出的測量模型，在反復測量鉛球投擲實驗中選取了典型的10個測試樣本，其中鉛球落點10個。

2.2 誤差分析

從表1中我們可以看到人工測量值和系統測量值有一定的誤差，分析誤差產生的原因有如下幾種：

1）數字 CCD 鏡頭的光學性能引起的誤差，如焦距、畸變和光學中心誤差等通過攝像機內部參數校正來解決。

2）攝像機的支架及底座一定要有足夠的穩定性和剛度，在視頻圖像獲取過程中應保證攝像機的相對位置穩定不動，由意外情況所造成的誤差在計算中應予以剔除。

3）環境的變化將對測量結果產生影響，因此測量中要及時修正背景圖像。

4）人工測量本身就會與真實值產生一定的誤差。

3 總結

本論文首先介紹了課題背景，對單目視覺測量的研究現狀和測量建模在國內外的研究現狀進行了分析和歸納，同時分析了視頻圖像處理技術在體育項目應用現狀，將基于單目視頻圖像處理技術的鉛球成績測量作為切入點，對數字圖像處理技術在田徑運動中應用的關鍵技術進行了研究。結合鉛球場地的特點，提出一種基于視頻圖像的鉛球測量方法，并通過實際應用證明了該方法的可行性。

【參考文獻】

[1]Criminisi A，Reid I，Zisserman A. A plane measuring device[J].Image and VisionComputing，1999，17（8）， 625-634.

[2]Lorenzo Bruzzone， Diego Fernàndez Prieto. Automatic Analysis of the Difference Image for Unsupervised Change Detection[J]. IEEE Transactions on Geoscience and Remote Sensing，2000，5，38（3）.

[3]L Sajó， Z Ruttkay， A Fazekas. Turk-2， a multi-modal chess player[J]. International Journal of Human-Computer Studies，2011，7，69（7-8）：483-495.

[4]Lichtenberg， D.B.， Wills， J.G.， Maximizing the range of the shot-put[J]. American Journal of Physics，1978，46：546-549.

[5]Maheras， A.V.. The relationship between the angle of release and the velocity of release in the shot-put， and the application of a theoretical model to estimate the optimum angle of release （throwing）[D].University of Kansas.， 1995.

[6]Antonio Plaza， Jon Atli Benediktsson， Joseph W. Boardman. Recent advances in techniques for hyperspectral image processing[J]. Remote Sensing of Environment，2009，9，113（1）：S110-S112.

第6篇：計算機視覺研究的目的范文

多采用是人工測量的方式，在誤差的控制上選擇的是多次測量，反復操作，再將多次測量的結果進行加權，最終得到相對準確的測量數值。這種方法在一定程度上是操作十分復雜，精度還很難達到設計要求，所以我們在礦區土地信息測量工程中引進了GIS技術這樣的一個概念，下面我們就如何通過GIS技術進行有效的觀測測量來進行討論。

[關鍵詞] GIS技術；精密測量；構造幾何模型；信號源的接收

地理信息系統（Geographic information system，GIS）是利用計算機及其外部設備采集、存儲、分析、描述與空間和地理分布有關的數據的空間信息系統。GIS融合計算機圖形和數據庫于一體，在一定的地域內，將地理空間信息和一些與該地域地理信息相關的屬性信息結合起來，達到對地理和屬性信息的綜合管理。從外部來看，GSI表現為計算機軟硬件系統，而其內涵是由計算機程序和地理數據組織而成的地理空間信息模型，是一個高度信息化的地理系統。

1）等高線生成及等高線分析：等高線圖是人們傳統上觀測地形的主要手段。可以在等高線圖上精確地獲知地形的起伏程度、區域內各部分的高程等等。等高線圖可以從格網數字地形模型中獲取相關的資料信息，也可在不規則三角形格網T（NI）中生成。

2）立體透視圖分析：當用戶需要從直觀上觀察地形的概貌時，用繪制透視圖的方法（還可以用色彩）可以更逼真地顯示地形。

3）坡度分析、地表面積計算及挖、填土方體積計算：建立DTM后就可以用之計算坡度、面積和挖、填土方體積，以其作為土地適宜性評價的因子。

一 GIS技術在信息管理模式中的具體形式

在以往的測量中，選擇的測量方式還是完全采用機械的形式，但是在使用了計算機GIS技術精密測量后，完成了許多以往技術所不能達到的任務。在我們的研究中，計算機GIS技術測量的原理是通過攝像機將被處理的對象采集進行影像采集，在多個控制點的數據采集完成后，系統會自動將這些圖像進行整合，得出相關的幾何多變參數，再在計算機上以具體的數據顯示出來，以供礦區技術人員使用參照。

在上面所說的攝像機并不是我們通常意義上生活中使用的攝像機。它是一種可視化較強，表針比較敏感的測試儀。可以將視覺中的二維形態通過顯影，記錄在機械的光譜儀上，再將這種的二維圖像做數學處理，有二階矩陣轉換為三階矩陣，通過播放儀呈現出三維的影像。這時的圖像變為立體化，更有層次感，效果上也有了明顯的變化，這是一種顯示方法。此外還有一種造價較高的儀器，我們不常使用，就是圖像提取器。同樣是采集控制點的數據，將數據整合在系統之內，然后對于原始的圖像進行預處理，不再經過有曝光這個程序，將圖像中關鍵點的坐標在整個內部軸面上體現出來，提取數據幀數，再運用機器的智能識別系統，對控制點的坐標進行數據分析，自動生成圖形，這也可以用于精密測量。它的優點就是使用上極其的方面，基本只要架立儀器和打開開關，其他的工作機械系統都會自動的完成。使用的困難就是造價極其的高，不適合一般企業使用。在基于計算機視覺圖像測量中使用上的原理如下：

（1）計算出觀察控制點到計算機視覺圖像測量儀器的有效距離；

（2）得出觀察點到目標控制點之間的三維的運動幾何參數；

（3）推斷出目標控制點在整個平面上的表面特征（大多時候要求形成立體視覺）；

（4）還通過觀察可以判斷出目標物體的幾何坐標方位。

在整個計算機GIS技術精密測量的在礦區土地信息管理中最關鍵的元件就是壓力應變電阻儀，這也是傳感器的一部分。

所謂的壓力感應就是一種新型的傳感器，通過電阻的變化作為一種感應值的判斷標準進行計算和采集數據。具體的做法是在受力物體上粘貼高靈敏度的感應片，通過力的傳遞將物體上受到即時的力傳遞到感應片上，以備技術人員收集。在物體的中心或者是機械的隔斷處，使用丙酮溶液進行擦拭，以保證物體的表面潔凈和貼合度較高。當液體充分風干的情況下將感應片貼在已涂丙酮的物體上（注意感應片的正反），再使用導線和感應片相互連接，從而形成了一個完整的閉合電路體系，在通電的情況下，在計算機終端上可以顯示出來。以便技術人員可以在任何時候掌握每個檢測點的施工使用情況，一旦機械設備發生異常現象，就會在計算機圖形中顯示出來。于此同時，它還可以對施工人員所處的具置做到應力感應，人自身的重量傳遞到地面上，結構會出現結構上的略微變化，這個儀器就能第一時間以信號的方式傳送到計算機終端，讓技術人員掌握相關施工的情況，并結合數據報告總結出相關的可行性分析付諸實踐。

當無法觀察到控制點是，計算機GIS技術測量可以通過接收信號或是相關的頻率波段來收集數據，不會因為以往測量的環境不好，距離太遠，誤差太大的影響。同時在信息管理中通過了加密通道，系統可以將數據自動的保存和轉換為視圖模式，對于數據的審計和運行可以同時進行，這樣就可以很好的保證大地測量中的圖像數據安全，利用防護墻將采集中廢棄的數據革除在外，避免數值之間發生紊亂的現象，進一步改善計算機GIS技術。

二計算機GIS與CAD技術的結合

在計算機GIS技術測量中解決了很多以往很難完成的任務，但是在使用過程中還是發生了很多的問題。尤其在土地信息的選擇中，無法使用高幀數的圖片顯示，無法將計算機測量的關鍵技術的優點發揮出來。在煤礦生產過程中，對于生產效率的提高就要對開采環境的要求更高。使用繪圖技術與GIS技術相互結合可以將復雜的地理環境的具體形狀在電腦當中展現出來，用較為直觀的圖形準確的反應出來。而且在使用中，可以在計算機中隨時將圖像進行修改，完全可以適應復雜情況下的設備調試。在以往傳統的圖像設計中，技術人員在圖紙中很難將地理信息進行再次修改，在設計后期在計算機圖形繪制處理技術中，對于圖像的調試使用的范圍很廣，通過虛擬的模擬和現實的結合來實現煤礦信息的完整，有效的加強了煤礦的信息化管理。

CAD技術是基于工程圖上的三維建模方式。三維模型是從二維信息中提取的三維模型信息，通過再次分類以后，得到的一系列的相關處理信息，之后在三維空間建立相應的二維信息的三維形狀模型提，使模型本身恢復點，線，面和拓撲關系，從而實現形狀重建工程。計算機圖形繪制處理，也可以應用于測繪圖紙和關于地形的建模。土地信息中包含的地貌和自然資源圖，它是國民經濟體系的重要組成部分。我們可以畫一個圖，三維地形圖的存儲信息的產生。為預測和決策水平的使用有重大的意義，也為綜合治理和煤炭資源的研究開發利用提供科學依據，這些依據，在軍事上也起著非常重要的作用。在煤礦機械設備也使用CAD軟件繪制零件圖，利用繪圖軟件在操作更簡單的菜單式設計，繪制出圖形更準確。

三 GIS技術測量的關鍵技術遇到的困難和使用前景

計算機GIS技術測量的關鍵技術作為一種新興技術在使用時間上不過十幾年，其使用的程度已經無法估算。正是因為它的簡單、使用、精度高以及自動化能力卓越的特點受到了礦區土地信息管理部門的廣泛青睞。在測量調控方面的這些可靠性和穩定性也是有目共睹的。這項關鍵技術中涵蓋的學科非常的多，涉及到的知識也很全面，一旦出現了機器的故障，在維修上還是一個很大的問題，如何很好的解決計算機視覺圖像技術的相關核心問題就是當下亟待解決的。通過在一些相關的技術之間的相互結合才能使GIS技術發揮的更加完美。

我們都知道，人的眼睛是可以受到自身的控制，想要完成礦區土地觀測是十分簡單的，但是在計算機GIS技術中，畢竟是采取攝像機取景的模式，在取得的點位有的時候不是特別的有代表性，很難將這些問題具體化、形象化。達不到我們設計時的初衷。所以在這些模型的構建中和數據的轉換上必須有嚴格的規定和要求，切不可盲目的實施測量，每項技術操作都要按規程來實施。

四結束語

在煤礦土地工程發展的今天，很多的測量技術已經離不了計算機GIS技術的輔助，本文中詳細的談到了GIS技術方面的研究，對于之中可能出現的一些問題也提出了相應的解決方案，對于和CAD繪圖技術相互結合的使用方式也做出了詳細的介紹。測量工程中使用計算機GIS技術可以很好的解決和完善測量中遇到的一些問題，但是也暴露出了很多的問題亟需技術人員不斷去解決完善。

將GIS技術在礦區土地管理信息系統中使用，也是加強了礦區建設的信息化水平。可以預見的是，在未來使用計算機GIS技術在礦區土地管理信息系統建立的測量模型會得到更多、更好的應用。但作為一個長期復雜的技術工程，在這個建設過程中定會有一些困難的出現。希望通過不斷的發現問題、總結經驗，讓GIS技術在礦區土地管理信息系統在煤礦的開挖中的作用發揮的更好。

[參考文獻]

[1] 湯劍，周芳芹，楊繼隆.計算機視覺圖像系統的技術改造[J].機電產品開發與創新周刊，2005，14（18）：33-36

[2] 段發階等. 拔絲模孔形計算機視覺檢測技術[J] . 光電工程時報， 2006， 23（ 13）：189-190

第7篇：計算機視覺研究的目的范文

關鍵詞：增強現實；計算機視覺；三維注冊

中圖分類號：TP242 文獻標識碼：A 文章編號：1007-9599　（2012）　19-0000-02

1 引言

隨著計算機技術的迅速發展，計算機視覺、虛擬現實技術、人工智能、計算機圖形學等技術被廣泛地研究和應用，這些技術引導著人們進入了一個信息數字化的虛擬時代。

增強現實技術（Augmented　Reality，AR）作為虛擬現實技術和計算機圖形學相結合的產物，它是在通過計算機渲染生成虛擬的物體或文字信息模型的同時，對真實的場景進行標定，從而使虛擬的物體能夠被準確地放置到真實的場景中，最終通過顯示設備顯示出來，使用戶處于虛擬和現實相融合的亦真亦幻的新環境中，無法清楚地分辨出真實和虛擬。增強現實技術增強了用戶的觀感及其與真實場景之間的交互。

增強現實技術作為虛擬現實的一個重要分支，是虛擬現實技術發展過程中的產物。如圖1.1所示，該圖為Milgram提出的增強現實和虛擬現實關系的一種分類學表示方法。由圖我們可以看出，虛擬現實所創建出來的是一種完全虛擬的三維世界，它與真實的世界相隔離。而增強現實是以現實場景為基礎，場景中的虛擬物體隨著真實物體的變化而變化，提供給用戶的是一種復合的視覺效果，就好像這些虛擬物體真實的存在于場景中。

2 增強現實技術的應用

增強現實技術在20世紀90年代真正興起，其發展與20世紀60年代計算機圖形學的迅速發展密不可分。增強現實技術不僅擁有虛擬現實的各種優點，同時又有其獨特的視覺增強功能，因此成為了國內外研究機構和知名大學的研究熱點，并廣泛的被應用于教育、醫療、工業、娛樂、軍事等多個領域。

2.1 教育

增強現實豐富了教育學習生活。傳統的書籍中只存在文字信息，通過增強現實技術，我們可以透過書籍看見文字相關的動態畫面或是影像，圖文并茂，極大的增強了學生的學習興趣。目前的魔法書系統就是這一技術的很好運用，用戶通過頭盔顯示器可以看到書中描述的場景，使讀者可以完全沉浸在虛實結合的環境中，提高學習興趣和效率。

2.2 醫療

增強現實技術可以幫助醫生實現可視化手術或手術培訓。準確地定位真實場景是增強現實技術的一個重要方面，在醫療中，運用增強現實技術可以進行手術定位，實時地收集病人體內的3D影像，并將其與真實的人體相結合，使得醫生可以“透視”病人體內，從而減少手術的風險，該技術對微創手術也有著深遠的意義。手術培訓方面，通過加入虛擬的提示注解，可以提醒醫生手術中的一些必要步驟，降低手術風險。

2.3 工業

增強現實的另一個應用是工業組裝和維修。通過增強現實技術可以顯示出各種設備零件的內部結構圖、使用說明等，方便安裝和維修。顯示的內容可以不僅僅是簡單的文字或圖片，更能直接渲染生成3D的圖形，并按步驟一步一步的顯示出來，方便操作。

2.4 娛樂

電影、廣告、游戲、體育比賽轉播中，增強現實技術也得到了廣泛的運用。體育比賽中，能夠在直播現場實時地插入三維的圖形、動畫、視頻等虛擬的比賽相關信息或廣告。日常生活中，出現一種增強現實瀏覽器，它利用多種傳感器將日常需求通過實景與虛景結合后呈現在用戶面前，用戶可以通過增強現實瀏覽器看到實景的文字介紹、三維模型等，并可以搜索定位。

3 增強現實相關技術

增強現實系統具有虛實結合、三維注冊、實時交互三個特點。三個特點之間緊密聯系，要求在合成的場景中虛擬的物體能夠擁有真實的存在感和位置感。因此顯示技術、定位技術、虛實融合技術、用戶交互技術是實現增強現實系統的基礎支撐技術。

3.1 顯示技術

理想的AR系統的顯示器具有體積小、移動方便、圖像繪制清晰、交互自然等特點，但是目前仍不能制造出完成符合這些特點的顯示器。常用的顯示設備可以分為四類：普通液晶現實器；頭戴式顯示器；手持式顯示器；投影式顯示器。

液晶顯示器是最為常見，也最容易得到的顯示設備。但是液晶顯示器體積較大，移動不方便，限制了用戶的活動范圍。頭戴式顯示器，佩戴于用戶的頭部，這種顯示器本身提供了一路或兩路攝像機，采用視頻合成技術，為用戶提供場景的顯示。但是頭戴式顯示器在戶外長時間佩戴很不舒服，因此也不能為用戶廣泛接受。手持式顯示器，較頭戴式顯示器稍有改進，但是也限制了用戶手部的活動。投影式顯示器能夠將場景投影到較大范圍的環境中，位置固定，適合于室內的AR系統。

3.2 定位技術

增強現實系統需要將虛擬的物體準確地放置到真實的場景中，因此定位技術顯得尤為重要。目前的定位技術主要分為兩種：一種是基于硬件的定位技術；一種是基于計算機視覺技術的定位技術。

基于硬件的定位技術一般使用硬件設備定位，主要包括：全球衛星定位系統、測距儀、導航儀、機械裝置等。

基于計算機視覺的定位技術一般是從真實場景中獲得一幅或多幅圖像，根據圖像中的信息，計算出攝像機和圖形中物體的相對信息，最終恢復出三維場景的結構，從而達到定位的目的。

基于計算機視覺的定位技術主要包括以下幾種：

（1）單視圖法：在一幅圖像中找到六個以上特征點進行跟蹤，通過已知的特征點的三維坐標和其成像坐標進行定位。

（2）多視圖法：從多個角度拍攝場景，根據常用的角點檢測法，檢測多幅圖像的角點并進行匹配，從而計算出真實場景中物體的景深，最終實現定位。

（3）運動目標的序列圖像：根據序列圖像估算運動目標的各項參數。

（4）模板匹配法：從多個視角出發尋找真實圖像中的物體作為模板數字化圖像，繼而將虛擬物體疊加到真實場景。

3.3 虛實融合技術

增強現實技術中的虛擬融合主要指虛擬物體在真實場景中的配準，以及虛擬物體與真實場景的一致性。

在增強現實系統的實現過程中，一致性是一個關鍵性問題。虛實融合的一致性包括動態一致性和靜態一致性。其中，動態一致性通常指場景的實時繪制，跟蹤過程中虛擬物體和真實場景的空間位置的一致性等；靜態一致性通常指虛擬物體與真實場景外觀的一致性變化等。

另一方面，為了實現很好的虛實融合效果，必須對拍攝真實場景的相機進行標定，并與繪制虛擬物體的虛擬相機參數進行匹配。攝像機標定主要是對攝像機的內外參數的確定。目前，攝像機標定技術已經較為成熟，主要可以分為三類：傳統的標定法，如張正友標定法；自標定法，如基于Kruppa方程的自標定法；基于主動視覺的標定法，如基于射影重建的標定法。三類標定法各有利弊，并沒有一種可以普遍適用，因此攝像機標定技術仍是一個研究重點。

3.4 用戶交互技術

人們總是向往能夠使用自然的方式和虛擬的物體交互，但這是十分困難的，增強現實系統根據跟蹤定位獲得的有關真實場景的信息對虛擬物體發出指令。目前，交互技術主要使用以下三種方式：

（1）在場景中選擇一個或多個特征點作為標記點，這是增強現實系統中最基本的交互方式。

（2）使用計算機識別出人或物體的姿態，進而交互操作。

（3）制作特殊工具，能夠通過按鍵等簡單方式觸發事件。

4 結束語

本文總結了現階段增強現實技術的應用領域，并對其涉及到的關鍵技術進行了闡述。增強現實技術作為一個多學科交叉的研究領域，必將飛速發展，更多的融入到我們的生活中。

參考文獻：

[1]紀慶革，潘志庚，李祥晨.虛擬現實在體育體育仿真中的應用綜述[J].計算機輔助設計與圖形學學報，2003，15（11）：1333-1338.

[2]陳靖，王涌天，閆達遠.增強現實系統及其應用[J].計算機工程與應用，2001，15：72-75.

[3]Milgram　Pand　Kishino　F.A　taxonomy　of　mixed　reality　visual　displays[J].IEICE　Trans.Information　Systems，1994，E772D（12）：1321-1329.

第8篇：計算機視覺研究的目的范文

【關鍵詞】機器視覺；VisionPro；識別定位；

1.引言

自20世紀80年代以來，機器視覺技術開始高速發展，已經從實驗室走向了人們生產生活的各個方面。機器視覺系統的特點是提高生產的柔性和自動化程度。在一些不適合于人工作業的危險工作環境或人工視覺難以滿足要求的場合，常用機器視覺來替代人工視覺；同時在大批量工業生產過程中用機器視覺檢測方法可以大大提高生產效率和生產的自動化程度。而且機器視覺易于實現信息集成，是實現計算機集成制造的基礎技術。現今，在機器視覺領域已經有了一些成熟的視覺開發軟件，其封裝了很多可靠、高效的算法和工具。本文選用美國康耐視公司的VisionPro軟件，這是一套基于PC架構的視覺系統軟件開發包，主要應用于各種復雜的機器視覺領域。它集成了用于定位、檢測、識別和通訊等任務的工具庫，可用C#、VB和VC等語言進行二次開發。本文基于VisionPro利用語言進行視覺定位系統的軟件開發[1]。

2.視覺定位系統

2.1 硬件組成

在圖像處理前首先要得到清晰、有效的圖像，這就需要有一套完整的硬件設備。一般主要包括照明用的光源、調節圖像清晰度的鏡頭、將圖像轉換為數字信號的攝像機和進行圖像處理的計算機。其中攝像機與計算機之間的接口也比很重要的，主要分為IEEE1394和采集卡，USB2.0或Gigabit Ethernet千兆網三種[2]。

本視覺系統采用的是日本FUJINON工業攝像頭，德國BASLER工業像機ACA1600-20GM，GigE千兆網接口。

2.2 基于VisionPro的軟件開發

本視覺定位系統利用編寫適合實驗需要的界面，界面中只包含需要的操作功能和數據，使整個界面看起來更加清楚簡單，操作起來更方便。

（1）圖像采集

本視覺系統通過GigE千兆網作為接口控制相機進行圖像采集。打開軟件并連接相機，設置好參數后，就可以通過可視化工具Image Source直接獲取圖像。

（2）相機的標定

機器視覺的基本任務之一是從攝像機獲取的圖像信息出發計算三維空間中物體的幾何信息，并由此重建和識別物體。空間物體表面某點的三維幾何位置與其在圖像中對應點之間的相互關系是由攝像機成像的幾何模型決定的，這些幾何模型參數就是攝像機參數。在大多數條件下，這些參數必須通過實驗與計算才能得到，這個過程被稱為攝像機標定[3]。

本文利用VisionPro的CalibChecker-boardTool工具進行攝像機標定。首先需要一個棋盤板，棋盤板必須滿足以下條件：必須由大小相同的黑白格子交替組成；格子最好是正方形，如果達不到的話，格子長寬比也要在0.9和1.0之間。本系統采用康耐視公司提供的標準棋盤板進行標定[4，5]。圖1是標定的結果。

（3）目標識別與定位

視覺定位的目的就是找出目標物的坐標位置。本文利用VisionPro的PMAlignTool工具對目標物體進行識別定位。PMAlignTool工具是基于PatMax算法，該算法采用模板定位技術（pattern-location technology），先訓練模板，然后根據模板對采集圖像進行模板匹配，實現定位。在訓練模板和定位過程中，PatMax不是基于像素柵格（Pixel grid）分析圖像，而是采用基于幾何外形（Features based）的定位方法，通過圖像的幾何特征信息和特征之間的空間位置關系進行模板訓練和匹配，使其能夠保證很高的精度和抗干擾性，而且可以高速定位發生旋轉、縮放、甚至拉伸形變的物體[1]。PMAlignTool工具定位的流程如圖2。

通過PMAlignTool工具對目標物體識別定位后，利用VB調用該工具下的Results.Item（i）.GetPose（）.TranslationX和Results.Item（i）.GetPose（）.Transl-ationY。這兩個值就是序號為i的目標物在圖像上的X、Y坐標值，其中i為識別的各個目標物的序號。

3.實驗

3.1 PatMax識別定位

在對攝像機完成標定校正后，運用自己編寫的人機交互界面完成對目標物體進行識別定位，并將所需要的目標位置坐標顯示在界面上。同時又將識別到的所有目標物體的坐標信息保存到了文本文檔中，方便調用。主要操作如下：

（1）模型訓練。實驗以一元硬幣為目標物，圖3為訓練完成的模型。

（2）目標識別定位。圖4是利用編寫的界面，在圖像上能夠清楚的顯示出所識別出的目標輪廓和形心位置，界面右方結果顯示區內可以看到所識別的目標數量和所需要的目標物的坐標。

3.2 對比實驗

視覺定位可以用的軟件和工具包很多，其中應用最廣泛的就是Opencv，它是一個基于（開源）發行的跨平臺計算機視覺庫，可以運行在Linux、Windows和Mac OS操作系統上。它輕量級而且高效——由一系列 C 函數和少量 C++ 類構成，同時提供了Python、Ruby、MATLAB等語言的接口，實現了圖像處理和計算機視覺方面的很多通用算法。為了驗證PatMax算法定位的準確性，本文利用Opencv對相同的圖像進行目標識別定位，對得到的效果圖和坐標進行對比[6]。如圖5所示，其中藍色為輪廓曲線，綠色十字為目標形心。

圖6為VisionPro識別硬幣的效果圖，輪廓和形心均用綠色線標識。對比兩圖可以看出VisionPro對輪廓的識別效果要更好一些。由于形心坐標是由輪廓曲線上的點計算得到的，所以VisionPro獲得的形心坐標值也會比Opencv的更加準確，而且精確度更高。下表是兩種方法得到的形心坐標。

4.結束語

本文基于VisionPro采用對其進行開發，首先利用VisionPro中的工具進行圖像的采集，攝像機的標定，運用PatMax算法進行目標物的識別與定位，然后運用編寫人機交互界面，可以更加方便快捷的得到所需要的目標物坐標值。本文利用Opencv對相同的圖像進行目標的識別定位，與VisionPro得到的結果進行實驗對比。結果證明基于VisionPro的視覺定位系統對目標的識別效果更好，定位的數據更加準確。基于該軟件使應用程序的開發更加快速方便，得到的數據結果誤差較小，具有應用價值。

參考文獻

[1]威洛斯，焦宗夏.基于VisionPro的焊膏印刷機視覺定位系統[C].第十二屆中國體視學與圖像分析學術年會論文集，2008.

[2]Carsten Steger，Markus Ulrich，Christean Wiedemann，著.機器視覺算法與應用[M].楊少榮，吳迪靖，段德山，譯.北京：清華大學出版社，2008.

[3]邱茂林，馬頌德，李毅.計算機視覺中攝像機定標綜述[J].自動化學報，2000，26（1）：47-59.

[4]Cognex，Cognex MVS-8100D and CDC Cameras Hardware Manual，2006.

[5]Cognex，VisionPro，Net Help，2006.

[6]Bradski G.，Kaehler A.著.學習OpenCV[M].于仁琪，劉瑞禎，譯.北京：清華大學出版社，2009.

作者簡介：

韓慶瑤（1953—），男，華北電力大學教授。

張志遠（1986—），男，華北電力大學能源動力與機械工程學院碩士研究生。

第9篇：計算機視覺研究的目的范文

關鍵詞：數據融合傳感器無損檢測精確林業應用

多傳感器融合系統由于具有較高的可靠性和魯棒性，較寬的時間和空間的觀測范圍，較強的數據可信度和分辨能力，已廣泛應用于軍事、工業、農業、航天、交通管制、機器人、海洋監視和管理、目標跟蹤和慣性導航等領域。筆者在分析數據融合技術概念和內容的基礎上，對該技術在林業工程中的應用及前景進行了綜述。

一、數據融合

1.1概念的提出

1973年，數據融合技術在美國國防部資助開發的聲納信號理解系統中得到了最早的體現。

70年代末，在公開的技術文獻中開始出現基于多系統的信息整合意義的融合技術。1984年美國國防部數據融合小組(DFS)定義數據融合為：“對多源的數據和信息進行多方的關聯、相關和綜合處理，以更好地進行定位與估計，并完全能對態勢及帶來的威脅進行實時評估”。

1998年1月，Buchroithner和Wald重新定義了數據融合：“數據融合是一種規范框架，這個框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數據，以獲得實際需要的信息”。

Wald定義的數據融合的概念原理中，強調以質量作為數據融合的明確目標，這正是很多關于數據融合的文獻中忽略但又是非常重要的方面。這里的“質量”指經過數據融合后獲得的信息對用戶而言較融合前具有更高的滿意度，如可改善分類精度，獲得更有效、更相關的信息，甚至可更好地用于開發項目的資金、人力資源等。

1.2基本內容

信息融合是生物系統所具備的一個基本功能，人類本能地將各感官獲得的信息與先驗知識進行綜合，對周圍環境和發生的事件做出估計和判斷。當運用各種現代信息處理方法，通過計算機實現這一功能時，就形成了數據融合技術。

數據融合就是充分利用多傳感器資源，通過對這些多傳感器及觀測信息的合理支配和使用，把多傳感器在空間或時間上的冗余或互補信息依據某些準則進行組合，以獲得被測對象的一致性解釋或描述。數據融合的內容主要包括：

(1)數據關聯。確定來自多傳感器的數據反映的是否是同源目標。

(2)多傳感器ID/軌跡估計。假設多傳感器的報告反映的是同源目標，對這些數據進行綜合，改進對該目標的估計，或對整個當前或未來情況的估計。

(3)采集管理。給定傳感器環境的一種認識狀態，通過分配多個信息捕獲和處理源，最大限度地發揮其性能，從而使其操作成本降到最低。傳感器的數據融合功能主要包括多傳感器的目標探測、數據關聯、跟蹤與識別、情況評估和預測。

根據融合系統所處理的信息層次，目前常將信息融合系統劃分為3個層次：

(l)數據層融合。直接將各傳感器的原始數據進行關聯后，送入融合中心，完成對被測對象的綜合評價。其優點是保持了盡可能多的原始信號信息，但是該種融合處理的信息量大、速度慢、實時性差，通常只用于數據之間配準精度較高的圖像處理。

(2)特征層融合。從原始數據中提取特征，進行數據關聯和歸一化等處理后，送入融合中心進行分析與綜合，完成對被測對象的綜合評價。這種融合既保留了足夠數量的原始信息，又實現了一定的數據壓縮，有利于實時處理，而且由于在特征提取方面有許多成果可以借鑒，所以特征層融合是目前應用較多的一種技術。但是該技術在復雜環境中的穩健性和系統的容錯性與可靠性有待進一步改善。

(3)決策層融合。首先每一傳感器分別獨立地完成特征提取和決策等任務，然后進行關聯，再送入融合中心處理。這種方法的實質是根據一定的準則和每個決策的可信度做出最優的決策。其優點是數據通訊量小、實時性好，可以處理非同步信息，能有效地融合不同類型的信息。而且在一個或幾個傳感器失效時，系統仍能繼續工作，具有良好的容錯性，系統可靠性高，因此是目前信息融合研究的一個熱點。但是這種技術也有不足，如原始信息的損失、被測對象的時變特征、先驗知識的獲取困難，以及知識庫的巨量特性等。

1.3處理模型

美國數據融合工作小組提出的數據融合處理模型，當時僅應用于軍事方面，但該模型對人們理解數據融合的基本概念有重要意義。模型每個模塊的基本功能如下：

數據源。包括傳感器及其相關數據(數據庫和人的先驗知識等)。

源數據預處理。進行數據的預篩選和數據分配，以減輕融合中心的計算負擔，有時需要為融合中心提供最重要的數據。目標評估。融合目標的位置、速度、身份等參數，以達到對這些參數的精確表達。主要包括數據配準、跟蹤和數據關聯、辨識。

態勢評估。根據當前的環境推斷出檢測目標與事件之間的關系，以判斷檢測目標的意圖。威脅評估。結合當前的態勢判斷對方的威脅程度和敵我雙方的攻擊能力等，這一過程應同時考慮當前的政治環境和對敵策略等因素，所以較為困難。

處理過程評估。監視系統的性能，辨識改善性能所需的數據，進行傳感器資源的合理配置。人機接口。提供人與計算機間的交互功能，如人工操作員的指導和評價、多媒體功能等。

二、多傳感器在林業中的應用

2.1在森林防火中的應用

在用MODIS(ModerateResolutionImagingSpectroradiometer)數據測定森林火點時的20、22、23波段的傳感器輻射值已達飽和狀態，用一般圖像增強處理方法探測燃燒區火點的結果不理想。余啟剛運用數據融合技術，在空間分辨率為1000m的熱輻射通道的數據外加入空間分辨率為250m的可見光通道的數據，較好地進行了不同空間分辨率信息的數據融合，大大提高了對火點位置的判斷準確度。為進一步提高衛星光譜圖像數據分析的準確性與可靠性，利用原有森林防火用的林區紅外探測器網，將其與衛星光譜圖像數據融合，可以使計算機獲得GPS接收機輸出的有關信息通過與RS實現高效互補性融合，從而彌補衛星圖譜不理想的缺失區數據信息，大大提高燃燒區火點信息準確度和敏感性。

2.2森林蓄積特征的估計

HampusHolmstrom等在瑞典南部的試驗區將SPOT-4×S衛星數據和CARABAS-IIVHFSAR傳感器的雷達數據進行了融合，采用KNN(knearestneighbor)方法對森林的蓄積特征(林分蓄積、樹種組成與年齡)進行了估計。

KNN方法就是采用目標樣地鄰近k個(k=10)最近樣地的加權來估計目標樣地的森林特征。研究者應用衛星光譜數據、雷達數據融合技術對試驗區的不同林分的蓄積特征進行估計，并對三種不同的數據方法進行誤差分析。試驗表明，融合后的數據作出的估計比單一的衛星數據或雷達數據的精度高且穩定性好。

2.3用非垂直航空攝像數據融合GIS信息更新調查數據

森林資源調查是掌握森林資源現狀與變化的調查方法，一般以地面調查的方法為主，我國5年復查一次。由于森林資源調查的工作量巨大，且要花費大量的人力、物力和資金。國內外許多學者都在探索航空、航天的遙感調查與估計方法。

TrevorJDavis等2002年提出采用非垂直的航空攝影數據融合對應的GIS數據信息實現森林調查數據的快速更新，認為對森林資源整體而言，僅某些特殊地區的資源數據需要更新。在直升飛機側面裝上可視的數字攝像裝置，利用GPS對測點進行定位，對特殊地區的攝像進行拍攝，同時與對應的GIS數據進行融合，做出資源變化的估計或影像的修正。

試驗表明，融合后的數據可以同高分辨率矯正圖像相比，該方法花費少，精度高，能充分利用影像的可視性，應用于偏遠、地形復雜、不易操作、成本高的區域，同時可避免遙感圖像受云層遮蓋。

三、數據融合在林業中的應用展望

3.1在木材檢測中的應用

3.1.1木材缺陷及其影響

木材是天然生長的有機體，生長過程中不可避免地有尖削度、彎曲度、節子等生長缺陷，這些缺陷極大地影響了木材及其制品的優良特性，以及木材的使用率、強度、外觀質量，并限制了其應用領域。在傳統木制品生產過程中，主要依靠人的肉眼來識別木材缺陷，而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異，且受木材紋理的影響，識別起來非常困難，勞動強度大，效率低，同時由于熟練程度、標準掌握等人為因素，可能造成較大的誤差。另外在集成材加工中，板材缺陷的非雙面識別嚴重影響了生產線的生產節拍。因此必須開發一種能夠對板材雙面缺陷進行在線識別和自動剔除技術，以解決集成材加工中節子人工識別誤差大、難以實現雙面識別、剔除機械調整時間長等問題。

3.1.2單一傳感器在木材檢測中的應用

對木材及人造板進行無損檢測的方法很多，如超聲波、微波、射線、機械應力、震動、沖擊應力波、快速傅立葉變換分析等檢測方法。超聲技術在木材工業中的應用研究主要集中在研究聲波與木材種類、木材結構和性能之間的關系、木材結構及缺陷分析、膠的固化過程分析等。

隨著計算機視覺技術的發展，人們也將視覺傳感器應用于木材檢測中。新西蘭科學家用視頻傳感器研究和測量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等，同時準確地測量單個纖維和全部纖維的幾何尺寸及其變化趨勢，能夠區分不同紙漿類型，測定木材纖維材料加固結合力，并動態地觀察木材纖維在材料中的結合機理。

新西蘭的基于視覺傳感器的板材缺陷識別的軟件已經產業化，該軟件利用數碼相機或激光掃描儀采集板材的圖像，自動識別板材節子和缺陷的位置，控制板材的加工。該軟件還具有進行原木三維模型真實再現的計算機視覺識別功能，利用激光掃描儀自動采集原木的三維幾何數據。

美國林產品實驗室利用計算機視覺技術對木材刨花的尺寸大小進行分級，確定各種刨花在板中的比例和刨花的排列方向；日本京都大學基于視覺傳感器進行了定向刨花板內刨花定向程度的檢測，從而可以通過調整定向鋪裝設備優化刨花的排列方向來提高定向刨花板的強度。

在制材加工過程中，利用計算機視覺技術在線實時檢測原木的形狀及尺寸，選擇最佳下鋸方法，提高原木的出材率。同時可對鋸材的質量進行分級，實現木材的優化使用；在膠合板的生產過程中，利用計算機視覺技術在線實時檢測單板上的各種缺陷，實現單板的智能和自動剪切，并可測量在剪切過程中的單板破損率，對單板進行分等分級，實現自動化生產過程。Wengert等在綜合了大量的板材分類經驗的基礎上，建立了板材分級分類的計算機視覺專家系統。在國內這方面的研究較少，王金滿等用計算機視覺技術對刨花板施膠效果進行了定量分析。

X射線對木材及木質復合材料的性能檢測已得到了廣泛的應用，目前該技術主要應用于對木材密度、含水率、纖維素相對結晶度和結晶區大小、纖維的化學結構和性質等進行檢測，并對木材內部的各種缺陷進行檢測。

3.1.3數據融合在木材檢測中的應用展望

單一傳感器在木材工業中已得到了一定程度的應用，但各種單項技術在應用上存在一定的局限性。如視覺傳感器不能檢測到有些與木材具有相同顏色的節子，有時會把木板上的臟物或油脂當成節子，造成誤判，有時也會受到木材的種類或粗糙度和濕度的影響，此外，這種技術只能檢測部分表面缺陷，而無法檢測到內部缺陷；超聲、微波、核磁共振和X射線技術均能測量密度及內部特征，但是它們不能測定木材的顏色和瑕疵，因為這些缺陷的密度往往同木板相同。因此，一個理想的檢測系統應該集成各種傳感技術，才能準確、可靠地檢測到木材的缺陷。

基于多傳感器(機器視覺及X射線等)數據融合技術的木材及木制品表面缺陷檢測，可以集成多個傳統單項技術，更可靠、準確地實時檢測出木材表面的各種缺陷，為實現木材分級自動化、智能化奠定基礎，同時為集裁除鋸、自動調整、自動裁除節子等為一身的新型視頻識別集成材雙面節子數控自動剔除成套設備提供技術支持。

3.2在精確林業中的應用

美國華盛頓大學研究人員開展了樹形自動分析、林業作業規劃等研究工作；Auburn大學的生物系統工程系和USDA南方林業實驗站與有關公司合作開展用GPS和其他傳感器研究林業機器系統的性能和生產效率。

目前單項的GPS、RS、GIS正從“自動化孤島”形式應用于林業生產向集成技術轉變。林業生產系統作為一個多組分的復雜系統，是由能量流動、物質循環、信息流動所推動的具有一定的結構和功能的復合體，各組分間的關系和結合方式影響系統整體的結構和功能。因此應該在計算機集成系統框架下，有效地融合GPS、GIS、RS等數據，解決這些信息在空間和時間上的質的差異及空間數據類型的多樣性，如地理統計數據、柵格數據、點數據等。利用智能DSS(決策支持系統)以及VRT(可變量技術)等，使林業生產成為一個高效、柔性和開放的體系，從而實現林業生產的標準化、規范化、開放性，建立基于信息流融合的精確林業系統。

南京林業大學提出了“精確林業工程系統”。研究包括精確林業工程系統的領域體系結構、隨時空變化的數據采集處理與融合技術、精確控制林業生產的智能決策支持系統、可變量控制技術等，實現基于自然界生物及其所賴以生存的環境資源的時空變異性的客觀現實，以最小資源投入、最小環境危害和最大產出效益為目標，建立關于林業管理系統戰略思想的精確林業微觀管理系統。

[參考文獻]

計算機視覺研究的目的精選(九篇)

第1篇：計算機視覺研究的目的范文

第2篇：計算機視覺研究的目的范文

第3篇：計算機視覺研究的目的范文

第4篇：計算機視覺研究的目的范文

第5篇：計算機視覺研究的目的范文

第6篇：計算機視覺研究的目的范文

第7篇：計算機視覺研究的目的范文

第8篇：計算機視覺研究的目的范文

第9篇：計算機視覺研究的目的范文

相關熱門標簽

相關文章閱讀

相關期刊推薦

計算物理

計算機

計算數學

現代計算機

航空計算技術

精選范文推薦