前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺技術(shù)應(yīng)用主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:計算機;視覺技術(shù);交通工程
中圖分類號:TP391 文獻標識碼:A 文章編號:1674-7712 (2014) 04-0000-01
一、引言
隨著科技的發(fā)展,計算機替代人的視覺與思維已經(jīng)成為現(xiàn)實,這也是計算機視覺的突出顯現(xiàn)。那么在物體圖像中識別物體并作進一步處理,是客觀世界的主觀反應(yīng)。在數(shù)字化圖像中,我們可以探尋出較為固定的數(shù)字聯(lián)系,在物體特征搜集并處理時做到二次實現(xiàn)。這既是對物體特征的外在顯現(xiàn)與描繪,更是對其定量信息的標定。從交通工程領(lǐng)域的角度來看,該種技術(shù)一般應(yīng)用在交管及安全方面。監(jiān)控交通流、識別車況及高速收費都是屬于交通管理的范疇;而對交通重大事件的勘察及甄別則是交通安全所屬。在這個基礎(chǔ)上,筆者對計算機視覺系統(tǒng)的組成及原理進行了分析,并形成視覺處理相關(guān)技術(shù)研究。
二、設(shè)計計算機視覺系統(tǒng)構(gòu)成
計算機視覺處理技術(shù)的應(yīng)用是建立在視覺系統(tǒng)的建立基礎(chǔ)上的。其內(nèi)部主要的構(gòu)成是計算機光源、光電轉(zhuǎn)換相關(guān)器件及圖像采集卡等元件。
(一)照明條件的設(shè)計。在測量物體的表征時,環(huán)境的創(chuàng)設(shè)是圖像分析處理的前提,其主要通過光線反射將影像投射到光電傳感器上。故而要想獲得清晰圖像離不開照明條件的選擇。在設(shè)計照明條件時,我們通常會視具體而不同處理,不過總的目標是一定的,那就是要利于處理圖像及對其進行提取分析。在照明條件的設(shè)定中,主動視覺系統(tǒng)結(jié)構(gòu)光是較為典型的范例。
(二)數(shù)據(jù)采集的處理。如今電耦合器件(CCD)中,攝像機及光電傳感器較為常見。它們輸出形成的影像均為模擬化的電子信號。在此基礎(chǔ)上,A模式與D模式的相互對接更能夠讓信號進入計算機并達到數(shù)字處理標準,最后再量化入計算機系統(tǒng)處理范圍。客觀物體色彩的不同,也就造就了色彩帶給人信息的差異。一般地黑白圖像是單色攝像機輸入的結(jié)果;彩色圖像則需要彩色相機來實現(xiàn)。其過程為:彩色模擬信號解碼為RGB單獨信號,并單獨A/D轉(zhuǎn)換,輸出后借助色彩查找表來顯示相應(yīng)色彩。每幅圖像一旦經(jīng)過數(shù)字處理就會形成點陣,并將n個信息濃縮于每點中。彩色獲得的圖像在16比特,而黑白所獲黑白灰圖像則僅有8比特。故而從信息采集量上來看,彩色的圖像采集分析更為繁復(fù)些。不過黑白跟灰度圖像也基本適應(yīng)于基礎(chǔ)信息的特征分析。相機數(shù)量及研究技法的角度,則有三個分類:“單目視覺”、“雙目”及“三目”立體視覺。
三、研究與應(yīng)用計算機視覺處理技術(shù)
從對圖像進行編輯的過程可以看出,計算機視覺處理技術(shù)在物體成像及計算后會在灰度陣列中參雜無效信息群,使得信息存在遺失風險。成像的噪聲在一定程度上也對獲取有效信息造成了干擾。故而,處理圖像必須要有前提地預(yù)設(shè)分析,還原圖像本相,從而消去噪音。邊緣增強在特定的圖像變化程度中,其起到的是對特征方法的削減?;诙祷?,分割圖像才能夠進一步開展。對于物體的檢測多借助某個范圍來達到目的。識別和測算物體一般總是靠對特征的甄別來完成的。
四、分析處理三維物體技術(shù)
物體外輪擴線及表面對應(yīng)位置的限定下,物體性質(zhì)的外在表現(xiàn)則是其形狀。三維物體從內(nèi)含性質(zhì)上來看也有體現(xiàn),如通過其內(nèi)含性質(zhì)所變現(xiàn)出來的表層構(gòu)造及邊界劃定等等。故而在確定圖像特征方面,物體的三維形態(tài)是最常用的處理技術(shù)。檢測三維物體形狀及分析距離從計算機視覺技術(shù)角度來看,渠道很多,其原理主要是借助光源特性在圖像輸入時的顯現(xiàn)來實現(xiàn)的。其類別有主動與被動兩類。借助自然光照來對圖像獲取并挖掘深入信息的技術(shù)叫做被動測距;主動測距的光源條件則是利用人為設(shè)置的,其信息也是圖像在經(jīng)過測算分析時得到的。被動測距的主要用途體現(xiàn)在軍工業(yè)保密及限制環(huán)境中,而普通建筑行業(yè)則主要利用主動測距。特別是較小尺寸物體的測算,以及擁有抗干擾及其他非接觸測距環(huán)境。
(一)主動測距技術(shù)。主動測距,主要是指光源條件是在人為創(chuàng)設(shè)環(huán)境中滿足的,且從景物外像得到相關(guān)點化信息,可以適當顯示圖像大概并進行初步分析處理,以對計算適應(yīng)功率及信息測算程度形成水平提高。從技術(shù)種類上說,主動測距技術(shù)可分為雷達取像、幾何光學(xué)聚焦、圖像干擾及衍射等。除了結(jié)構(gòu)光法外的測量方法均為基于物理成像,并搜集所成圖像,并得到特殊物理特征圖像。從不同的研究環(huán)境到條件所涉,以結(jié)構(gòu)光法測量作為主要技術(shù)的工程需求較為普遍,其原理為:首先在光源的設(shè)計上由人為來進行環(huán)境考慮測算,再從其中獲取較為全面的離散點化信息。在離散處理后,此類圖像已經(jīng)形成了較多的物體真是特征表象。在此基礎(chǔ)上,信息需要不斷簡化與甄別、壓縮。如果分析整個物體特征信息鏈,則后期主要體現(xiàn)在對于數(shù)據(jù)的簡化分析。如今人們已經(jīng)把研究的目光轉(zhuǎn)向了結(jié)構(gòu)光測量方法的應(yīng)用,體現(xiàn)在物體形狀檢測等方面。
(二)被動測距技術(shù)。被動測距,對光照條件的選擇具有局限性,其主要通過對于自然光的覆蓋得以實現(xiàn)。它在圖像原始信息處理及分析匹配方面技術(shù)指向較為突出。也通過此三維物體之形狀及周圍環(huán)境深度均被顯露。在圖像原始信息基礎(chǔ)上的應(yīng)用計算,其與結(jié)構(gòu)光等相比繁雜程度較高。分析物體三維特性,著重從立體視覺內(nèi)涵入手,適應(yīng)物體自身特點而存在。不過相對來說獲得圖像特征才是其適應(yīng)匹配的條件保障。點、線、區(qū)域及結(jié)構(gòu)紋理等是物象特征的主體形式。其中物特較為基礎(chǔ)與原始的特征是前兩個特征,同時它們也是其他相關(guān)表征的前提。計算機系統(tǒng)技術(shù)測量基本原理為對攝像機進行構(gòu)建分析,并對其圖像表征進行特征匹配,以得到圖像不同區(qū)間的視覺差異。
五、結(jié)束語
通過對計算機視覺技術(shù)的研究,悉知其主要的應(yīng)用領(lǐng)域及技術(shù)組成。在系統(tǒng)使用的基礎(chǔ)上深入設(shè)計,對系統(tǒng)主要構(gòu)成環(huán)節(jié)進行分析。從而將三維復(fù)雜形態(tài)原理、算法及測量理論上升到實際應(yīng)用。隨著社會對于計算機的倚賴程度增加,相信該技術(shù)在建筑或者其他領(lǐng)域會有更加深入的研究及應(yīng)用。
參考文獻:
[1]段里仁.智能交通系境在我國道路空通管理中的應(yīng)用[J].北方工業(yè)時報,2012(06).
[2]王豐元.計算機視覺在建筑區(qū)間的應(yīng)用實例分析[J].河北電力學(xué)報,2011(04).
關(guān)鍵詞:計算機視覺;果蔬分類;應(yīng)用;挑戰(zhàn);展望
自“農(nóng)業(yè)4.0”時代的來臨,以“互聯(lián)網(wǎng)+”為驅(qū)動的農(nóng)業(yè)技術(shù)已成為發(fā)展農(nóng)業(yè)強有力的支撐。在果蔬業(yè)中,果蔬分類通常由經(jīng)過訓(xùn)練的人員人工評估農(nóng)產(chǎn)品或農(nóng)作物的質(zhì)量。但是,人工分類會帶來許多相關(guān)的限制,工作人員需要熟悉果蔬的許多特征,并且高強度的機械性工作帶來的失誤不可避免,因而分類技術(shù)的提高是農(nóng)產(chǎn)品質(zhì)量提升的關(guān)鍵。計算機視覺技術(shù)具有效率高、非接觸、抗干擾能力強等優(yōu)點,在多個領(lǐng)域已經(jīng)廣泛應(yīng)用,能實現(xiàn)農(nóng)產(chǎn)品快速無損檢測的要求[1]。果蔬分級效率的提升對我國產(chǎn)品質(zhì)量提升、農(nóng)民增產(chǎn)增收具有重要意義。
1圖像處理技術(shù)在果蔬分類領(lǐng)域的應(yīng)用
本文對基于計算機視覺技術(shù)的果蔬分類進行了比較調(diào)查,發(fā)現(xiàn)研究人員多使用一種或者多種傳感器或者機器學(xué)習技術(shù)進行農(nóng)產(chǎn)品的分類與分級,但是由于相同水果品種不同造成形狀、大小與顏色的不同,果蔬的分類依然面臨著許多挑戰(zhàn)[2]。為解決這些問題研究人員已經(jīng)進行了多種實驗,其中結(jié)合機器學(xué)習技術(shù)對于系統(tǒng)有明顯提升。通過使用傳感器捕獲水果與蔬菜的特征,使用機器學(xué)習對任務(wù)進行優(yōu)化,以提高系統(tǒng)整體性能[3]。
2果蔬分類的主要挑戰(zhàn)
雖然已經(jīng)在多個產(chǎn)業(yè)中實現(xiàn)目標分類,但將果蔬作為對象進行分類仍然是一項復(fù)雜的問題。在實際過程中,環(huán)境、光及空間等因素制約了系統(tǒng)的優(yōu)化,使系統(tǒng)的時間與準確性方面受到限制。光照方向及亮度、色溫以及背景所造成的鏡面反射與漫反射都會制約系統(tǒng)的進一步優(yōu)化,并且不同種類果蔬的特征并不相同,這也使果蔬分類系統(tǒng)沒有被廣泛地開發(fā)。
2.1缺乏合適的傳感器
分類任務(wù)的一個關(guān)鍵步驟就是選擇適合場景的傳感器用于數(shù)據(jù)采集。在果蔬的分類任務(wù)中視覺傳感器與非視覺傳感器已經(jīng)廣泛地應(yīng)用,但是由于各種傳感器性質(zhì)不同其所適用的應(yīng)用場景亦有不同[4-6]。例如超聲波傳感器與觸覺傳感器都不太適合易損的目標物[7]。因為這些傳感器需要物理接觸果蔬以獲取數(shù)據(jù)。另外,視覺傳感器對許多因素高度敏感,例如照明條件和背景環(huán)境。這些基本因素是許多復(fù)雜因素的結(jié)合,包括反射、折射、縮放、旋轉(zhuǎn)和平移,這在系統(tǒng)實際的設(shè)計中需要深入考慮。傳感器大致分為視覺傳感器和非視覺傳感器。由于每個傳感器具有一定的局限性,例如視覺傳感器對照明條件和背景顏色高度敏感。高光譜相機可以得出物體反射特性,檢測具有相似顏色或背景的不同對象的固有特性,其對許多顏色等因素不敏感,并且高光譜信息與水果的其他特征相結(jié)合,可以提高系統(tǒng)性能。最近,熱紅外分析已用于許多領(lǐng)域,例如植物病害檢測、冷藏對果實的冷害、農(nóng)作物成熟度估算和農(nóng)作物產(chǎn)量估算[8]。然而,由于蔬菜和背景的熱物理性質(zhì)大致相似,并且這種技術(shù)對溫度變化敏感,因而熱紅外分析仍不能很好地完成綠顏色水果和多葉蔬菜的分類任務(wù)。
2.2難以準確選擇特征
特征是用于與其他物體區(qū)分的物理特征。果蔬具有多種物理特征,例如顏色、質(zhì)地、形狀和大小,這些都是可以用作分類的特征參數(shù),并且果蔬具有類間和類內(nèi)的同異性。類別間的變化是主要變化,即顏色、紋理和形狀的變化,而類別內(nèi)的變化更難以發(fā)現(xiàn),特征更加難以區(qū)分。理想的系統(tǒng)能夠進行類間和類內(nèi)分類。研究表明,單個特征不能有效地對果蔬或物體進行有效分類。計算機視覺是用于圖像分類和識別的一種技術(shù),可以設(shè)計算法通過多種方式對果蔬進行分類,通常分類是基于神經(jīng)網(wǎng)絡(luò)完成。在任何機器學(xué)習應(yīng)用程序中選擇合適的算法至關(guān)重要,但是由于果蔬的類間相似性,算法優(yōu)化尤為重要。數(shù)字圖像中某些與特性有關(guān)信息的識別、分類、檢索、重建稱為特征描述,果蔬具有相關(guān)的獨特視覺特征。果蔬的分類和識別最常用的特征是顏色、形狀、大小和質(zhì)地,可以根據(jù)整體或局部圖像特征來選擇特征描述是全局或者局部的特征。特別是對于對象識別,全局圖像特征描述整個對象,具有良好的不變性,而局部圖像特征則易于實現(xiàn)快速匹配。因此,通常將局部和全局圖像特征配合使用以提高整體性能。在圖像經(jīng)過去噪、平滑等操作之后,圖像的細節(jié)將不可避免地丟失,因而需要更加注意特征的選取。這些因素對特征描述的選取造成了一些限制。
3展望
數(shù)據(jù)挖掘就是從大量的不完全的有噪聲的模糊的隨機的實際應(yīng)用數(shù)據(jù)中,抽取隱含在其中的、事先并不知道的、但又是潛在有用的信息和知識的過程。
決策樹算法作為常用的數(shù)據(jù)挖掘技術(shù)之一,其基本思想是將實例庫中記錄的大量有限的具體事實數(shù)據(jù)進行歸納和分類并建立樹型結(jié)構(gòu),以發(fā)現(xiàn)并形成隱含在大量實例中的若干形式化的分類判別規(guī)則,典型的決策樹算法方法有ID3方法和IBLE(Information—based Learning from Example)方法。
利用決策樹評估教材質(zhì)量的基本思想
筆者以高校教學(xué)質(zhì)量建設(shè)中的重頭戲——教材建設(shè)為例來闡釋決策樹算法在教育統(tǒng)計學(xué)中的應(yīng)用。
從教材的教學(xué)水平,科學(xué)水平等兩大要素來對教材的質(zhì)量進行合理分類,探索出科學(xué)合理的決策樹的模型,使之成為學(xué)校教材建設(shè)管理的理論方法,并在今后的教材管理中起著一定的指導(dǎo)作用。
教學(xué)水平:教材符合人才培養(yǎng)目標及本課程教學(xué)的要求:取材合適、深度適宜、份量恰當;符合認知規(guī)律;富有啟發(fā)性;便于學(xué)習。
科學(xué)水平:能反映本學(xué)科國內(nèi)外科學(xué)研究和教學(xué)研究的先進成果;能完整地表達本課程應(yīng)包含的知識;反映其相互聯(lián)系及發(fā)展規(guī)律;結(jié)構(gòu)嚴謹。
構(gòu)建決策樹模型
即利用訓(xùn)練集(教材建設(shè)數(shù)據(jù)庫)建立并精化一棵決策樹。該過程可分為建樹和剪枝兩階段。其中,建樹是用每一個屬性將訓(xùn)練集劃分成一個或多個子集,遞歸地調(diào)用該過程,直到每個子集中的記錄都屬于同一類,最終得到?jīng)Q策樹。剪枝是為提高樹的精度及分類效率,而去掉因訓(xùn)練數(shù)據(jù)中的噪聲和孤立點等引起的不可靠或可能是噪聲的一些枝條。
利用決策樹研究影響教材質(zhì)量的因素
首先,將學(xué)生問卷調(diào)查數(shù)據(jù)庫和教學(xué)管理部門所掌握的資料結(jié)合起來,分類整理,同時進行規(guī)范化的數(shù)據(jù)清洗,得到創(chuàng)建決策樹模型的訓(xùn)練集,如表1所示。
根據(jù)評估預(yù)期的要求,將所有教材的評估結(jié)果分為兩類:
Class p:綜合評價=“優(yōu)秀”
Class n:綜合評價=“一般”
從上表顯示的數(shù)據(jù)可知,綜合評價為“一般”的教材有9種, 綜合評價為“優(yōu)秀”的教材有6種,從而可以計算出樣本分類的期望信息:
—∑Pi log2(pi)=
I(p,n)=I(9,6)= —[(9/15)×log2(9/15)+6/15×log2=(6/15)]
=—(—0.444—0.53)=0.974
下面以綜合評價是否為“優(yōu)秀”作為衡量標準分別計算由各個屬性劃分子集的信息熵,以及各自的信息增益度。
計算“教學(xué)水平”的信息增加益度
從而算出信息熵E(教學(xué)水平)=
I(3,1)+I(3,2)+I(0,3)+I(0,3)=0.43
再計算出其信息增益度
GainI(p,n)—E(教學(xué)水平)=0.974—0.507=0.467
計算“科學(xué)水平”的信息增益度
計算信息熵E(科學(xué)水平)=I(2,1)+I(3,2)+I(1,6)+I(0,0)—0.783再計算出其信息增益度GainI(科學(xué)水平)=I(p,n)—E(科學(xué)水平)=0.974—0.783=0.191
計算“教材編者職稱”的信息增益度
從而算出信息熵E(教材編者職稱)=I(4,1)+I(2,1)+I(0,4)+I(0,3)=0.424再計算出其信息增益度GainI(教材編者職稱)—I(p,n)—E(教材編者職稱)=0.974—0.424=0.55
計算“教材編者學(xué)歷”的信息增益度
計算信息熵E(教材編者學(xué)歷)=I(3,1)+I(3,3)+I(0,5)=0.667再計算出其信息增益度GainI(教材編者學(xué)歷)=(p,n)—(教材編者學(xué)歷)=0.974—0.667=0.307
由此可以得知“教材編者職稱”的信息增益度最大,它是最能區(qū)別訓(xùn)練集實例中教材質(zhì)量的屬性,應(yīng)作為決策樹的根節(jié)點。根據(jù)各個屬性的信息增益度的大小,可以構(gòu)建該訓(xùn)練集實例的決策樹如下圖1所示:
由該決策樹可以得出諸如以下結(jié)論:
1 計算機視覺定義
人類天生具有五感,視覺便是其中之一,而計算機視覺,就是讓計算機網(wǎng)絡(luò)能夠睜開眼看世界。讓計算機有一定的視覺能力,可以從各個方面幫助人們進行監(jiān)督、檢驗檢測。利用計算機視覺科學(xué)可以使工作變得更加簡便。計算機視覺主要應(yīng)用于對二維碼、條形碼、照片、視頻資料如片段等進行智能處理。
2 計算機視覺研究在醫(yī)療、交通中的作用
隨著醫(yī)學(xué)成像技術(shù)的發(fā)展與進步,圖像處理在醫(yī)學(xué)研究與臨床醫(yī)學(xué)中的應(yīng)用越來越廣泛。最常見的有癌細胞顯微圖像分割與識別、基于多特征融合的血紅細胞識別和乳腺癌細胞計算機的自動識別等。計算機視覺技術(shù)的迅猛發(fā)展,為醫(yī)療診斷帶來了很大的方便,同時促進了臨床醫(yī)學(xué)的發(fā)展。另外,在各大綜合醫(yī)院慢慢發(fā)展起的體檢體系中,計算機視覺技術(shù)起到了決定性因素。隨著體檢的人數(shù)上升,對醫(yī)院體檢的管理、速度、準確性都提出了更高的要求。視覺識別輕而易舉的解決了這個問題,只需要去識別體檢人員的身份證,就可以將體檢人員對號入座,檢查過的項目,沒有檢查的項目一目了然。理化指標的檢驗,只需要在采血試管或采尿瓶上粘貼與體檢者對應(yīng)的條形碼即可,利用視覺技術(shù)對號入座,方便而準確的確定每一位體檢人員的血樣及尿樣。及提高了醫(yī)院的工作效率,又將錯誤率降到最低。
計算機視覺在交通上同樣得到了廣泛的應(yīng)用及發(fā)展。交通安全是交通運輸中的重大問題,隨著近年來機動汽車數(shù)量的迅猛增長,交通事故的發(fā)生也隨之越來越頻繁,給人類社會帶來的危害也日趨嚴重,使很多的家庭失去親人,甚至家破人亡。全國一線城市例如:北京、上海、廣州、深圳等交通道路供需的矛盾日趨嚴重,交通安全、交通堵塞及環(huán)境污染已成為困擾我國交通領(lǐng)域的三大難題?;趫D像處理的計算機視覺技術(shù)是通過攝像機獲取場景圖像,并借助于計算機軟件構(gòu)建一個自動化或半自動化的圖像、視頻理解和分析系統(tǒng),并提供及時準確的圖像、視頻處理結(jié)果,以模仿人的視覺功能。主要功能如下:
一是基于計算機視覺技術(shù)的車輛牌照自動識別: 車輛牌照是車輛的唯一身份,對車輛牌照的有效檢測與識別在車輛違章檢測、停車場管理、不停車收費、被盜車輛稽查等方面有著重要的應(yīng)用價值。盡管針對車牌識別技術(shù)的研究相對成熟,然而在實際的應(yīng)用場景中,受到天氣、光照、拍攝視角、車牌扭曲等因素的影響,車牌識別技術(shù)仍然有一定的改善空間。
二是基于計算機視覺技術(shù)的車輛檢測與流量統(tǒng)計:目前城市交通路口的紅路燈間隔時間是固定的,而不同路段、不同時間段交通流量是隨機變化的。若能根據(jù)各個交通路口的交通狀況輔以計算機進行自動分析,并判斷與預(yù)測交通流量,無疑為交通警察出警,紅綠燈時間間隔的動態(tài)設(shè)置等提供技術(shù)支持。
三是基于計算機視覺技術(shù)的公交專用道路非法占道抓拍:公共交通是每個城市交通的重中之重,城市的公共交通為老百姓提供了便捷的出行方式。公共交通的發(fā)展,有利于城市的節(jié)能減排,有利于降低城市的空氣污染指數(shù)。由于城市公共交通具有運量大、相對投資少、人均占有道路少等優(yōu)點,解決城市交通問題必須優(yōu)先發(fā)展城市公共交通。然而目前擁擠、緩慢的公交出行方式已成詬病,因此發(fā)展“快速公交”將是未來公交的一種運行模式。道路暢通則是發(fā)展“快速公交”的前提,相應(yīng)地,公交專用車道的設(shè)定必不可少。為防止其他社會車輛的駛?cè)?,并對違規(guī)駛?cè)氲钠渌鐣`規(guī)車輛進行抓拍與懲罰是保證公交車道公交車專駛的一種重要手段。因此在公交車前部裝置攝像頭并輔以其他處理設(shè)備,從而可以使得每一輛公交車成為了一個流動的監(jiān)控設(shè)備。
3 計算機視覺在條形碼檢測中的應(yīng)用
條形碼是將寬度不等的多個黑條和空白,按照一定的編碼規(guī)則排列,用以表達一組信息的圖形標識符。在中國,由中國物品編碼中心賦予制造廠商代碼。那么最常見的計算機視覺應(yīng)用與條形碼檢測就是在超市中。超市中每樣產(chǎn)品都有自己的條形碼,當人們選擇了自己需要的物品后,來到收銀臺進行結(jié)賬,我們會看見收銀人員會用掃碼器對物品的條形碼進行掃描,掃描后就會出現(xiàn)產(chǎn)品的信息及價錢。記錄以及掃描條形碼的技術(shù)就是計算機視覺技術(shù)。
4 計算機視覺重要技術(shù)——智能識別
近年來,基于生物特征的鑒別技術(shù)得到了廣泛重視,主要集中在對人臉、虹膜、指紋、聲音等特征上,這其中大多都與視覺信息有關(guān)。指紋、人臉功能已經(jīng)大范圍在生活中應(yīng)用,其中很多單位的打卡制度就是依據(jù)面部識別、指紋識別來實現(xiàn)的。社會飛速發(fā)展的今天,很多的單位都實行了上下班打卡制度,這一制度已經(jīng)被作為單位管理制度中的重要一條。購買的打卡機就是采用計算機視覺的重要技術(shù)——智能識別來實現(xiàn)的。利用打卡機的儲存功能,記錄每個職工的指紋或面部容貌,規(guī)定在某一個時間范圍內(nèi)對應(yīng)識別指紋或面部容貌,視為打卡。在上下班打卡的過程中,員工將面部或指紋對應(yīng)在打卡機的制定位置上,讓打卡機進行識別,當識別的結(jié)果與存儲結(jié)果相同時,打卡成功。這樣看起來十分簡單的打卡機可以使單位的工作有序化,制度化,而實現(xiàn)這個功能的技術(shù)就是計算機視覺技術(shù)中的重要技術(shù)之一:智能識別。
5 計算機視覺技術(shù)的發(fā)展過程及未來
計算機視覺技術(shù)研究經(jīng)歷了近40年的過程,20世紀50年代的統(tǒng)計模式識別、60年代的Roberts的三圍積木世界、70年代的Marr為代表的計算理論、80年代的主動視覺,但是仍然面臨許多的問題。主要由于計算機視覺是一個逆問題,視覺信息多種多樣,視覺知識的表達很困難,圖像數(shù)據(jù)量巨大,信息存儲于檢索困難,對生物學(xué)、神經(jīng)生物學(xué)等的研究有待深入。
計算機視覺技術(shù)的未來必定會朝著高科技發(fā)展,航空遙感測控地形地貌、電影特效制作、工業(yè)生產(chǎn)自動化檢測、醫(yī)學(xué)影像檢測,再到天文領(lǐng)域等,在這些科學(xué)領(lǐng)域中計算機視覺將無法取代,成為主流的技術(shù)之一。
作者簡介
【關(guān)鍵詞】精密測量 計算機視覺圖像 關(guān)鍵技術(shù)
在現(xiàn)代城市的建設(shè)中離不開測量的運用,對于測量而言需要精確的數(shù)值來表達建筑物、地形地貌等特征及高度。在以往的測量中無法精準的進行計算及在施工中無法精準的達到設(shè)計要求。本文就計算機視覺圖像精密測量進行分析,并對其關(guān)鍵技術(shù)做以簡析。
1 概論
1.1 什么是計算機視覺圖像精密測量
計算機視覺精密測量從定義上來講是一種新型的、非接觸性測量。它是集計算機視覺技術(shù)、圖像處理技術(shù)及測量技術(shù)于一體的高精度測量技術(shù),且將光學(xué)測量的技術(shù)融入當中。這樣讓它具備了快速、精準、智能等方面的優(yōu)勢及特性。這種測量方法在現(xiàn)代測量中被廣泛使用。
1.2 計算機視覺圖像精密測量的工作原理
計算機視覺圖像精密測量的工作原理類似于測量儀器中的全站儀。它們具有相同的特點及特性,主要還是通過微電腦進行快速的計算處理得到使用者需要的測量數(shù)據(jù)。其原理簡單分為以下幾步:
(1)對被測量物體進行圖像掃描,在對圖像進行掃描時需注意外借環(huán)境及光線因素,特別注意光線對于儀器掃描的影響。
(2)形成比例的原始圖,在對于物體進行掃描后得到與現(xiàn)實原狀相同的圖像,在個步驟與相機的拍照原理幾乎相同。
(3)提取特征,通過微電子計算機對掃描形成的原始圖進行特征的提取,在設(shè)置程序后,儀器會自動進行相應(yīng)特征部分的關(guān)鍵提取。
(4)分類整理,對圖像特征進行有效的分類整理,主要對于操作人員所需求的數(shù)據(jù)進行整理分類。
(5)形成數(shù)據(jù)文件,在完成以上四個步驟后微計算機會對于整理分類出的特征進行數(shù)據(jù)分析存儲。對于計算機視覺圖像精密測量的工作原理就進行以上分析。
1.3 主要影響
從施工測量及測繪角度分析,對于計算機視覺圖像精密測量的影響在于環(huán)境的影響。其主要分為地形影響和氣候影響。地形影響對于計算機視覺圖像精密測量是有限的,基本對于計算機視覺圖像精密測量的影響不是很大,但還是存在一定的影響。主要體現(xiàn)在遮擋物對于掃描成像的影響,如果掃描成像質(zhì)量較差,會直接影響到對于特征物的提取及數(shù)據(jù)的準確性。還存在氣候影響,氣候影響的因素主要在于大風及光線影響。大風對于掃描儀器的穩(wěn)定性具有一定的考驗,如有稍微抖動就會出現(xiàn)誤差不能準確的進行精密測量。光線的影響在于光照的強度上,主要還是表現(xiàn)在基礎(chǔ)的成像,成像結(jié)果會直接導(dǎo)致數(shù)據(jù)結(jié)果的準確性。
2 計算機視覺圖像精密測量下的關(guān)鍵技術(shù)
計算機視覺圖像精密測量下的關(guān)鍵技術(shù)主要分為以下幾種:
2.1 自動進行數(shù)據(jù)存儲
在對計算機視覺圖像精密測量的原理分析,參照計算機視覺圖像精密測量的工作原理,對設(shè)備的質(zhì)量要求很高,計算機視覺圖像精密測量儀器主要還是通過計算機來進行數(shù)據(jù)的計算處理,如果遇到計算機系統(tǒng)老舊或處理數(shù)據(jù)量較大,會導(dǎo)致計算機系統(tǒng)崩潰,導(dǎo)致計算結(jié)果無法進行正常的存儲。為了避免這種情況的發(fā)生,需要對于測量成果技術(shù)進行有效的存儲。將測量數(shù)據(jù)成果存儲在固定、安全的存儲媒介中,保證數(shù)據(jù)的安全性。如果遇到計算機系統(tǒng)崩潰等無法正常運行的情況時,應(yīng)及時將數(shù)據(jù)進行備份存儲,快速還原數(shù)據(jù)。在對于前期測量數(shù)據(jù)再次進行測量或多次測量,系統(tǒng)會對于這些數(shù)據(jù)進行統(tǒng)一對比,如果出現(xiàn)多次測量結(jié)果有所出入,系統(tǒng)會進行提示。這樣就可以避免數(shù)據(jù)存在較大的誤差。
2.2 減小誤差概率
在進行計算機視覺圖像精密測量時往往會出現(xiàn)誤差,而導(dǎo)致這些誤差的原因主要存在于操作人員與機器系統(tǒng)故障,在進行操作前操作員應(yīng)對于儀器進行系統(tǒng)性的檢查,再次使用儀器中的自檢系統(tǒng),保證儀器的硬件與軟件的正常運行,如果硬軟件出現(xiàn)問題會導(dǎo)致測量精度的誤差,從而影響工作的進度。人員操作也會導(dǎo)致誤差,人員操作的誤差在某些方面來說是不可避免的。這主要是對操作人員工作的熟練程度的一種考驗,主要是對于儀器的架設(shè)及觀測的方式。減少人員操作中的誤差,就要做好人員的技術(shù)技能培訓(xùn)工作。讓操作人員有過硬過強的操作技術(shù),在這些基礎(chǔ)上再建立完善的體制制度。利用多方面進行全面控制誤差。
2.3 方便便攜
在科學(xué)技術(shù)發(fā)展的今天我們在生活當中運用到東西逐漸在形狀、外觀上發(fā)生巨大的變大。近年來,對于各種儀器設(shè)備的便攜性提出了很高的要求,在計算機視覺圖像精密測量中對設(shè)備的外形體積要求、系統(tǒng)要求更為重要,其主要在于人員方便攜帶可在大范圍及野外進行測量,不受環(huán)境等特殊情況的限制。
3 計算機視覺圖像精密測量發(fā)展趨勢
目前我國國民經(jīng)濟快速發(fā)展,我們對于精密測量的要求越來越來高,特別是近年我國科技技術(shù)的快速發(fā)展及需要,很多工程及工業(yè)方面已經(jīng)超出我們所能測試的范圍。在這樣的前景下,我們對于計算機視覺圖像精密測量的發(fā)展趨勢進行一個預(yù)估,其主要發(fā)展趨勢有以下幾方面:
3.1 測量精度
在我們?nèi)粘I钪?,我們常用的長度單位基本在毫米級別,但在現(xiàn)在生活中,毫米級別已經(jīng)不能滿足工業(yè)方面的要求,如航天航空方面。所以提高測量精度也是計算機視覺圖像精密測量發(fā)展趨勢的重要方向,主要在于提高測量精度,在向微米級及納米級別發(fā)展,同時提高成像圖像方面的分辨率,進而達到我們預(yù)測的目的。
3.2 圖像技術(shù)
計算機的普遍對于各行各業(yè)的發(fā)展都具有時代性的意義,在計算機視覺圖像精密測量中運用圖像技術(shù)也是非常重要的,在提高圖像處理技術(shù)做以提高。同時工程方面遙感測量的技術(shù)也是對于精密測量的一種推廣。
4 結(jié)束語
在科技發(fā)展的現(xiàn)在,測量是生活中不可缺少的一部分,測量同時也影響著我們的衣食住行,在測量技術(shù)中加入計算機視覺圖像技術(shù)是對測量技術(shù)的一種革新。在融入這種技術(shù)后,我相信在未來的工業(yè)及航天事業(yè)中計算機視覺圖像技g能發(fā)揮出最大限度的作用,為改變?nèi)藗兊纳钭龀鼋艹龅呢暙I。
參考文獻
[1]湯劍.周芳芹.楊繼隆.計算機視覺圖像系統(tǒng)的技術(shù)改造[J].機電產(chǎn)品開發(fā)與創(chuàng)新周刊,2015,14(18):33-36.
[2]馬玉真.程殿彬.范文兵,計算機視覺檢測技術(shù)的發(fā)展及應(yīng)用研究[J].濟南大學(xué)學(xué)報,2014,18(23):222-227.
[3]李華.基于計算機視覺圖像精密測量的關(guān)鍵技術(shù)分析[J].電腦知識與技術(shù),2013(05):1211-1212.
1計算機視覺概述
1.1計算機視覺學(xué)概述
從某種意義上說,計算機視覺學(xué)是一門在20世紀60年代興起的新學(xué)科。它是一門邊緣學(xué)科,融入了很多學(xué)科的特點,具有很強的工程性特征。比如,圖像處理、應(yīng)用數(shù)學(xué)、光電技術(shù)。換個角度來說,計算機視覺同屬于工程領(lǐng)域、科學(xué)領(lǐng)域。
1.2計算機視覺的應(yīng)用
計算機視覺的應(yīng)用能夠使計算機具有和人一樣的視覺功能。在生活和生產(chǎn)過程中,照片資料、視頻資料的處理是計算機視覺應(yīng)用的主要方面。比如,在航空事業(yè)方面,對衛(wèi)星照片的翻譯;在醫(yī)學(xué)領(lǐng)域中,主要用于輔方面的診斷;在工業(yè)生產(chǎn)方面,由于各種復(fù)雜因素的影響,計算機視覺在這方面的應(yīng)用顯得特別簡單,有利于相關(guān)系統(tǒng)的實際構(gòu)成。
2目標圖像檢索存在的問題
從某種角度來說,目標圖像檢索需要分為特征匹配、特征提取兩個方面。它們表達了不同的含義。對于特征提取來說,它是圖像進行檢索的第一步,其提取結(jié)果會對進一步的研究造成直接的影響。而對于特征匹配來說,其匹配的準確度會直接影響圖像檢索系統(tǒng)的返回結(jié)果。但在目標圖像檢索完善的過程中,遇到一些問題阻礙了這兩個方面的完善。因此,本文作者對其中的一些予以了相關(guān)的探討。
2.1環(huán)境因素不斷變化
對于目標圖像來說,環(huán)境因素是影響其準確率的重要因素。同時,在復(fù)雜混亂的環(huán)境中,由于受到眾多干擾物的影響,加上部分目標圖像區(qū)域被遮蓋,致使目標圖像信息不夠全面,使目標物體特征的提取難度進一步加大。
2.2圖像噪聲的影響
子為了更好地模仿生活中的圖像檢索,數(shù)據(jù)庫中的圖像也會隨之發(fā)生一系列的變化。比如,尺度、角度、光照。而其中圖像噪音的影響會使目標物體的外觀發(fā)生對應(yīng)的變化。在此基礎(chǔ)上,嚴重降低了目標圖像信息獲取的準確度。
2.3目標圖像檢索訓(xùn)練數(shù)據(jù)的自動標注
由于處于網(wǎng)絡(luò)中的圖像資源信息過于繁多,需要采用手工的方式對它們進行標注。但這種方法非常浪費時間,準確率也比較低。很顯然,這就需要目標檢索圖像能夠具有自動標注的能力。實際上,圖像檢索方法過分依賴人工標注信息。而這些信息很多收到來自各方面因素的影響。比如,認識差異因素、個人經(jīng)驗。以至于對圖像產(chǎn)生誤解。
3基于計算機視覺下的目標圖像檢索技術(shù)
3.1以多尺度視覺為紐帶的目標圖像檢索方法
該種目標檢索技術(shù)的應(yīng)用主要是為了提高目標圖像檢索的準確率,能夠?qū)崿F(xiàn)目標圖像訓(xùn)練數(shù)據(jù)的自動化標注。該類技術(shù)主要是用于那些沒有遮擋,不需要進行監(jiān)督的目標圖像檢索方面。具體來說,它需要經(jīng)過一系列的訓(xùn)練。在訓(xùn)練的過程中,以統(tǒng)計學(xué)習為紐帶,對相應(yīng)多尺度的目標檢測模型進行適當?shù)挠?xùn)練。在此基礎(chǔ)上,以該模型為基點,對圖像中那些顯著性的區(qū)域進行合理地提取。比如,該區(qū)域的亮度、顏色。最后,需要對用于該實驗研究中的概率潛在語義分析模型進行合理地利用??傊?,利用這種檢索方法可以對圖像中那些顯著目標所處的區(qū)域自動進行檢測。同時,對其中目標圖像的顯著性進行合理地排序,能夠提高檢索引擎所返回圖像結(jié)果的準確度。
3.2以彩色LBP局部紋理特點為媒介的目標圖像檢索方法
這種目標圖像檢索方法能夠有效地解決圖像信息采集過程圖像噪聲以及其它相關(guān)因素對所提取紋理特征的影響,提高了圖像目標的準確率。對于這種圖像目標檢索方法來說,它把圖像彩色空間特征和簡化的LBP特征有機地相融合。在此基礎(chǔ)上,該類方法增加了光照的不變特性,卻保留了LBP局部的旋轉(zhuǎn)特點。在提高圖像檢索速度方面,主要是利用原來的LBP特征來丟失其中的彩色信息。以此,使其中的特征維度能夠在一定程度上降低。同時,這種目標圖像檢索方法的應(yīng)用可以使對應(yīng)計算方法的難度得以降低,還能對角度等變化狀態(tài)下的目標圖像進行準確地識別以及檢索。
3.3以視覺一致性為橋梁的目標圖像檢索方法
從某個角度來說,它的應(yīng)用主要是為了提高圖像搜索引擎的返回效果,使局部噪聲圖形具有更高的顯著性特征。一是:站在客觀的角度,對搜索引擎返回結(jié)果的目標顯著圖予以準確的計算。此外,還要對其中的目標顯著系數(shù)進行適當?shù)剡^濾。二是:以所有圖像為基點,以顯著目標為導(dǎo)向,采取視覺一致性的模式。三是:以視覺一致性為基礎(chǔ),對其中的不同目標圖像信息進行客觀地分類。這種以視覺一致性為核心的方法能夠有效地提高圖像檢索結(jié)果的準確率。更重要的是,在提高圖像搜索引擎檢索性能的同時,能夠及時為用戶選出最優(yōu)的圖像信息。而這些信息資源和用戶尋找的主題信息密切相關(guān)。
4結(jié)語
關(guān)鍵詞:三目攝像機;標定;立體視覺;外部參數(shù)
一、緒論
1.1研究的背景及意義
計算機視覺是當今極為重要的學(xué)科之一,它在具有很強的挑戰(zhàn)性的同時又擁有廣泛的應(yīng)用前景和實用價值。計算機視覺以視覺理論為中心,以圖像處理、模式識別、計算機技術(shù)和生理學(xué)、心理學(xué)為基礎(chǔ),研究內(nèi)容主要有兩個方面:一是開發(fā)從輸入圖像數(shù)據(jù)自動構(gòu)造場景描述的圖像處理系統(tǒng);二是理解人類視覺機理,用機器代替人去做人類難以達到或根本無法達到的工作[1]。
計算機視覺應(yīng)用的廣泛性體現(xiàn)在其不僅用于文字、指紋、面部、商標以及圖像數(shù)據(jù)庫、檢測集成電路芯片、多媒體技術(shù)這些圖像方面,還應(yīng)用到機器人導(dǎo)航、工業(yè)檢測和產(chǎn)品的自動裝配、CT圖像器官重建和遙感照片解釋等空間物體的定位、識別以及重建上。現(xiàn)如今,計算機視覺已經(jīng)應(yīng)用到機器人、地理、醫(yī)學(xué)、物理、化學(xué)、天文等各大的研究領(lǐng)域。
作為多個學(xué)科交叉與融合中心的計算機視覺,攝像機是其研究的重要工具,而攝像機標定又是計算機視覺研究的一個關(guān)鍵問題,故攝像機的標定越來越受到廣泛的重視。攝像機標定是通過物體空間上的點與圖像中的對應(yīng)點的幾何關(guān)系,來確定攝像機的內(nèi)外參數(shù)的過程。標定結(jié)果是否準確影響著三維測量的精度和三維重建的結(jié)果,而且實時的標定更能滿足自動導(dǎo)航機器視覺的需要[2]。
伴隨著應(yīng)用的發(fā)展,攝像機廣泛地被應(yīng)用于三維立體的測量、視覺檢測、運動檢測等領(lǐng)域。由此,對攝像機標定的精度要求也日益增加。攝像機標定結(jié)果的優(yōu)劣影響了計算機視覺在各領(lǐng)域的應(yīng)用。攝像機標定的準確與否,對能否提高計算機視覺在各領(lǐng)域測量的準確度有重要影響[3]。因此,研究攝像機標定方法具有重要的理論研究意義和實際應(yīng)用價值。
1.2攝像機標定技術(shù)研究的發(fā)展及現(xiàn)狀
攝像機有一個圖像平面和提供三維空間到圖像平面轉(zhuǎn)換的鏡頭。由于鏡頭會產(chǎn)生畸變,不能把這個轉(zhuǎn)化過程簡單描述為投射變換。所以它表示的是畸變的模型,這些模型近似于真實數(shù)據(jù),而其精確性則依靠于建立的模型及模型參數(shù)的準確性。
首先進行攝像機標定工作的是加拿大的Deville,他于1910年建立實驗室,使用多個瞄準儀對他的“測量攝像機”(surveying camera)進行標定[4]。上個世紀三十年代后期,美國標準局發(fā)明了一種精確鏡頭,用來檢測攝像機,同時將它用在攝像機標定上。四十年代后期,該項工作得到進一步加深,有了更多對高精度的需求和對易操作設(shè)備的需求。1955年,Carman出版了 《棋盤平面度的干涉測量和控制》,該書引起了社會各界對攝像機標定的關(guān)注。二戰(zhàn)時期,隨著飛機的大規(guī)模使用,航空攝影與制圖興起,為得到更加精確的測量結(jié)果,對攝像機鏡頭的校正要求也變得更高。五十到七十年代也是鏡頭校正技術(shù)發(fā)展最為迅速的時間段。在這期間,各種鏡頭像差的表達式逐步被提出并且得到普遍認同與采用,建立了很多的鏡頭像差的模型,D.C.Brown等人作出了比較大的貢獻,他們導(dǎo)出了近焦距情況下給定位置處徑向畸變表達式并證明了近焦距情況下測量出鏡頭兩個位置的徑向畸變就可以求出任何位置的徑向畸變[5]。這些徑向與切向像差表達式成為后來各攝像機的標定非線性模型的基礎(chǔ)。這段時間里,研究的重點是如何校正鏡頭與用何種方法補償鏡頭像差,這些研究對促進各性能鏡頭組的研制起到了重要作用。在1999年,張正友提出了一種簡便的攝像機標定方法,該方法介于傳統(tǒng)標定和自標定之間,操作方便靈活,能夠得到不錯的精度,滿足了眾多擁有桌面視覺系統(tǒng)的用戶在攝像機標定方面的需求。
1.3本文的主要研究內(nèi)容
本文的主要研究多個攝像機的標定問題。標定主要是對攝像機內(nèi)外參的測量計算,利用這些參數(shù)對多個攝像機識別的物體尺寸進行衡量并建立起多攝像機系統(tǒng)的數(shù)字環(huán)境。
論文的內(nèi)容包括:
第一章為緒論,介紹攝像機標定相關(guān)的研究背景、國內(nèi)外研究現(xiàn)狀。
第二章為攝像機標定理論基礎(chǔ):主要介紹標定的坐標系與待標定的參數(shù)。
第三章提出本文的多攝像機標定方法與實驗過程。
第四章進行全文的總結(jié)。
二、攝像機標定方法研究
2.1攝像機標定原理
攝像機通過透鏡將三維物體投影到--維圖像平面上,這個成像變換的過程稱為攝像機成像模型。攝像機成像模型有多種,最常用的為小孔成像模型。由于實際的攝像機鏡頭會發(fā)生一定的畸變,使得空間點所成的像不在線性模型描述的位置而會發(fā)生一定的偏移,為了能準確的標定攝像機參數(shù),標定的過程中要考慮非線性畸變因子。
一般來說,得到標定結(jié)果后要對其精度進行評估,然而很難得到準確的攝像機標定參數(shù)真值作為參考,其中基于圖像坐標和世界坐標的絕對和相對誤差的評價方法應(yīng)用廣泛,本文將對這些方法的原理進行探討。
2.2攝像機標定坐標系建立
首先定義了四個坐標系,如圖1所示,圖像坐標系的坐標原點為O0,列與行由坐標軸u和v表示;成像平面坐標系的原點是攝像機光軸與圖像坐標系的交點0l,x、y 軸分別與u、v 軸平行;在攝像機坐標系中,坐標原點0c即為在攝像機的光心,Xc、Yc軸與x、y 軸平行,與圖像平面垂直是攝像機光軸作為Zc軸,0c0l為攝像機焦距f;世界坐標系是假想的參考坐標系,可固定于場景中某物體上,用于描述攝像機的位置,由Xw,Yw,Zw軸組成。
圖(1)
2.3攝像機外部參數(shù)構(gòu)成
主動視覺傳感器從在笛卡爾直角坐標系中的運動表現(xiàn)為相應(yīng)的旋轉(zhuǎn)矩陣和平移矩陣,故攝像機外部參數(shù)表現(xiàn)為旋轉(zhuǎn)矩陣R和平移矩陣T,則攝像機坐標系與世界坐標系的轉(zhuǎn)化關(guān)系可以表示成:
上式中(Xc,Yc,Zc)表示空間點在攝像機坐標系下的坐標,(Xw,Yw,Zw)表示空間點在世界坐標系下的坐標。根據(jù)靶標點在像空間坐標系和物方空間坐標系中的坐標,通過分解旋轉(zhuǎn)矩陣線性計算像空間坐標系與物方空間坐標之間的轉(zhuǎn)換參數(shù),即外方位元素(攝站參數(shù))[6]。
2.4各攝像機相對位置確定
三目攝像機擁有三個視覺傳感器,而三個傳感器之間的相對位置可通過已獲得的外部參數(shù)進行確定。將三個攝像機坐標系設(shè)置為,Oci xci yci zci(i=1,2,3),由2.3中所介紹的內(nèi)容可知,這三個攝像機坐標系與世界坐標系的關(guān)系為:
i=(1,2,3)
由此我們可以得到任意兩個攝像機i,j的坐標系轉(zhuǎn)換關(guān)系:
其中: = = i,j=1,2,3
三、攝像機標定實驗過程及結(jié)果
3.1實驗系統(tǒng)介紹
實驗中被用來標定的是一個多攝像機系統(tǒng),攝像機標定有關(guān)的基本參數(shù)、系統(tǒng)組成和開發(fā)環(huán)境如下:
(1)硬件環(huán)境
標定板、三目攝像機和圖像采集卡等。
(2)軟件環(huán)境
OpenCV開源視覺庫,它僅由一系列C函數(shù)和少量C++類構(gòu)成,為Python、MATLAB等語言提供了接口,在圖像處理和計算機視覺方面實現(xiàn)了很多通用算法。
3.2實驗過程
本系統(tǒng)以棋盤格模板作為標定模板。采用激光打印機打印棋盤格黑白方塊間隔紙,方塊邊長為3cm,共6行9列,將打印紙固定在一塊平板上,作為標定模板,如圖(2)。安裝三目攝像機系統(tǒng),調(diào)節(jié)固定好個攝像機位置,如圖(3)。手持標定板在三目攝像機前方各個位置拍攝5組共15張各姿態(tài)的照片,利用Canny算子進行像點灰度中心提取、同名像點匹配并解算出三個攝像機在標定板坐標系中的外部參數(shù)值。
3.3標定結(jié)果
攝像機1:
R= T=
攝像機2:
R= T=
攝像機3:
R= T=
四、總結(jié)
隨著計算機技術(shù)的高速發(fā)展,計算機視覺成為當今熱門的研究課題,受到了廣泛關(guān)注。本文就如何在機器視覺的理論基礎(chǔ)上對三目視覺系統(tǒng)進行標定進行了研究,討論了計算機視覺理論知識,分析攝像機標定原理以及標定坐標系的建立。同時通過計算機視覺知識的分析討論了基于三目視覺系統(tǒng)的攝像機標定技術(shù),完成了三目視覺系統(tǒng)的外部參數(shù)標定實驗。三目攝像機測量系統(tǒng)外部參數(shù)的標定能夠解決測量作業(yè)現(xiàn)場、測量控制場建立難的問題,為快速地建立簡單實用的控制場提供了方案,有一定的實用價值。
參考文獻
[1] 荊麗秋.雙目視覺系統(tǒng)標定與匹配的研究與實現(xiàn)[D].哈爾濱工程大學(xué),2009.DOI:10.7666/d.y1489086.
[2] 馬頌德.計算機視覺―計算理論與算法基礎(chǔ)[M].北京:科學(xué)出版社,1998.
[3] 王榮一.攝像機標定及關(guān)鍵技術(shù)研究[D].哈爾濱理工大學(xué),2011.DOI:10.7666/d.y2012483.
[4] Clarke T A,F(xiàn)ryer J G.The development of camera calibration methods andmodels.Photogrammetric Record,1998,16(91):51-66
[5] Brown D C.Decentering distortion of lenses.Photogrammetric Engineering,1 966,32(3):444-462.
[6] 范亞兵,黃桂平,高寶華等.三目立體工業(yè)攝影測量系統(tǒng)外部參數(shù)的快速標定[J].測繪工程,2012,21(5):48-52.DOI:10.3969/j.issn.1006-7949 .2012.05.013
關(guān)鍵詞 模式分析 計算機視覺 教學(xué)改革
中圖分類號:G643.2 文獻標識碼:A DOI:10.16400/ki.kjdkz.2016.03.015
Research and Practice on Course Group of Pattern Analysis and
Visual Processing for Graduated Students
SUN Han, CHEN Songcan, LIU Ningzhong, HUANG Yuanyuan, ZHU Qi
(College of Computer Science and Technology, Nanjing University of
Aeronautics and Astronautics, Nanjing, Jiangsu 210016)
Abstract By analyzing the teaching status of pattern analysis and visual processing course group, this paper puts forward the new teaching goal, which includes improving students' international vision, the ability of linking theory with practice, and promoting the engineering practice ability and innovative consciousness. Then this paper discusses the whole process of course group reform. Firstly the structure of teachers' group is optimized. And then the knowledge system of course group is sorted and the teaching mode is improved. Finally the practice system of course group is optimized and the assessment system is reformed.
Key words pattern analysis; computer vision; teaching reform
1 背景
我校模式分析與智能計算研究所師資團隊是江蘇省“青藍工程”創(chuàng)新團隊,主要研究領(lǐng)域包括智能數(shù)據(jù)分析、圖像處理和機器視覺等方向,承擔研究生和本科生的模式識別、機器學(xué)習、數(shù)據(jù)挖掘、智能信息檢索、數(shù)字圖像處理、計算機視覺等課程的教學(xué)任務(wù)。以往的教學(xué)過程中雖然積累了豐富的教學(xué)經(jīng)驗,但當前新知識不斷涌現(xiàn)、新技術(shù)發(fā)展迅猛,對模式分析與視覺處理課程群的知識體系、實踐體系改進提出了新的挑戰(zhàn)。
近年來,國內(nèi)外高校在該類課程教學(xué)上,已涌現(xiàn)出眾多新理念、新方法。Coursera聯(lián)合創(chuàng)始人Andrew Ng推出的機器學(xué)習課程,開啟了教育領(lǐng)域的MOOC時代,引領(lǐng)了教育教學(xué)方法的新革命。①深圳大學(xué)、②江蘇科技大學(xué)③分別進行了基于CDIO工程教育理念的計算機視覺課程教學(xué)改革實踐,實現(xiàn)多層次項目設(shè)計的教學(xué)模式改革,講座式、討論式、實踐式教學(xué)方法的探索。國防科技大學(xué)④在計算機視覺課程中引入研討式教學(xué)模式,通過案例教學(xué)、小組研討的方式來替代傳統(tǒng)的教學(xué)方式。華中科技大學(xué)⑤從教學(xué)內(nèi)容國際化、教學(xué)方式國際化、教學(xué)成果國際化三個方面開展了計算機視覺課程的國際化建設(shè)。另外,也有高校進行了圖像工程課程群建設(shè),⑥基于圖像分析與計算機視覺應(yīng)用課程結(jié)合的項目協(xié)同創(chuàng)新能力培養(yǎng)實踐。⑦
在分析上述國內(nèi)外高校該類課程改革的基礎(chǔ)上,我們重點以模式分析與視覺處理課程群的實踐教學(xué)體系改革為切入點,優(yōu)化師資隊伍結(jié)構(gòu),梳理課程群知識體系,優(yōu)化課程授課模式,完善課程群實踐體系,改革實踐考核模式,實現(xiàn)學(xué)生國際化視野、理論聯(lián)系實際、工程實踐和創(chuàng)新能力全面提升的目標。
2 模式分析與視覺處理課程群特點
模式分析與視覺處理課程群涵蓋了模式識別、機器學(xué)習、數(shù)據(jù)挖掘、數(shù)字圖像處理、計算機視覺等多門課程。該類課程存在以下特點。
(1)該類課程屬于多學(xué)科交叉,涉及的知識面既廣又深。由于該方向涉及計算機科學(xué)與技術(shù)、應(yīng)用數(shù)學(xué)、自動化、電子科學(xué)與技術(shù)、信息工程等多學(xué)科內(nèi)容,而學(xué)生在大學(xué)本科階段很難學(xué)習和了解如此多的知識模塊,這對研究生階段學(xué)習來說,具有相當大的挑戰(zhàn)。同時,對于每個知識模塊,所要求的數(shù)學(xué)基礎(chǔ)較高,理論具有相當?shù)纳疃?,理解和掌握不容易?/p>
(2)該類課程既重視扎實的基礎(chǔ)理論,也強調(diào)良好的工程實踐能力。該類課程的基礎(chǔ)理論教學(xué)一直受到各高校的重視。隨著近年來產(chǎn)業(yè)界的迅猛發(fā)展,計算機視覺應(yīng)用層出不窮,對學(xué)生的工程實踐也提出了更高要求,需要能夠在系統(tǒng)層次上有整體認知,同時要能對各功能模塊進行優(yōu)化,提升系統(tǒng)的整體性能。
(3)該類課程所面向的選修學(xué)生面廣。該類課程既是多學(xué)科交叉,也面向計算機應(yīng)用、電子科學(xué)與技術(shù)、自動化、應(yīng)用數(shù)學(xué)等不同研究方向、不同水平層次的研究生開設(shè)。這對課堂教學(xué)和實驗實踐也帶來更大挑戰(zhàn)。
3 模式分析與視覺處理課程群改革舉措
針對上述分析的課程群特點,我們重點以實踐體系改革為突破口,通過優(yōu)化師資隊伍結(jié)構(gòu),梳理課程群知識體系,優(yōu)化課程授課模式,完善課程群實踐體系,改革實踐考核模式等舉措,實現(xiàn)學(xué)生國際化視野、理論聯(lián)系實際、工程實踐和創(chuàng)新能力全面提升的目標。
3.1 師資隊伍結(jié)構(gòu)優(yōu)化
為了學(xué)生能夠適應(yīng)模式分析與視覺處理產(chǎn)業(yè)的快速發(fā)展,在課程群建設(shè)過程中更強調(diào)學(xué)生的工程實踐和創(chuàng)新能力培養(yǎng)。這首先對師資隊伍結(jié)構(gòu)提出了新的要求。
近年來,課程教學(xué)團隊引進海內(nèi)外具有深厚理論功底和較強工程能力的高水平師資4名,大大充實了機器學(xué)習、數(shù)據(jù)挖掘、圖像處理等課程的教學(xué)力量。對于現(xiàn)有教師隊伍,鼓勵教師跟產(chǎn)業(yè)一線企業(yè)廣泛合作,目前已與華為、中興等企業(yè)在視頻檢索、智能交通視覺處理等方面開展了實質(zhì)合作。這些來源于產(chǎn)業(yè)界的高質(zhì)量課題對科研和教學(xué)起到了良好的促進作用。
與此同時,通過研究生工作站、企業(yè)短期實習等渠道,鼓勵企業(yè)高級研發(fā)人員參與到學(xué)生實踐能力培養(yǎng)環(huán)節(jié)中,將實際項目進行適當切分或提煉,實現(xiàn)該類課程實踐環(huán)節(jié)的模塊化、專題化訓(xùn)練。
綜上,通過引培并舉,優(yōu)化校內(nèi)師資隊伍結(jié)構(gòu);通過校企合作,積極吸引企業(yè)師資參與。良好的師資隊伍為該類課程的實踐體系改革提供了有力支撐。
3.2 課程群知識體系梳理與授課模式改革
模式識別、機器學(xué)習、數(shù)據(jù)挖掘、智能信息檢索、數(shù)字圖像處理、計算機視覺等課程既有一定的邏輯關(guān)系,也存在相互交叉的混雜關(guān)系。一般認為,模式識別、機器學(xué)習是模式分析與視覺處理領(lǐng)域的基礎(chǔ)理論課程,數(shù)據(jù)挖掘是建立在模式識別、機器學(xué)習和數(shù)據(jù)庫基礎(chǔ)上的應(yīng)用類課程,智能信息檢索則是數(shù)據(jù)挖掘基礎(chǔ)上更為具體的應(yīng)用實現(xiàn)。數(shù)字圖像處理為計算機視覺課程提供了基礎(chǔ)支撐,計算機視覺則是在綜合利用模式識別、機器學(xué)習、數(shù)字圖像處理、數(shù)據(jù)挖掘等知識模塊基礎(chǔ)上面向應(yīng)用的系統(tǒng)實現(xiàn)。但是,這些課程也存在著知識點的交叉或重復(fù)。例如,模式識別和機器學(xué)習中都有貝葉斯參數(shù)估計、支持向量機模型等知識點,但視角和側(cè)重點有所不同;圖像處理、計算機視覺中都有顏色模型、成像模型等知識點,也同時存在與模式識別、機器學(xué)習交叉的知識點。
我們針對來自不同研究領(lǐng)域的學(xué)生群體,對該課程群的知識點進行系統(tǒng)梳理,既避免知識點的重復(fù)講授,也防止重要知識點的缺漏。課程教師集體討論,形成每門課程的核心知識集,和針對不同研究領(lǐng)域的選講知識集。學(xué)生在學(xué)習課程時,在掌握核心知識集的基礎(chǔ)上,結(jié)合自己的研究方向選擇相關(guān)的選講知識集學(xué)習。
在課程教材和參考書的選擇上,注重挑選國際上有影響力的教材。例如,模式識別的參考書為Richard O. Duda等人編著的Pattern Classification;機器學(xué)習的參考書為Tom M. Mitchell編著的Machine Learning和Christopher M. Bishop編著的Pattern Recognition and Machine Learning;數(shù)據(jù)挖掘的參考書為Jiawei Han等人編著的Data Mining:Concepts and Techniques;數(shù)字圖像處理的參考書為K. R. Castleman編著的Digital Image Processing;計算機視覺的參考書為D. A. Foryth編著的Computer Vision: A Modern Approach和Richard Szeliski編著的Computer Vision: Alogrithms and Applications。這些教材已被國內(nèi)外著名大學(xué)普遍采用。同時,每門課程都提供相關(guān)的國內(nèi)外頂級會議和期刊的列表,供學(xué)生課后追蹤研究領(lǐng)域的熱點問題。
在課堂授課環(huán)節(jié)上,注意采用靈活多樣的授課方式。對于核心基礎(chǔ)知識模塊,以教師講授為主,同時提供國內(nèi)外該類課程的熱門MOOC網(wǎng)址給學(xué)生參考。對于選講知識模塊,鼓勵學(xué)生事先結(jié)合各自研究方向有目的自學(xué),在學(xué)生報告的基礎(chǔ)上進行課堂討論方式進行。充分發(fā)揮學(xué)生學(xué)習的主體作用,也便于教師了解學(xué)生的水平和學(xué)習狀況。
除此以外,不定期邀請國內(nèi)外著名學(xué)者來校做學(xué)術(shù)報告,讓學(xué)生充分了解該研究領(lǐng)域的最新前沿動態(tài),并就熱點問題進行專題討論。
3.3 課程群實踐體系完善與考核方式改革
工程實踐和創(chuàng)新能力的培養(yǎng)是該課程群改革的重要目標。我們在上述師資隊伍結(jié)構(gòu)優(yōu)化、課程群知識體系梳理與授課模式改革的基礎(chǔ)上,著力進行課程群實踐體系的改革與完善。我們通過多層次菜單式的實驗項目選擇、項目牽引的創(chuàng)新能力訓(xùn)練、學(xué)生綜合研究能力的全面考查等方面來實現(xiàn)。
首先,整合和優(yōu)化課程群實踐內(nèi)容,實現(xiàn)多層次菜單式靈活選擇。根據(jù)各研究領(lǐng)域的要求進行靈活搭配,根據(jù)學(xué)生個體的能力與水平選擇適當規(guī)模和難度的實踐內(nèi)容,通過課程內(nèi)的基礎(chǔ)實驗、課程間的綜合實驗、課程群的創(chuàng)新實驗來選擇和組合,如圖1所示。
圖1 多層次菜單式實驗內(nèi)容示意圖
基礎(chǔ)型實驗內(nèi)容主要是各課程核心知識點的實驗驗證,主要包括模式識別,機器學(xué)習,數(shù)據(jù)挖掘,圖像處理與分析,計算機視覺等課程的實驗。要求選課學(xué)生對這些基礎(chǔ)實驗必做,打下良好的研究基礎(chǔ)。
綜合探索型實驗在基礎(chǔ)型實驗基礎(chǔ)上,既有單門課程內(nèi)總的綜合實驗,也有課程間知識的綜合應(yīng)用。主要分為兩大塊,包括模式分析與機器學(xué)習方向的綜合實驗,以及圖像處理與機器視覺方向的綜合實驗。實驗?zāi)康闹饕轻槍@兩大塊方向重點知識的綜合分析和比較,能夠熟練掌握和靈活應(yīng)用。例如模式分析、機器學(xué)習、數(shù)據(jù)挖掘等方向都用到的線性判別分析、支持向量機、均值聚類等內(nèi)容;圖像處理與機器視覺中的圖像特征抽取、視覺系統(tǒng)選型、目標檢測、特定平臺的算法優(yōu)化等內(nèi)容。學(xué)生可根據(jù)各自研究方向有目的的選擇兩塊綜合實驗的大部分內(nèi)容。
在綜合型實驗基礎(chǔ)上,該課程群通過若干創(chuàng)新型實驗來檢驗學(xué)生理論知識掌握程度和實踐方法應(yīng)用能力,為后續(xù)的研究課題開展打下良好的科研素養(yǎng)。主要內(nèi)容包括人臉識別、二維條碼識別、車輛屬性識別、智能視覺監(jiān)控、以及企業(yè)來源的關(guān)鍵技術(shù)等。這些項目實踐既涉及用到圖像處理與機器視覺的內(nèi)容,也涉及模式分析與機器學(xué)習方向的知識。并且需要學(xué)生在綜合運用相關(guān)知識的基礎(chǔ)上有創(chuàng)新能力。
其次,重視各類項目牽引的創(chuàng)新能力訓(xùn)練。一方面,鼓勵教師從國家自然科學(xué)基金、企業(yè)合作項目等研究中提煉出問題規(guī)模和難度適中的訓(xùn)練項目,作為課程群的綜合能力訓(xùn)練項目。另一方面,鼓勵學(xué)生參加挑戰(zhàn)杯、全國研究生智慧城市技術(shù)與創(chuàng)意設(shè)計大賽等各類具有挑戰(zhàn)性的競賽項目,以賽代練,提升學(xué)生的工程實踐和創(chuàng)新能力。同時,也鼓勵學(xué)生利用百度、微軟等相關(guān)研究領(lǐng)域的企業(yè)實習機會,參與產(chǎn)品一線的工程實踐能力訓(xùn)練。
再次,注重考核環(huán)節(jié),實現(xiàn)科研素養(yǎng)和實踐能力的全面考查。只有嚴格、公平、公正的考核,才能保證實驗實踐的質(zhì)量和水平,才能提升學(xué)生的科研素養(yǎng)和實踐能力。我們主要在手段、方式方法上進行了改進。在題目選擇上,根據(jù)學(xué)生個體水平和研究領(lǐng)域要求的差異,在選題上有適當?shù)碾y易區(qū)分度,讓每位學(xué)生都有鍛煉和提升的機會;在考核方式上,采用結(jié)題書面報告來檢驗學(xué)術(shù)論文的寫作能力,采用程序演示檢驗系統(tǒng)的設(shè)計與實現(xiàn)水平,采用上臺匯報的方式檢驗學(xué)生的表達能力,多管齊下全面檢查學(xué)生的綜合科研素養(yǎng);在考核成績評定上,采用現(xiàn)場教師和學(xué)生共同評分的方式,公平合理;最后,通過網(wǎng)站展示、發(fā)表學(xué)術(shù)小論文、專利、軟件著作權(quán)等方式展示和公開優(yōu)秀成果,激發(fā)學(xué)生的學(xué)習熱情,并由此形成積累,有利于學(xué)生實驗實踐氛圍的傳承。
4 結(jié)語
本文在分析國內(nèi)外高校模式分析與視覺處理類課程群改革現(xiàn)狀的基礎(chǔ)上,以學(xué)生國際化視野、理論聯(lián)系實際、工程實踐和創(chuàng)新能力全面提升為目標,重點開展了師資隊伍結(jié)構(gòu)優(yōu)化、課程群知識體系梳理、課程授課模式改革、課程群實踐體系完善和實踐考核模式改革等工作,取得了良好的效果,并為校內(nèi)其他課程群的教學(xué)改革作為示范推廣。
注釋
① https:///learn/machine-learning/
② 郭小勤,曹廣忠.計算機視覺課程的CDIO教學(xué)改革實踐.理工高教研究,2010.29(5):98-100,148.
③ 史金龍,白素琴,龐林斌,錢強.研究生機器視覺課程的CDIO教學(xué)改革實踐.計算機教育,2013.9:40-43.
④ 陳芳林,劉亞東,沈輝.在《計算機視覺》課程中引入研討式教學(xué)模式.當代教育理論與實踐,2013.5(7):112-114.
⑤ 王岳環(huán),桑農(nóng),高常鑫.計算機視覺課程的國際化教學(xué)模式.計算機教育,2014.19:101-103.
生活中,每個人都問過別人“這件衣服是從哪買的?”“這雙鞋是什么牌子的?”這一問題很快會被AI技術(shù)解決,只需要拿出手機對著物品拍照,就會得到商品的各種信息,并且能一鍵買買買。這就是美國著名圖片社交網(wǎng)站Pinterest(拼趣)即將推出的應(yīng)用圖片識別購買業(yè)務(wù)。
Pinterest總裁Tim Kendall表示,“Pinterest可以即刻在存儲750多億張圖片的巨大網(wǎng)絡(luò)空間內(nèi)進行搜索,從而為用戶找到與所拍攝照片相似的配對圖片,以及查找到哪些地方能夠買到他們所需的商品?!?/p>
目前,Pinterest的估值已經(jīng)達到了110億美元,該公司的專注點正在向營收增長和創(chuàng)收方面轉(zhuǎn)變。相比Facebook、Twiter等社交網(wǎng)站,Pinterest已經(jīng)率先找到了一條清晰的創(chuàng)收道路。
從興趣到產(chǎn)品
亞里士多德曾經(jīng)說過,古往今來人們開始探索,都應(yīng)起源于對自然萬物的驚異??萍嫉倪M步也是如此,就像微軟研發(fā)主管和項目負責人Mitch Goldberg所說:“我們想通過該應(yīng)用向人們展示識別技術(shù)的無限魅力?!?/p>
今年2月,微軟旗下的Garage實驗室了一款名為“Fetch!”的應(yīng)用,它可通過機器學(xué)習系統(tǒng)識別照片中寵物狗的品種并用文字對該品種進行簡單的介紹。
隨著計算機視覺領(lǐng)域開始利用深層神經(jīng)網(wǎng)絡(luò)這種模仿人類大腦生物過程的系統(tǒng)來從事機器學(xué)習,識別的精確度實現(xiàn)了巨大飛躍。也就是說通過機器學(xué)習技術(shù),F(xiàn)etch!識別的準確度會越來越高,隨著大量圖片的涌入,F(xiàn)etch! 可以自我修復(fù)錯誤,從而更加精確地識別每一只狗的樣貌、形態(tài)、動作。除了測試狗類品種以外,你還可以把朋友的照片上傳至平臺,看看他們能夠?qū)?yīng)出哪種寵物。
微軟的這款產(chǎn)品基于目前最為熱門的一種圖像識別技術(shù)――“深度神經(jīng)網(wǎng)絡(luò)”,同樣基于這種技術(shù),微軟還有另一款有趣的產(chǎn)品:。去年5月,有超過5.75億圖片被提交到,超過8500萬來自世界各地的使用者訪問了這個網(wǎng)站,只為尋找一個簡單問題的答案――顏齡機器人認為我看起來像幾歲?如果是合照,并且顏齡機器人識別出的自己比周圍人年齡小,則更能引發(fā)用戶的興趣,這種“損人利己”的識別應(yīng)用著實在社交媒體上火了一把。
另一讓計算機視覺研究技術(shù)人員特別感興趣的領(lǐng)域是生物識別,當下最為火爆的莫過于人臉識別技術(shù)了。早期的人臉識別技術(shù)多為安防領(lǐng)域,如海關(guān)識別走私犯、商店識別小偷等。近年來,深度學(xué)習的研究與應(yīng)用使得人臉識別和人工智能的核心技術(shù)得到了極大的提升,攝像頭等圖像硬件的發(fā)展為人臉識別提供了很好的圖像基礎(chǔ),如今人臉識別技術(shù)應(yīng)用更加廣泛,比如公司可以使用刷臉打卡來杜絕代人打卡簽到現(xiàn)象。
其實早在2012年,谷歌就開發(fā)出了安卓系統(tǒng)的“刷臉解鎖”技術(shù),但因安全問題未解決,該技術(shù)一直未能得到普及。
而今年3月,電商巨頭亞馬遜提交了一項針購物付費的專利技術(shù),即消費者在亞馬遜網(wǎng)站購物時可以通過自拍或者視頻來進行付費,無須再輸入賬號密碼。在消費時系統(tǒng)會提示用戶表現(xiàn)出特定的行為、情緒或手勢來證明消費者就是本人,而不是拿著照片的冒名頂替者。
亞馬遜表示,這項技術(shù)能使消費者更加安全地進行網(wǎng)上購物,因為很多用戶為了省事會把所有賬戶都用同一個密碼,或者把密碼記在手機里,一旦遭遇“撞庫”或者手機被盜,后果不堪設(shè)想,而刷臉技術(shù)則沒有這個風險。
除了識別人臉,在識別其他生物方面也有了突破性進展,比如識別寄生蟲。瘧疾,是一種由瘧原蟲造成的全球性急性寄生蟲傳染病,據(jù)統(tǒng)計,2015年有大約有2.14億人受瘧疾的影響。
一直以來,醫(yī)療工作者是通過肉眼觀察采樣玻片來確定采樣對象是否被瘧原蟲感染,這不但是對醫(yī)療工作者經(jīng)驗的考驗,而且工作效率也十分低下,而貧困地區(qū)一直都缺乏有經(jīng)驗的醫(yī)療工作者。
今年2月,根據(jù)MIT Technology Review報道,Intellectual Ventures Laboratory(智能事業(yè)實驗室)開發(fā)出了能夠檢測和評估瘧疾感染的便攜式顯微鏡。這種顯微鏡采用的是一個名為“Autoscope”的系統(tǒng),通過計算機視覺和深度神經(jīng)網(wǎng)絡(luò)技術(shù),采用深度學(xué)習算法來鑒別瘧原蟲。這款便攜式顯微鏡今年在泰國實地測試,成功鑒別出了 170塊玻片中的瘧原蟲如果這項技術(shù)得到普及之后,只要診所有一臺Autoscope顯微鏡和一些載玻片,就可解決瘧疾的診斷問題,這將使瘧疾診斷不再依賴于有限的專業(yè)醫(yī)療人員。
技術(shù)轉(zhuǎn)化為產(chǎn)品
新技術(shù)的出現(xiàn),讓計算機不但“看見”這個世界,更能“看懂”這個世界,可以代替人眼甚至超越人眼。
人的視野是有限的,并且會受到周邊條件的影響,駕駛員在開車時會有視野盲區(qū),還會受到光線的影響,并且大霧、暴雨等極端天氣也會嚴重影響駕駛員的視線。而計算機視覺技術(shù)就不一樣了,視野會更開闊,受限制更小。根據(jù)汽車媒體《Leftlane》報道,福特公司最新的無人駕駛汽車研究計劃是由激光感應(yīng)(LiDAR)和雷達、攝像頭形成一張周圍環(huán)境的高清3D地圖,不但讓無人駕駛汽車看到攝像頭視野范圍之外的物體,而且并不受光線限制。在夜間試駕后,福特工程師Wayne Williams說:“坐在汽車里,我能感到它在走,但是我往車外看,只能看到一片漆黑。結(jié)果令人驚喜,車輛準確地沿著蜿蜒的道路行駛?!?/p>
識別場景這一領(lǐng)域技術(shù)的發(fā)展,使得計算機不但能當機器的眼睛,還能變成人類的眼睛。
對于雙目失明的人來說,能親自感知這個世界是夢寐以求的事,而微軟2016 Build開發(fā)者大會上Seeing AI項目正是要幫助盲人實現(xiàn)這一愿望。
Seeing AI項目是通過計算機視覺和自然語言去形容一個人的周圍環(huán)境、朗讀文本、回答問題以及識別人的面部表情,可以在手機上使用,也可以在Pivothead的智能眼鏡上使用。如果投入使用,將有助于為視障人士營造更公平的環(huán)境,是一款能夠真正改變?nèi)藗兩畹漠a(chǎn)品,就像此項目的高級項目經(jīng)理Anne Taylor所說的,這是“為真正重要的場景尋求解決方案”。也許不久微軟能開發(fā)出一種仿生眼,直接發(fā)送視覺信號到大腦,讓盲人真正看到這個世界。