前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計(jì)算機(jī)視覺的前景主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞 計(jì)算機(jī);視覺技術(shù);應(yīng)用研究
中圖分類號:TP212 文獻(xiàn)標(biāo)識碼:A 文章編號:1671-7597(2013)16-0114-01
計(jì)算機(jī)視覺技術(shù)自20世紀(jì)70年代產(chǎn)生以來就得到了全世界的廣泛關(guān)注。作為一種多學(xué)科綜合應(yīng)用下的新技術(shù),隨著專家對其研究會的不斷深入,其應(yīng)用領(lǐng)域也越來越廣,給人們的生產(chǎn)生活帶來了極大方便。
1 計(jì)算機(jī)視覺技術(shù)
計(jì)算機(jī)視覺技術(shù)是在計(jì)算機(jī)技術(shù)應(yīng)用下發(fā)展起來的一種新技術(shù),主要用來研究計(jì)算機(jī)模擬生物的宏觀或外顯功能。該技術(shù)在應(yīng)用過程中會涉及到計(jì)算機(jī)科學(xué)、神經(jīng)生物學(xué)、人工智能、模式識別以及圖像處理等多個學(xué)科,多學(xué)科技術(shù)的綜合運(yùn)用使得計(jì)算機(jī)具有了“感知”周圍世界的能力,這也正是該技術(shù)發(fā)揮作用的核心所在。計(jì)算機(jī)視覺技術(shù)的特點(diǎn)就在于,首先,它能在不接觸被測者的前提下完成對被測者的檢測;其次,該技術(shù)應(yīng)用的領(lǐng)域和檢測的對象非常廣,能在敏感器件的應(yīng)用下,完成對人類難以觀察到的超聲波、微波和紅外線等的檢測;最后,該技術(shù)還突破了人在視覺觀察上長時間工作的限制,能對檢測對象進(jìn)行長時間觀察。
2 計(jì)算機(jī)視覺技術(shù)在各領(lǐng)域的應(yīng)用分析
隨著計(jì)算機(jī)視覺技術(shù)研究的不斷加深,該技術(shù)的應(yīng)用領(lǐng)域也越來越廣,下面,本文就選取工業(yè)、農(nóng)業(yè)、林業(yè)、農(nóng)產(chǎn)品檢測、電力系統(tǒng)自動化及圖書館工作這6個方面對計(jì)算機(jī)視覺技術(shù)的應(yīng)用進(jìn)行簡要分析。
2.1 在工業(yè)領(lǐng)域中的應(yīng)用
工業(yè)生產(chǎn)對產(chǎn)品的質(zhì)量要求極高,計(jì)算機(jī)視覺技術(shù)在工業(yè)上的應(yīng)用主要集中在以下3方面:1)產(chǎn)品形狀和尺寸的檢測上。對制造業(yè)而言,產(chǎn)品的形狀和尺寸是否合格直接影響到產(chǎn)品在實(shí)際應(yīng)用過程中作用的發(fā)揮。計(jì)算機(jī)視覺技術(shù)的應(yīng)用能對產(chǎn)品進(jìn)行二維和三維等幾何特征的檢測,如產(chǎn)品的圓度、位置及形狀等。2)產(chǎn)品零部件缺失情況的檢測。在生產(chǎn)線運(yùn)行過程中,計(jì)算機(jī)視覺技術(shù)能準(zhǔn)確檢測出產(chǎn)品在生產(chǎn)過程中是否存在鉚釘、螺絲釘?shù)攘悴考娜笔б约爱a(chǎn)品內(nèi)部是否在生產(chǎn)過程中摻進(jìn)雜質(zhì)等。3)產(chǎn)品表面質(zhì)量的檢測。為了從各個方面保證產(chǎn)品的合格性,對其進(jìn)行表面質(zhì)量的檢測也是一個極其重要的環(huán)節(jié)。計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)了對產(chǎn)品表面的紋理、粗糙度、劃痕、裂紋等各方面的有效檢測。
2.2 在農(nóng)業(yè)生產(chǎn)領(lǐng)域中的應(yīng)用
該技術(shù)在農(nóng)業(yè)領(lǐng)域的應(yīng)用主要集中在以下兩方面:1)對病蟲害的預(yù)測預(yù)報。預(yù)測預(yù)報作用發(fā)揮的關(guān)鍵環(huán)節(jié)是建立起計(jì)算機(jī)視覺技術(shù)對所有昆蟲的識別體系。對昆蟲圖像識別系統(tǒng)進(jìn)行數(shù)字化建模所使用的方法主要以下2種,一種是運(yùn)用數(shù)學(xué)形態(tài)學(xué)的方法對害蟲的邊緣進(jìn)行檢測,進(jìn)而提取害蟲的特征;第二種是從昆蟲的二值化圖像中提取出昆蟲的周長、面積和復(fù)雜度等基本信息,并對這些信息建立害蟲的模板庫以實(shí)現(xiàn)對昆蟲的模糊決策分析。2)對農(nóng)作物生長的監(jiān)測。常用的方法就是運(yùn)用計(jì)算機(jī)視覺技術(shù)下的非接觸式監(jiān)測系統(tǒng)對農(nóng)作物生長環(huán)境下的光照、溫度、濕度、風(fēng)速、營養(yǎng)液濃度等相關(guān)因素進(jìn)行連續(xù)地監(jiān)測,進(jìn)而判斷出農(nóng)作物長勢。
2.3 在林業(yè)生產(chǎn)中的應(yīng)用
該技術(shù)在林業(yè)生產(chǎn)中的應(yīng)用主要集中在農(nóng)藥噴灑和林木球果采集這兩方面。就林業(yè)的農(nóng)藥噴灑而言,常規(guī)的農(nóng)藥噴灑方式易造成農(nóng)藥的大量流失,不僅達(dá)不到防止林業(yè)有害生物的目的,還浪費(fèi)了大量的人力、物力和財力。計(jì)算機(jī)視覺技術(shù)的應(yīng)用能通過對施藥目標(biāo)圖像進(jìn)行實(shí)時分析,得出具體的施藥量和準(zhǔn)確的施藥位置,該技術(shù)指導(dǎo)下的施藥工作極大發(fā)揮了農(nóng)藥的效果。就林木球果采集而言,該采集工作的操作難度一直都很大,我國當(dāng)前使用的方法主要是人工使用專業(yè)工具下的采集以及機(jī)械設(shè)備運(yùn)用下的高空作業(yè)車采集和搖振采種機(jī)采集,這兩種方式都存在一定的安全性和效率問題。計(jì)算機(jī)視覺技術(shù)的應(yīng)用能通過對需要進(jìn)行采集的林木球果進(jìn)行圖像采集來得出球果所處的具置,再結(jié)合專業(yè)機(jī)械手的使用完成球果采集。該技術(shù)不僅節(jié)省了大量勞動力,還極大提高了采摘效率。
2.4 在農(nóng)產(chǎn)品檢測中的應(yīng)用
農(nóng)產(chǎn)品在生產(chǎn)過程中受自然環(huán)境的影響比較大,所以農(nóng)產(chǎn)品不僅會產(chǎn)生質(zhì)量上的差異,還會造成顏色、大小、形狀等外觀上的極大不同。由于農(nóng)產(chǎn)品在出售時大多要進(jìn)行產(chǎn)品等級的劃分,所以將計(jì)算機(jī)視覺技術(shù)運(yùn)用到對其顏色和外形尺寸的檢測上,有效達(dá)到了對農(nóng)產(chǎn)品進(jìn)行檢測的目的。通過對外觀大小尺寸的檢測,不僅提高了對農(nóng)產(chǎn)品進(jìn)行分門別類地等級劃分的效率,還在很大程度上減少了對產(chǎn)品的損壞;通過對西瓜等農(nóng)產(chǎn)品進(jìn)行顏色上的檢測,能準(zhǔn)確判斷其是否成熟,有效避免了人工操作下的失誤。
2.5 在電力系統(tǒng)自動化中的應(yīng)用
計(jì)算機(jī)視覺技術(shù)在電力系統(tǒng)自動化應(yīng)用的表現(xiàn)當(dāng)前主要表現(xiàn)在以下2個方面:1)在人機(jī)界面中的應(yīng)用。人機(jī)界面在運(yùn)行過程中更加強(qiáng)調(diào)人的主體地位,實(shí)現(xiàn)了用戶對各種效應(yīng)通道和感覺通道的運(yùn)用。具體來講,計(jì)算機(jī)視覺技術(shù)在用戶向計(jì)算機(jī)的輸入方面,效應(yīng)通道實(shí)現(xiàn)了手動為主向手、足、口、身體等的轉(zhuǎn)變;在計(jì)算機(jī)向用戶的輸出方面,感覺通道實(shí)現(xiàn)了視覺為主向觸覺、嗅覺、聽覺等的轉(zhuǎn)變。2)在電廠煤粉鍋爐火焰檢測中的應(yīng)用。對煤粉鍋爐火焰的檢測既能有效判斷鍋爐的運(yùn)行狀況,又能在很大程度上實(shí)現(xiàn)電廠的安全性運(yùn)營。由于煤的負(fù)荷變化和種類變化會在使著火位置發(fā)生移動,所以為了保證爐膛火焰檢測的準(zhǔn)確性,必須彌補(bǔ)之前單純應(yīng)用火焰檢測器只能判斷有無火焰開關(guān)量信號的弊端。計(jì)算機(jī)視覺技術(shù)的應(yīng)用,就在彌補(bǔ)火焰檢測器應(yīng)用弊端的基礎(chǔ)上,實(shí)現(xiàn)了對火焰形狀的進(jìn)一步檢測。
2.6 在圖書館工作中的應(yīng)用
隨著當(dāng)前數(shù)字圖書館和自動化管理系統(tǒng)的建立,計(jì)算機(jī)技術(shù)在圖書館方面的應(yīng)用越來越廣泛。當(dāng)前計(jì)算機(jī)視覺技術(shù)在圖書館方面的應(yīng)用主要集中在古籍修補(bǔ)和書刊剔舊這兩方面。就古籍修補(bǔ)而言,古籍圖書等在收藏的過程中,受溫度、濕度、光照等的影響,極易導(dǎo)致紙張變黃、變脆以及蟲洞等現(xiàn)象的出現(xiàn)。在進(jìn)行修補(bǔ)時,依靠計(jì)算機(jī)視覺技術(shù)開展具體的修補(bǔ)工作,能在很大程度上提高修補(bǔ)工作的效率。就書刊剔舊而言,由于圖書館藏書眾多,對那些使用率低且較為陳舊的文獻(xiàn)資料進(jìn)行及時地剔除,能實(shí)現(xiàn)圖書資源的及時更新。計(jì)算機(jī)視覺技術(shù)在該方面的應(yīng)用,極大地保證了工作的準(zhǔn)確性和效率性。
3 結(jié)束語
通過以上對計(jì)算機(jī)視覺技術(shù)在工業(yè)、農(nóng)業(yè)、林業(yè)、農(nóng)產(chǎn)品檢測、電力系統(tǒng)自動化及圖書館工作這6個方面的研究可以看出,隨著計(jì)算機(jī)技術(shù)的進(jìn)一步發(fā)展以及計(jì)算機(jī)與各專業(yè)學(xué)科的不斷滲透,該技術(shù)的發(fā)展前景和應(yīng)用領(lǐng)域都將更加廣闊。
參考文獻(xiàn)
關(guān)鍵詞:計(jì)算機(jī)視覺;課堂考勤;深度學(xué)習(xí);MCV架構(gòu)
前言
隨著國家標(biāo)準(zhǔn)《智慧校園總體框架》(Smartcampusoverallframework)的,智慧校園的規(guī)劃與設(shè)計(jì)成為了校園建設(shè)的重點(diǎn)項(xiàng)目[1]。而課堂考勤作為學(xué)校教學(xué)管理、學(xué)生評價的重要組成部分,隨著物聯(lián)網(wǎng)技術(shù)、人工智能和移動通信技術(shù)的水平的提高與發(fā)展,更應(yīng)該向著智能化、準(zhǔn)確化的方向發(fā)展[2]。本文研究了的當(dāng)前應(yīng)用的課堂考勤方式,并做了進(jìn)一步的分析,最終根據(jù)社會技術(shù)的革新與發(fā)展[3],提出了一種基于計(jì)算機(jī)視覺的實(shí)時課堂考勤系統(tǒng)的設(shè)計(jì)。我們的主要工作是搭建了整個系統(tǒng)框架,包括數(shù)據(jù)庫系統(tǒng)、服務(wù)器、計(jì)算機(jī)視覺模型、網(wǎng)絡(luò)通信、圖像采集系統(tǒng)、客戶端和網(wǎng)絡(luò)通信系統(tǒng)。
1課堂考勤方式現(xiàn)狀
目前校園中主要的課堂考勤方式存在為兩種,分別是傳統(tǒng)的考勤方式和生物識別的考勤方式。如圖1所示,其中傳統(tǒng)的考勤方式包括點(diǎn)名考勤和通過校園卡進(jìn)行考勤,點(diǎn)名考勤的方式仍然是高校中最常用的考勤手段,因它不受場地的限制,可以根據(jù)點(diǎn)名冊直接核對現(xiàn)場的學(xué)生信息,但這種方式存在的缺點(diǎn)就是花費(fèi)時間,影響上課效率,為此有些教師不進(jìn)行點(diǎn)名,因此影響了考勤的效果。校園卡考勤解決了點(diǎn)名占用課堂時間的問題,但這種方式具有學(xué)生代考勤的漏洞,因?yàn)閷W(xué)生可以拿著別人的校園卡進(jìn)行考勤。生物識別的考勤方式包括指紋考勤和人臉識別考勤,這些方式有效解決了傳統(tǒng)考勤方式代考勤的弊端,但這種方式受設(shè)備硬件的影響,識別能力太慢,尤其是在下課后學(xué)生較多,考勤簽退時容易發(fā)生擁擠等現(xiàn)象,具有安全隱患[4]。因此,為解決當(dāng)前考勤方式存在的一些弊端,本文設(shè)計(jì)了一種基于計(jì)算機(jī)視覺的實(shí)時課堂考勤系統(tǒng)。
2系統(tǒng)設(shè)計(jì)基礎(chǔ)
2.1系統(tǒng)開發(fā)環(huán)境
本文設(shè)計(jì)的實(shí)時課堂考勤系統(tǒng)主要是使用Python開發(fā)語言,Python是目前最流行開發(fā)語言之一,主要應(yīng)用于Web服務(wù)設(shè)計(jì)、大數(shù)據(jù)、人工智能等領(lǐng)域,它的主要優(yōu)點(diǎn)是開發(fā)效率高、可擴(kuò)展性強(qiáng)、跨平臺和具有可移植性等,滿足了本文系統(tǒng)的設(shè)計(jì)要求。另外,在開發(fā)過程還用到了基于Python的第三方軟件開發(fā)包,包括Flask用于搭建系統(tǒng)的Web服務(wù)器;PyQt5用于搭建系統(tǒng)的客戶端;OpenCV用于系統(tǒng)中對圖像視頻的處理;Tensoflow用于開發(fā)計(jì)算機(jī)視覺模型,搭建深度學(xué)習(xí)模型,完成人臉檢測和識別任務(wù);Mysqlclient用于管理、訪問、查詢和更新Mysql數(shù)據(jù)庫。
2.2系統(tǒng)開發(fā)框架
本文設(shè)計(jì)的實(shí)時課堂考勤系統(tǒng)通信基于Web應(yīng)用,因此選擇一個合適的服務(wù)架構(gòu)有利于提高系統(tǒng)的開發(fā)和部署效率。目前較流行的Web應(yīng)用主要有MVC(ModelViewController)和CMS(ContentManagementSystem)兩種架構(gòu)。本文使用了基于Python和Flask搭建的MVC架構(gòu)[5],該架構(gòu)如圖2所示,主要包括模型層、視圖層和控制器。使用該框架的優(yōu)點(diǎn)是可將視圖層和業(yè)務(wù)邏輯層進(jìn)行分離開發(fā),提高開發(fā)效率,方便系統(tǒng)的部署、維護(hù)和管理。
3系統(tǒng)設(shè)計(jì)方式
3.1系統(tǒng)總結(jié)構(gòu)設(shè)計(jì)
本文設(shè)計(jì)的實(shí)時課堂考勤系統(tǒng)的總體結(jié)構(gòu)如圖3所示。根據(jù)MVC構(gòu)架的設(shè)計(jì),我們將該系統(tǒng)分為了模型層、控制器層和視圖層,另外還包括網(wǎng)絡(luò)通信設(shè)備。
3.2模型層設(shè)計(jì)
模型層主要是關(guān)系型數(shù)據(jù)庫模,MySQL是目前使用最多的關(guān)系型數(shù)據(jù)庫系統(tǒng),也是學(xué)校管理系統(tǒng)使用最多的數(shù)據(jù)系統(tǒng),為了更好地與學(xué)校管理系統(tǒng)兼容,我們選擇了MySQL數(shù)據(jù)庫,數(shù)據(jù)表之間的關(guān)系如圖4所示。
3.3控制器層設(shè)計(jì)
控制器層主要包括服務(wù)器應(yīng)用軟件和計(jì)算機(jī)視覺模型,服務(wù)器應(yīng)用軟件的功能包括系統(tǒng)通信配置、數(shù)據(jù)業(yè)務(wù)處理和系統(tǒng)各模塊間的調(diào)度。計(jì)算機(jī)視覺模型是實(shí)時課堂考勤系統(tǒng)的核心模塊,基于深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)[6],主要作用是進(jìn)行人臉檢測和識別兩個部分,計(jì)算機(jī)視覺模型的工作流程如圖5所示。在人臉檢測階段使用VGG16檢測器作為主干網(wǎng)絡(luò),為提高模型的檢測準(zhǔn)確率,通過引入注意力模型和多尺度特征融合對網(wǎng)絡(luò)進(jìn)行了優(yōu)化,有效地從輸入圖片中提取人臉位置信息,得到人臉圖像。在人臉識別階段首先使用FaceNe人臉識別網(wǎng)絡(luò)提取人臉圖像的特征圖,然后通過決策樹算法與待檢測的人臉特征進(jìn)行匹配,從而識別圖片中的學(xué)生信息。
3.4視圖層設(shè)計(jì)
本文設(shè)計(jì)的實(shí)時考勤系統(tǒng)的模型層主要包括圖像采集系統(tǒng)和客戶端。目前各學(xué)校教室內(nèi)都安裝有監(jiān)控設(shè)備,因此為節(jié)約成本和安裝消耗,圖像采集系統(tǒng)使用教室內(nèi)的監(jiān)控設(shè)備作為圖像采集系統(tǒng),負(fù)責(zé)采集教室現(xiàn)場圖片??蛻舳嗽O(shè)計(jì)首先在本系統(tǒng)中采用應(yīng)用程序接口,然后在教學(xué)管理系統(tǒng)中設(shè)計(jì)圖形化用戶界面,通過應(yīng)用程序接口調(diào)用本系統(tǒng)的功能,從而減少資源浪費(fèi),方便維護(hù)和管理。
4實(shí)時考勤功能的實(shí)現(xiàn)
實(shí)時考勤功能的實(shí)現(xiàn)方式如圖6所示,首先系統(tǒng)啟動后,用戶可以隨時更新考勤信息,比如在數(shù)據(jù)庫中創(chuàng)建新的考勤表等。接著系統(tǒng)會自動讀取考勤表的信息,比如課程所在教室、上課時間。然后啟動考勤程序,進(jìn)行簽到、簽退操作,并將考勤數(shù)據(jù)保存到考勤數(shù)據(jù)表中。整個系統(tǒng)啟動完成后可以自動運(yùn)行,直到關(guān)閉系統(tǒng),而且可以實(shí)時進(jìn)行課堂考勤。
多媒體技術(shù)是計(jì)算機(jī)技術(shù)和社會發(fā)展進(jìn)程中人類總需求的結(jié)合。計(jì)算機(jī)技術(shù)發(fā)展的初期解決的是數(shù)值計(jì)算問題,誕生的緣由是美國為了研究軍事技術(shù),對攻擊精度的計(jì)算。計(jì)算機(jī)硬件設(shè)備的發(fā)展,使計(jì)算機(jī)處理數(shù)據(jù)的能力越來越強(qiáng),逐漸從處理數(shù)值發(fā)展到對復(fù)雜的多種形式媒體的處理。多媒體技術(shù)融合了對數(shù)據(jù)、多種媒體、復(fù)雜的智能化處理和交互,并在高速信息網(wǎng)的作用下實(shí)現(xiàn)了信息資源的共享。目前,計(jì)算機(jī)多媒體技術(shù)已經(jīng)改變了人類的生活方式,促進(jìn)了現(xiàn)代文明的進(jìn)程,廣泛應(yīng)用于軍事、工業(yè)、通信、教育、金融、娛樂等諸多領(lǐng)域。
2多媒體技術(shù)的特征
從計(jì)算機(jī)處理多媒體的種類和處理的效果、人類接受的方式來分析,計(jì)算機(jī)多媒體技術(shù)主要具有多樣性、集成性、數(shù)字化、實(shí)時的交互性等特征。
2.1多樣性
計(jì)算機(jī)多媒體技術(shù)面向的媒體種類眾多(章惠,多媒體技術(shù)和教學(xué)的有機(jī)結(jié)合:洛陽大學(xué)學(xué)報,2003),從最初的數(shù)值處理發(fā)展到了人類感官能觸及到的文字、圖像、聲音、動畫、視頻等多種形式媒體的處理。媒體的多樣性,使媒體形式變得豐富多樣,這必將使表達(dá)更為自然生動,表現(xiàn)更為靈活,解決問題更為便捷。
2.2集成性
為了獲得更好的展示效果,各種媒體并不是各行其是的。計(jì)算機(jī)使用不同的媒體,共同展示相同的內(nèi)容,媒體與媒體之間的融合集成、充分展示,讓人們的不同感官得到充分刺激,使人們更易于接受(孫濤,計(jì)算機(jī)多媒體技術(shù)的應(yīng)用:長春理工大學(xué)學(xué)報,2011)。為了多媒體后期的運(yùn)用,各種媒體會被進(jìn)行數(shù)字化處理,然后由多通道統(tǒng)一采集、編輯、存儲、檢索、顯示、傳輸與合成。計(jì)算機(jī)領(lǐng)域內(nèi)最新的硬件和軟件技術(shù)也將促使多種媒體更好的處理效果和更快的處理速度。
2.3數(shù)字化
多媒體中的各種媒體,進(jìn)入計(jì)算機(jī)后,已全部轉(zhuǎn)化為了數(shù)字,以數(shù)字的形式展示和存儲。圖像經(jīng)采樣量化后,以BMP、RGB、CMYK、黑白灰度圖等數(shù)字化形式顯示、存儲;聲音是通過一定的采樣頻率和采樣周期,實(shí)現(xiàn)模擬到數(shù)字的過程;而視頻是在每幀圖像和聲音的采樣、數(shù)字化基礎(chǔ)上,形成的連續(xù)信息。
2.4實(shí)時的交互性
傳統(tǒng)媒體是指報紙、廣播、電視、雜志,這些媒體只能單向、被動地傳播信息,不能稱其為多媒體。多媒體技術(shù)與傳統(tǒng)媒體最大的區(qū)別就是實(shí)現(xiàn)了人機(jī)交互,使用戶能對多媒體信息進(jìn)行主動選擇、操縱和控制,使得獲取和使用信息變被動為主動,同時被人的多種感官所感受、體驗(yàn)。不僅如此,因?yàn)槎嗝襟w的實(shí)時性,即是視頻、聲音等媒體是沒有延遲的,隨著時間的變化而變化。所以,多媒體的交互在高速網(wǎng)絡(luò)的幫助下,能做到?jīng)]有延遲的做出實(shí)時反饋。
3計(jì)算機(jī)創(chuàng)新技術(shù)在多媒體技術(shù)上的應(yīng)用
多媒體技術(shù)涉及范圍非常廣泛,包括了計(jì)算機(jī)軟硬件技術(shù)、數(shù)字信息處理技術(shù)、數(shù)據(jù)壓縮、高性能大容量存儲、網(wǎng)絡(luò)通信技術(shù)等等。這些日新月異發(fā)展的新手段、新技術(shù),推動多媒體系統(tǒng)逐步進(jìn)入人類社會許多領(lǐng)域。多媒體新的技術(shù)不時涌現(xiàn),帶給人們新的驚喜。人工智能是一門新的科學(xué)技術(shù),甚至有些大學(xué)將人工智能從計(jì)算機(jī)科學(xué)與技術(shù)專業(yè)剝離出來,獨(dú)立成一個專業(yè),在學(xué)生本科期間就進(jìn)行相關(guān)研究。但事實(shí)上,人工智能是建立在數(shù)學(xué)和計(jì)算機(jī)科學(xué)與技術(shù)基礎(chǔ)上的高層次學(xué)科,是一門近幾年出現(xiàn)的最引領(lǐng)人類研究興趣的技術(shù)。人工智能研究的最終結(jié)果就是機(jī)器人,而事實(shí)上,機(jī)器人集多種媒體表現(xiàn)于一生,通過機(jī)器人的觸感模仿人類去理解和辨別外界。人工智能研究的圖像識別、自然語言處理、語言識別融合在了機(jī)器人身上,與多媒體技術(shù)廣泛結(jié)合,應(yīng)用于人類生活。我們從機(jī)器人身上看到了人工智能對多媒體技術(shù)的影響。下面從涉及到的幾個方面去分別探討。
3.1計(jì)算機(jī)視覺
人們通過感官獲取外界信息,僅視覺就能獲得外界80%-90%的信息(王守佳,基于圖像的人體檢測跟蹤和人臉識別的研究:吉林大學(xué),2013)。計(jì)算機(jī)視覺是一門屬于計(jì)算機(jī)智能的學(xué)科,采用了動物視覺原理,具有獲取圖像、分析圖像到理解圖像的工作過程。計(jì)算機(jī)視覺通過鏡頭等圖像傳感設(shè)備代替人類的眼睛來獲取周圍環(huán)境的圖像,依靠計(jì)算機(jī)來代替人類大腦的工作,將采集到的圖像進(jìn)行分析和處理。人類處于一個三維的環(huán)境之中,計(jì)算機(jī)視覺技術(shù)可以幫助分析處理。處理的手段可分為三個層次,底層、中間層、高層。底層就是圖像處理技術(shù),將二維圖像去噪、邊緣檢測后進(jìn)行分割、根據(jù)圖像特征進(jìn)行提取、圖像識別等。中間層是指對圖像、視頻外在特征的歸納判斷,譬如形狀、顏色、運(yùn)動軌跡等。高層,即是對外界事物和環(huán)境的觀察和理解。由以上三個層次可見,利用計(jì)算機(jī)視覺技術(shù)能對數(shù)字化圖像改變形態(tài)、尺寸、色彩調(diào)整、文件格式轉(zhuǎn)換等。目前,計(jì)算機(jī)視覺技術(shù)還能對圖像進(jìn)行高效的檢測、高速的識別,對運(yùn)動軌跡進(jìn)行精準(zhǔn)判斷。而這些已被廣泛地應(yīng)用于多媒體產(chǎn)品中。
3.2音頻技術(shù)
聲音是多媒體技術(shù)經(jīng)常采用的一種媒體形式,包括了語音和音樂等。多媒體通常需要通過聲音去烘托主題氣氛,彰顯意境。特別是自學(xué)型多媒體系統(tǒng)和多媒體廣告,沒有人進(jìn)行現(xiàn)場講解,那么就需要加入聲音進(jìn)行解說,這樣,數(shù)字音頻信號顯得更加重要。音頻技術(shù)基于電聲技術(shù),主要包括:去噪、壓縮、調(diào)整振幅等的數(shù)字化處理,以及語音處理和識別。長久以來,語音識別是人們的夢想,人們一直期盼計(jì)算機(jī)能夠聽懂人說話,根據(jù)人的語言做出相應(yīng)動作,這也是設(shè)計(jì)智能計(jì)算機(jī)的目的之一。如今,具備多種語言識別功能已成為多媒體設(shè)備的標(biāo)配,識變率也非常高。無論持哪種語言、地方口音的人們,都能通過語音轉(zhuǎn)化為文字,甚至通過語音傳送指令,得到回應(yīng)、達(dá)到意圖。
3.3虛擬現(xiàn)實(shí)技術(shù)
虛擬現(xiàn)實(shí)技術(shù)是利用計(jì)算機(jī)多媒體技術(shù),運(yùn)用3D場景、燈光、聲音、動感創(chuàng)造模擬出真實(shí)氛圍,為用戶建立出一個虛擬環(huán)境。虛擬現(xiàn)實(shí)技術(shù)與計(jì)算機(jī)仿真技術(shù)相結(jié)合,將用戶置身其中進(jìn)行學(xué)習(xí)、工作與娛樂。這種技術(shù)已被廣泛應(yīng)用于教育教學(xué)、科普、軍事、醫(yī)療、娛樂以及大型的網(wǎng)絡(luò)游戲中。虛擬技術(shù)投入成本較高,成熟的設(shè)施主要運(yùn)用于教學(xué),比如多媒體航空飛行教學(xué)系統(tǒng),通過該系統(tǒng),可按100%比例局部展示表盤、操縱桿、艙外景物,通過配合空中場景、感知各種場景給身體帶來的變化。使用這套系統(tǒng)進(jìn)行模擬訓(xùn)練,可以有效的提高飛行員對飛機(jī)的操作水平。隨著計(jì)算機(jī)技術(shù)的迅猛發(fā)展,虛擬現(xiàn)實(shí)技術(shù)成為目前的高新技術(shù)。在多媒體環(huán)境中,多種媒體的相互融合,使媒體的形式更加多樣,多媒體技術(shù)在模式識別、語音識別和傳感技術(shù)基礎(chǔ)上,提取對象面部特征,模擬觸覺、視覺、聽覺等感官,使人處于逼真的三維世界,當(dāng)人有反應(yīng)或行動時,場景還會適時變化,即是讓人如臨其境的、自然的與計(jì)算機(jī)進(jìn)行交互。虛擬現(xiàn)實(shí)技術(shù)具有非常廣闊的發(fā)展前景,為人們的日常生活提供了很多樂趣和便捷。
3.4網(wǎng)絡(luò)化
多媒體應(yīng)用的數(shù)據(jù)通道是通信網(wǎng)絡(luò),網(wǎng)絡(luò)給了多媒體更大的施展空間。多媒體技術(shù)的應(yīng)用要想在網(wǎng)絡(luò)上有所建樹,必要受通信技術(shù)的影響。在網(wǎng)絡(luò)通信技術(shù)的進(jìn)步和整合下,網(wǎng)絡(luò)帶寬影響傳輸速率、通信協(xié)議影響傳輸可靠性、交換方式影響信道利用率,這些勢必會影響多媒體的傳輸。計(jì)算機(jī)網(wǎng)絡(luò)給用戶提供了一個難以想象的龐大的信息網(wǎng)絡(luò)平臺,豐富的信息資源隨手拈來,方便于人們的學(xué)習(xí)、工作和生活交流。而無線網(wǎng)絡(luò)技術(shù)的發(fā)展,使資源變得隨手可?。ɡ顣造o,計(jì)算機(jī)多媒體技術(shù)的應(yīng)用現(xiàn)狀與發(fā)展前景:科技情報開發(fā)與經(jīng)濟(jì),2007),人們可隨時隨地通過訪問全球網(wǎng)絡(luò)和設(shè)備,便捷地實(shí)現(xiàn)對多媒體資源的共享,是未來發(fā)展的主題。計(jì)算機(jī)技術(shù)的不斷創(chuàng)新和發(fā)展,促使了巨大的變革。CPU、內(nèi)存、GPU等在內(nèi)的計(jì)算機(jī)終端硬件設(shè)備性能越來越先進(jìn);而網(wǎng)絡(luò)設(shè)備,例如服務(wù)器、路由器、網(wǎng)橋、交換機(jī)等也越來越強(qiáng)大。計(jì)算機(jī)計(jì)算的精度、速度、邏輯判斷能力和充裕的帶寬,讓人們更加游刃有余的與網(wǎng)絡(luò)虛擬世界互動。網(wǎng)絡(luò)環(huán)境的高質(zhì)、高速,消除了人與人空間和時間上的困擾,能全方位的為人類效勞。動態(tài)和交互式多媒體技術(shù)還能在網(wǎng)絡(luò)環(huán)境中創(chuàng)建更形象的2D和3D場景。辦公、教學(xué)和娛樂工具在視頻、音頻設(shè)備的協(xié)助下,集成在終端多媒體計(jì)算機(jī)中,新一代用戶界面與人工智能等個性化、網(wǎng)絡(luò)化的多媒體軟件應(yīng)用,可隨時與身處世界任何角落的人們進(jìn)行交流。
4結(jié)論
關(guān)鍵詞:計(jì)算機(jī)技術(shù);輪廓提??;視覺測量
計(jì)算機(jī)視覺測量技術(shù)是一種綜合技術(shù),融合了光電子技術(shù)、計(jì)算機(jī)技術(shù)、圖像處理技術(shù)等多種技術(shù)。在對采集對象進(jìn)行處理之后,就可以得到目標(biāo)物體的幾何特征參數(shù)。想要得到準(zhǔn)確的圖像,就必須重視目標(biāo)物體的輪廓提取參數(shù)。在計(jì)算機(jī)視覺測量系統(tǒng)中,為了保障測量的精準(zhǔn)度,選取合適的輪廓提取方法也是很重要的。邊緣檢測法是輪廓提取方法中主要的內(nèi)容,該方法借助于空域微分算子,使圖像和模板完成卷積。邊緣檢測方法中的局部算子法,具有實(shí)現(xiàn)簡單、運(yùn)算速度快等優(yōu)點(diǎn)。梯度算子、Sobel算子、Roberts算子、canny算子,都是經(jīng)典局部算子法。本文提出了基于灰度閾值法的原理,根據(jù)鏈碼跟蹤技術(shù)對輪廓信息進(jìn)行存儲,實(shí)現(xiàn)圖像輪廓的提取。這種方法具有準(zhǔn)確度高、穩(wěn)定性好等優(yōu)勢,在工程上的應(yīng)用十分廣泛。
1 輪廓提取的原理
輪廓提取指的是從物體圖像上得到物體外形,它能夠有效保障測量的精確度。由于計(jì)算機(jī)視覺測量圖像只含有目標(biāo)和背景2類區(qū)域,應(yīng)該利用閾值分析法對圖像進(jìn)行分割。為了確保二維圖像中沒有噪音,可以利用非線性的濾波能力消除噪音。為了實(shí)現(xiàn)輪廓提取,將會掏空圖像內(nèi)部的點(diǎn)。通過鏈碼跟蹤技術(shù)對輪廓的信息進(jìn)行存儲,使圖像的輪廓處理工作量得以減輕。輪廓提取的工作流程是:首先對原始圖像進(jìn)行預(yù)處理,消除噪音后可以得到平滑的圖像。然后,對圖像進(jìn)行閾值分割得到二維圖像。對二值圖像進(jìn)行輪廓提取,就可以得到圖像的邊界點(diǎn)。最后,再根據(jù)跟蹤算法將輪廓存儲為鏈碼序列的形式。
2 圖像輪廓提取的關(guān)鍵技術(shù)
輪廓提取技術(shù)是計(jì)算機(jī)視覺測量技術(shù)中的重要組成部分,輪廓提取技術(shù)主要包括圖像預(yù)處理技術(shù)、閾值分割技術(shù)、輪廓提取技術(shù)和鏈碼跟蹤技術(shù)等內(nèi)容。本文將具體介紹幾種關(guān)鍵的圖像的輪廓提取技術(shù)。
2.1 圖像預(yù)處理技術(shù)
通過光學(xué)成像系統(tǒng)產(chǎn)生的二維圖像經(jīng)常含有各種噪音。為了提高計(jì)算機(jī)的視覺能力,增加計(jì)算機(jī)的分析和識別能力,必須消除掉這些二維圖像中的噪音。有目的地顯示出有用的信息,消除掉無用的信息,這種方法就是圖像預(yù)處理技術(shù)。圖像預(yù)處理技術(shù)能夠有效增加圖像的清晰度,是一種關(guān)鍵的計(jì)算機(jī)視覺測量技術(shù)。圖像的預(yù)處理技術(shù)是指在圖像輸入過程中對圖像進(jìn)行處理,從而得到清晰圖像的技術(shù)。圖像的預(yù)處理技術(shù)的內(nèi)容很多,比如圖像中如果含有噪音,就需要除掉圖像中的雜音,提高圖像的語音效果。對于一些比度比較小的圖像,就需要對其進(jìn)行灰度變換。對于已經(jīng)模糊的圖像,應(yīng)該進(jìn)行各種復(fù)原處理。對于失真的圖像,應(yīng)該采用幾何方法來校正。
計(jì)算機(jī)視覺測量中的圖像預(yù)處理技術(shù),能夠有效地提高圖像的畫面質(zhì)量,讓圖像便于處理,更易于測量。圖像預(yù)處理的方法有很多,通常情況下,主要采用圖像平滑處理、圖像銳化處理、圖像邊緣增強(qiáng)等技術(shù)。
2.2 閾值分割技術(shù)
由于計(jì)算機(jī)視覺測量技術(shù)中只有目標(biāo)和背景兩類區(qū)域,本文將采用單閾值法來分割圖像。閾值分割法在實(shí)施的過程中,先要確定分割閾值,再將分割閾值與像素的灰度進(jìn)行比較。
閾值分割法的原理是:首先設(shè)定圖像的灰度區(qū)間在z的最大值和z的最小值之間。在該區(qū)間設(shè)定一個閾值Z,閾值Z的大小在z最小值與最大值之間,令圖像中所有灰度值小于或等于Z的像素,將它們的新灰度值設(shè)定為0,大于Z的像素新灰度值設(shè)定為1。經(jīng)過這樣的閾值分割,就可以得到輸出的二值圖像。
閾值分割的工作盡量保留原圖像,在此基礎(chǔ)上,應(yīng)該去掉一些冗余信息。但閾值分割法中最為關(guān)鍵的就是閾值z的確定,這是灰度值的突變點(diǎn)。本文將采用迭代法來確定閾值Z,根據(jù)灰度直方圖來確定初始閾值,將圖像分割為目標(biāo)和背景,計(jì)算目標(biāo)和背景灰度的平均值,可以利用循環(huán)迭代的方法求出差值較小的閾值,該閾值就是灰度閾值Z。這種方法求灰度值算法簡單,便于實(shí)現(xiàn),其具體的步驟是:首先,求出圖像的最大閾值與最小閾值,令初始閾值為最大閾值與最小閾值和的一半。然后,再利用初始閾值將圖像分割為目標(biāo)和背景,分別求出目標(biāo)和背景的平均灰度值Zo與Zb。Zo與Zb和的一般就是新閾值Z,如果新閾值Z與初始閾值相等,那么新閾值Z即為所求閾值。
2.3 輪廓提取技術(shù)
通過對閾值分割后的圖像進(jìn)行缺陷修補(bǔ),還需要利用輪廓提取技術(shù),最后才能得到圖像中目標(biāo)的二維輪廓。本文將采用掏空內(nèi)部點(diǎn)的方法對二維圖形進(jìn)行輪廓提取。假定背景顏色為黑色,目標(biāo)顏色為白色。當(dāng)目標(biāo)中有1個點(diǎn)為白色,這個內(nèi)部點(diǎn)周圍的8個點(diǎn)都為白色時,就可以將這個點(diǎn)和它周圍8個點(diǎn)都刪除,把內(nèi)部點(diǎn)全部掏空。
在二值圖像中,假設(shè)背景的灰度為0,目標(biāo)灰度為l,那么邊界輪廓的提取方法如下:如果中心像素值為O,那么其余相連8個像素均規(guī)定為1;如果其余相連8個像素為1,那么將把中心像素值改為0;除此之外,中心像素將一律設(shè)定為1。根據(jù)這樣的規(guī)則,就可以得到圖像的輪廓。
2.4 鏈碼跟蹤技術(shù)
鏈碼是一種改進(jìn)的坐標(biāo)序列存儲結(jié)構(gòu),鏈碼用指向中心像素P的8個方向來表示,每個方向都存在著45度的夾角。對于輪廓圖像來說,除了起始像素以外,所有的像素都可以用8個像素方向來確定。輪廓跟蹤是以鏈碼的方向來進(jìn)行的,上一個輪廓點(diǎn)將會影響到下一個跟蹤點(diǎn)。這種方法能夠加快像素掃描的速度,能夠有效地提高跟蹤效率。
鏈碼的跟蹤過程如下:(1)通過掃描得到初始輪廓點(diǎn),將該點(diǎn)的坐標(biāo)定位(x,y),進(jìn)入步驟(2),如果掃描之后得不到輪廓點(diǎn),那么進(jìn)入步驟(4)。(2)按照鏈碼的方向來掃描當(dāng)前與相鄰的8個區(qū)域,如果遇到輪廓點(diǎn),用“-”設(shè)置停止掃描跟蹤,并記錄該店的鏈碼值,轉(zhuǎn)進(jìn)步驟(3);如果掃描過程中沒有遇到輪廓點(diǎn),則設(shè)置結(jié)束跟蹤標(biāo)志,將掃描點(diǎn)重新設(shè)置到起始點(diǎn)(x,y)坐標(biāo)上,轉(zhuǎn)退步驟(1)。(3)用底色填充掃描輪廓點(diǎn),將當(dāng)前點(diǎn)設(shè)置為跟蹤到的輪廓處,轉(zhuǎn)退步驟(2)。(4)用“-”設(shè)置結(jié)束所有輪廓跟蹤。
根據(jù)上述步驟,不僅可以算出鏈碼序列,還能夠求出鏈碼序列中的坐標(biāo)、方向,甚至能求出鏈碼的具體值。為了區(qū)別鏈碼序列中的不同輪廓,要使用特殊標(biāo)志將它們分開。為了找出封閉輪廓的起始點(diǎn),應(yīng)先標(biāo)出鏈碼方向序列,將輪廓結(jié)束標(biāo)志最后標(biāo)出。在自閉式輪廓跟蹤系統(tǒng)中,序列的記錄工作是根據(jù)輪廓線條順序進(jìn)行的,這將大大方便后續(xù)輪廓處理工作。
通過鏈碼的解密工作,可以求出鏈碼表示的輪廓值,解碼的過程和編碼的過程相同。鏈碼和像素之間存在一一對應(yīng)關(guān)系,可以用數(shù)組的方法來解決解碼問題。對于X坐標(biāo)的數(shù)組,可以將它們設(shè)定為X[8],X[8]={1,1,0,-1,-1,-1,0,1}。對于Y坐標(biāo)的數(shù)組,可以將它們設(shè)定為Y[8],Y[8]={0,1,1,1,0,-1,-1,-1)。通過處理這種鏈碼序列,可以求出不同輪廓的坐標(biāo)值。
3 圖像輪廓提取效果分析
如果圖像在沒有受到干擾的情況下,就能夠提取到較為清晰的輪廓。但是如果存在某種敏感性因素時,就會嚴(yán)重影響圖像的輪廓提取效果。利用20%的椒鹽噪聲影響一個花瓶圖像,在預(yù)處理環(huán)節(jié)對其濾波之后,會產(chǎn)生出圖像5(c)。以這種圖像為檢驗(yàn)標(biāo)準(zhǔn),對其進(jìn)行輪廓提取試驗(yàn)。同時,也可以利用Sobel,Robets,Canny等算子對該圖像進(jìn)行邊緣提取試驗(yàn),將實(shí)驗(yàn)得出的結(jié)構(gòu)圖像,與輪廓提取試驗(yàn)中得到的圖像相比較,可得到圖1。
根據(jù)圖1可以看到,Sobel算子、Robets算子、Canny算子在受到干擾的情況下,對圖像輪廓的提取效果不是很好,會出現(xiàn)斷線、噪聲等問題。而采用本文方法的輪廓則能保持較高的清晰度,這種方法適用性強(qiáng),無噪音,未來必將會得到廣泛應(yīng)用。
(上海大學(xué)通信與信息工程學(xué)院,上海200072)
摘要:運(yùn)動目標(biāo)的檢測是數(shù)字圖像處理和模式識別的基礎(chǔ),也是計(jì)算機(jī)視覺研究的一個重要領(lǐng)域。以C#為主要研究工具,對基于相鄰幀差法及背景差分法的視頻目標(biāo)檢測算法進(jìn)行了研究,主要對其原理和算法進(jìn)行研究。最后利用以AForge.NET架構(gòu)類庫,利用圖像灰度的絕對值是否大于設(shè)置的閾值實(shí)現(xiàn)了對運(yùn)動目標(biāo)進(jìn)行檢測,實(shí)驗(yàn)結(jié)果表明,采用該算法可以對運(yùn)動目標(biāo)進(jìn)行較為精確的檢測。
關(guān)鍵詞 :運(yùn)動檢測;AForge.NET;幀差法;背景差分法
中圖分類號:TN911.73?34 文獻(xiàn)標(biāo)識碼:A 文章編號:1004?373X(2015)17?0058?03
0 引言
由于微電子技術(shù)的發(fā)展與社會生活水平的提高及各種安防需求的增多,運(yùn)動目標(biāo)檢測逐步成為當(dāng)前監(jiān)控系統(tǒng)研究領(lǐng)域的熱點(diǎn),更是計(jì)算機(jī)視覺領(lǐng)域中視頻跟蹤算法和識別技術(shù)的基礎(chǔ),該算法的檢測精度直接影響了后續(xù)的運(yùn)動目標(biāo)跟蹤及識別效果。目前,運(yùn)動目標(biāo)檢測領(lǐng)域比較常用的方法有:光流法、幀間差分法和背景差分法。
光流法是相對于觀察者的運(yùn)動目標(biāo)造成的觀測目標(biāo)、表面或邊緣的運(yùn)動[1]。但是該算法計(jì)算量比較大,并且存在抗干擾能力差,所以對于實(shí)時性要求較高的場合,該檢測算法在視頻運(yùn)動檢測應(yīng)用中并不是特別的適用,目前在運(yùn)動檢測中最常用的方法實(shí)際上是背景差分法[2]和幀間差分法[3]。
幀間差分法是一種通過對視頻圖像序列中相鄰兩幀作差分運(yùn)算來獲得運(yùn)動目標(biāo)輪廓的方法,非常適用于存在多個運(yùn)動目標(biāo)和攝像機(jī)移動的情況[4]。由于該算法對光線及場景變化具有較強(qiáng)的抗干擾性,且無需獲得背景圖像,更新速度快,所以非常適用于實(shí)時性較強(qiáng)的應(yīng)用場合。但是該算法存在閾值難以確定的問題,這個現(xiàn)象在低對比度灰度圖像序列別明顯,導(dǎo)致對目標(biāo)對象的完整區(qū)域提取不完整而產(chǎn)生空洞的現(xiàn)象。
背景差分法是采用圖像序列中的當(dāng)前幀和背景參考模型比較,來檢測運(yùn)動目標(biāo)的一種方法,其檢測性能依賴于所使用的背景建模技術(shù)[5]。該算法可以實(shí)現(xiàn)緩慢的背景變化過程中對目標(biāo)進(jìn)行精確快速的分割,所以具有很強(qiáng)的適用性,然而對于突然的光照變化和背景擾動,對物體帶有影子的圖像分割出來的前景圖像可能帶有影子區(qū)域[6],為此可以通過建立實(shí)時更新的背景模型機(jī)制將前景區(qū)域分割出來,就可以減少動態(tài)場景變化對運(yùn)動分割的影響[7]。
本文利用AForge.NET[8]架構(gòu)類庫,在Microsoft VisualStudio 2010中分別實(shí)驗(yàn)了幀間差分法與背景差分法,并實(shí)現(xiàn)運(yùn)動目標(biāo)的檢測。實(shí)驗(yàn)結(jié)果表明,利用幀間差分法可以快速實(shí)現(xiàn)運(yùn)動目標(biāo)的檢測,但是對于運(yùn)動速度較慢的目標(biāo)檢測效果不是特別理想。為此,對于緩慢變化的運(yùn)動目標(biāo)引入背景差分法,利用類庫中MoveTowards類建立實(shí)時有效的背景模型,有效地解決目標(biāo)低速運(yùn)動識別率較低的問題,提高了目標(biāo)檢測的準(zhǔn)確率。
1 AForge.NET 簡介
AForge.NET是一個專門為開發(fā)者和研究者設(shè)計(jì)的基于C#框架,包括計(jì)算機(jī)視覺與人工智能、圖像處理、神經(jīng)網(wǎng)絡(luò)、遺傳算法、機(jī)器學(xué)習(xí)、模糊系統(tǒng)、機(jī)器人控制等領(lǐng)域[9]。AForge.NET 是一個不斷完善和發(fā)展的計(jì)算機(jī)視覺和圖像處理庫,目前的最新版本是2.2.5。
這個框架由一系列的類庫組成,主要包括有:
AForge.Imaging:日常的圖像處理和過濾器;
AForge.Vision:計(jì)算機(jī)視覺應(yīng)用類庫;
AForge.Neuro:神經(jīng)網(wǎng)絡(luò)計(jì)算庫AForge.Genetic?進(jìn)化算法編程庫;
AForge.MachineLearning:機(jī)器學(xué)習(xí)類庫;
AForge.Robotics:提供一些機(jī)器學(xué)習(xí)的工具類庫;
AForge.Video:一系列的視頻處理類庫;
AForge.Fuzzy:模糊推理系統(tǒng)類庫;
AForge.Controls:圖像,三維,圖表顯示控件。
2 檢測原理
幀差法及背景差分法主要原理就是圖像的差分技術(shù)。設(shè)在一個時間軸上相鄰時刻點(diǎn)ti 采集到的圖像幀分別為f (x,y,ti),ti + 1 采集到的幀為f (x,y,ti + 1),則可以得出:
//對兩幀數(shù)據(jù)差值進(jìn)行數(shù)據(jù)濾波
Bitmap tmp3 = erosionFilter.Apply(tmp2);
上面幾行代碼可以計(jì)算出當(dāng)前幀與上一幀這兩幀數(shù)據(jù)相差的像素數(shù)據(jù),通過設(shè)定特定的閾值,就可以實(shí)現(xiàn)對運(yùn)動目標(biāo)的報警功能。在本文所做的實(shí)驗(yàn)中,為了形象展示當(dāng)前幀與上一幀數(shù)據(jù)的差值數(shù)據(jù),把連續(xù)兩幀數(shù)據(jù)差值用過紅色高亮數(shù)據(jù)進(jìn)行顯示。實(shí)驗(yàn)結(jié)果表明,通過差幀法可以快速實(shí)現(xiàn)運(yùn)動目標(biāo)的檢測,由于幀差檢測法存在閾值難以確定的問題,特別是對于低速運(yùn)動的運(yùn)動目標(biāo),如果設(shè)定較低的閾值則存在誤觸發(fā)虛報的問題,而對于設(shè)定的高閾值,因?yàn)榫哂休^低的檢測靈敏度,則存在漏警的問題,實(shí)驗(yàn)結(jié)果如圖2所示。
為此,本文引入了背景差分法技術(shù),相對幀差檢測算法,該算法使用AForge.NET的MoveTowards類實(shí)現(xiàn)實(shí)時背景的建模,再通過當(dāng)前圖像幀與建模形成的背景幀數(shù)據(jù)進(jìn)行差分運(yùn)算,實(shí)現(xiàn)運(yùn)動目標(biāo)的檢測。該算法可以解決幀差檢測法閾值難以確定的問題,可以實(shí)現(xiàn)低速運(yùn)動目標(biāo)精確的定位與檢測。
背景差分法與幀間差分法的區(qū)別只是有了一個背景更新的過程,本文新背景的建立是通過AForge.NET視頻庫中類實(shí)現(xiàn),該類背景提取算法原理是當(dāng)前幀與前一個背景幀求加權(quán)平均得出當(dāng)前背景幀數(shù)據(jù)。背景差分法的具體算法流程如圖3所示。
背景差分法相關(guān)實(shí)現(xiàn)代碼如下:
// 初始化背景類
MoveTowards moveTowardsFilter = new MoveTowards();
// 把當(dāng)前幀復(fù)制給該類
moveTowardsFilter.OverlayImage = currentFrame;
// 通過前一幀與當(dāng)前幀建立新的背景
Bitmap tmp = moveTowardsFilter.Apply(backgroundFrame);
// 把原先老的背景去除掉
backgroundFrame.Dispose();
//把當(dāng)前計(jì)算出來的背景幀保存下來,為下一背景幀計(jì)算做準(zhǔn)備
backgroundFrame = tmp;
背景差分法運(yùn)動檢測算法的相關(guān)實(shí)驗(yàn)結(jié)果如圖4所示。
從圖4 可以看出,背景差分法具有更好的目標(biāo)輪廓,通過當(dāng)前幀與背景幀比較的運(yùn)動檢測算法,可以很好地解決運(yùn)動目標(biāo)低速運(yùn)行的問題,可以較為精確地實(shí)現(xiàn)與運(yùn)動目標(biāo)的檢測。所有背景差分法與幀差法相比,具有更高的檢測精度,非常適合工程中的應(yīng)用。
4 結(jié)語
本文利用AForge.NET 類庫,分別采用幀差法及背景差分法對運(yùn)動目標(biāo)進(jìn)行實(shí)時檢測。實(shí)驗(yàn)結(jié)果證明,利用AForge.NET可以實(shí)現(xiàn)運(yùn)動目標(biāo)的檢測功能,并且具有很強(qiáng)的實(shí)時性。幀差法可以快速地檢測運(yùn)動目標(biāo),但是由于其特性決定了其對于低速運(yùn)動目標(biāo)的檢測較背景差分法檢測靈敏度要低。本文只針對運(yùn)動目標(biāo)進(jìn)行簡單的檢測,對于更進(jìn)一步的問題將在后續(xù)工作中繼續(xù)研究。
參考文獻(xiàn)
[1] 陳銀,任侃,顧國華,等.基于改進(jìn)的單高斯背景模型運(yùn)動目標(biāo)檢測算法[J].中國激光,2014(11):245?253.
[2] 紀(jì)青華,禹素萍.基于Surendra背景減除法和四幀差分法的目標(biāo)檢測算法[J].計(jì)算機(jī)應(yīng)用與軟件,2014(12):242?244.
[3] 邱斌,干紅華,張亶.基于時空信息的運(yùn)動目標(biāo)分割算法[J].激光雜志,2014(12):40?44.
[4] 柴池.基于背景差分和三幀差分的運(yùn)動目標(biāo)檢測[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2014(11):75?76.
[5] 黃素茵.基于視頻監(jiān)控運(yùn)動目標(biāo)檢測算法研究[D].廣州:華南理工大學(xué),2013.
[6] 余啟明.基于背景減法和幀差法的運(yùn)動目標(biāo)檢測算法研究[D].贛州:江西理工大學(xué),2013.
[7] 嚴(yán)曉明.一種基于改進(jìn)幀差法的運(yùn)動目標(biāo)檢測[J].莆田學(xué)院學(xué)報,2011(5):69?72.
[8] KIRILLOV A. AForge.NET framework [EB/OL].(2010?03?02)[2010?12?20]. http:// aforgenet. com.
利用計(jì)算機(jī)的存儲能力完成統(tǒng)計(jì)記錄功能。變電站自動化系統(tǒng),是變電站(所)自動化監(jiān)控管理的重要設(shè)備,是集計(jì)算機(jī)技術(shù)、自動控制技術(shù)和通訊技術(shù)等實(shí)現(xiàn)對變電站二次設(shè)備(包括繼電保護(hù)、控制、測量、信號、故障錄波、自動裝置及遠(yuǎn)動裝置等)的功能進(jìn)行重新組合、優(yōu)化設(shè)計(jì),對變電站全部設(shè)備的運(yùn)行情況執(zhí)行監(jiān)視、測量、控制和協(xié)調(diào)的一種綜合性的自動化系統(tǒng)。通過變電站綜合自動化系統(tǒng)內(nèi)各設(shè)備間相互交換信息,數(shù)據(jù)共享,完成變電站運(yùn)行監(jiān)視和控制任務(wù)。變電站綜合自動化替代了變電站常規(guī)二次設(shè)備,簡化了變電站二次接線。
2電網(wǎng)調(diào)度自動化
電網(wǎng)調(diào)度自動化主要是通過電子計(jì)算機(jī)運(yùn)用自動化技術(shù)對電網(wǎng)進(jìn)行調(diào)動,實(shí)現(xiàn)對整個電力運(yùn)行系統(tǒng)的監(jiān)控。從而確保了能夠及時預(yù)測和處理電力運(yùn)輸過程中出現(xiàn)的安全隱患以及故障發(fā)生,從而達(dá)到合理分配電能的目的。電網(wǎng)調(diào)度自動化會帶來很多有利的功效,首先,通過合理化的調(diào)度可以降低電能消耗,從根本上減少了能源浪費(fèi);其次,電網(wǎng)調(diào)度自動化為電能的安全運(yùn)行提供了有力的保障。能夠及時檢測出可能導(dǎo)致電網(wǎng)異常運(yùn)行的因素,并對之進(jìn)行有效的處理,避免了因電網(wǎng)故障而發(fā)生的系統(tǒng)崩潰等嚴(yán)重情況;最后,電網(wǎng)調(diào)度作為電力系重要的組成部分,其自動化發(fā)展促進(jìn)了電網(wǎng)建設(shè)進(jìn)程的加快,有助于電力系統(tǒng)自動化的發(fā)展。
3計(jì)算機(jī)技術(shù)推動電力系統(tǒng)自動化技術(shù)的發(fā)展歷程
上世紀(jì)八十年代單片機(jī)技術(shù)的發(fā)展,以及國產(chǎn)的工業(yè)計(jì)算機(jī)和PC機(jī)技術(shù)應(yīng)用,促進(jìn)了電力系統(tǒng)自動化設(shè)備的發(fā)展。自動化裝置采用數(shù)字電路和模塊化軟件設(shè)計(jì)技術(shù),具有了通信功能,數(shù)字式故障錄波器、微機(jī)遠(yuǎn)動裝置及巡回檢測設(shè)備、微機(jī)繼電保護(hù)裝置性等一系列建立在計(jì)算機(jī)技術(shù)基礎(chǔ)上的設(shè)備開始大量使用。計(jì)算機(jī)技術(shù)為電力系統(tǒng)調(diào)度自動化、電廠監(jiān)控系統(tǒng)、變電站綜合自動化奠定了基礎(chǔ)。上世紀(jì)九十年代高性能工作站、服務(wù)器及軟件技術(shù)、信息處理技術(shù)發(fā)展迅速,電網(wǎng)調(diào)度自動化系統(tǒng)、電廠監(jiān)控、變電站自動化、配電自動化的技術(shù)水平上了一個新臺階。大幅度減少了電力電纜、通信電纜的用量,減少了占地面積從而降低了建設(shè)成本。增加了設(shè)備配置的靈活性、互換性和可維護(hù)性,提高了系統(tǒng)運(yùn)行的可靠性。
4計(jì)算機(jī)技術(shù)的發(fā)展對電力系統(tǒng)自動化的影響
4.1計(jì)算機(jī)技術(shù)與電力設(shè)備出現(xiàn)電磁干擾現(xiàn)象隨著電子計(jì)算機(jī)在電力系統(tǒng)中的使用,計(jì)算機(jī)中的處理器與電力設(shè)備之間很容易相互影響,在一定的條件下會對運(yùn)行的設(shè)備和人員造成干擾現(xiàn)象,出現(xiàn)電磁不兼容的問題。電力系統(tǒng)十分復(fù)雜和龐大,包含很多不同功能的處理系統(tǒng),各個系統(tǒng)彼此關(guān)聯(lián)、互相影響,當(dāng)前的技術(shù)對于電能的運(yùn)行環(huán)境還沒有達(dá)到控制在相對穩(wěn)定的局面,一旦某一以微處理器為核心的微機(jī)型產(chǎn)品受到電磁的干擾,便會出現(xiàn)數(shù)據(jù)紊亂的狀況,很容易導(dǎo)致整個供電系統(tǒng)的癱瘓或者數(shù)據(jù)丟失等嚴(yán)重故障。所以,如何保證電子計(jì)算機(jī)與管理系統(tǒng)的和諧融合一直是社會重點(diǎn)關(guān)注并有待解決的內(nèi)容。
4.2計(jì)算機(jī)視覺技術(shù)在電力系統(tǒng)自動化中的應(yīng)用計(jì)算技術(shù)覺技術(shù)在80年代取得了突破性進(jìn)展。那么什么是計(jì)算機(jī)視覺呢?簡單點(diǎn)說就是用機(jī)器的眼睛“看”世界,對計(jì)算機(jī)拍攝下來的圖像進(jìn)行多角度的處理,使人們更容易從中分析獲取需要的信息。目前此項(xiàng)技術(shù)已經(jīng)發(fā)展到各個應(yīng)用領(lǐng)域,其中也包括了電力系統(tǒng)。因?yàn)殡S著電力系統(tǒng)規(guī)模的擴(kuò)大,對供電要求的不斷提高,在處理圖像信息的過程中,要求工作人員的分析能力也越來越高,人腦已逐漸無法適應(yīng)高速的計(jì)算能力,所以計(jì)算機(jī)視覺技術(shù)取代人腦來分析處理圖像數(shù)據(jù)就成為了必然趨勢。其高效率、高智能的處理器促進(jìn)了電力系統(tǒng)向自動化的發(fā)展。
4.3計(jì)算機(jī)智能控制技術(shù)在電力系統(tǒng)自動化中的發(fā)展前景隨著電力系統(tǒng)不斷向自動化發(fā)展,電力調(diào)度技術(shù)慢慢告別了傳統(tǒng)的手段,改為依靠以智能控制為核心的智能控制技術(shù)。這種技術(shù)使電力系統(tǒng)實(shí)現(xiàn)了從量變到質(zhì)變的本質(zhì)飛躍??刂萍夹g(shù)的智能化強(qiáng)化了電力系統(tǒng)的安全穩(wěn)定性,對復(fù)雜的指令進(jìn)行有條理的處理,增強(qiáng)了電力系統(tǒng)的實(shí)用性和收益性。隨著學(xué)者們對這種技術(shù)的研究,智能控制技術(shù)還擁有著十分廣闊的發(fā)展前景。
5結(jié)語
【關(guān)鍵詞】OpenCV;智能視頻監(jiān)控;目標(biāo)檢測;目標(biāo)跟蹤
1.引言
近年來,隨著我國職業(yè)院校的不斷發(fā)展,校園建筑面積和規(guī)模逐步擴(kuò)大,校園的流動人口大量增加,治安形勢錯綜復(fù)雜,做好校園的安保工作,僅靠簡單的增加人力和物力,采取常規(guī)的防范措施已經(jīng)很難適應(yīng)新形勢的需要。為了加強(qiáng)校園安全防范整體力量,有效保護(hù)校園與學(xué)生的財產(chǎn)安全,利用先進(jìn)的科技手段建立一套功能完善、覆蓋范圍廣泛的監(jiān)控系統(tǒng)是維護(hù)學(xué)生正常學(xué)習(xí)、生活,創(chuàng)造平安校園的必要條件。
智能視頻監(jiān)控是綜合利用圖像處理、機(jī)器視覺和計(jì)算機(jī)視覺知識進(jìn)行研究的一個新興的研究方向和備受關(guān)注的前沿課題。與傳統(tǒng)的模擬監(jiān)控不同,智能監(jiān)控系統(tǒng)能實(shí)時的對攝像機(jī)捕捉到的視頻序列進(jìn)行處理和分析,自動完成動態(tài)目標(biāo)的檢測、識別和跟蹤,并在此基礎(chǔ)上可以進(jìn)一步對目標(biāo)的行為進(jìn)行分析和理解。本文構(gòu)建的校園智能視頻監(jiān)控系統(tǒng)利用OpenCV實(shí)現(xiàn)了對視頻圖像中動態(tài)目標(biāo)的行為快速有效地進(jìn)行監(jiān)控和分析,并實(shí)現(xiàn)了對動態(tài)目標(biāo)的精確跟蹤。
2.OpenCV視覺庫簡介
OpenCV是Intel公司開發(fā)的用于數(shù)字圖像處理和計(jì)算機(jī)視覺的函數(shù)庫[1]。它由一系列C函數(shù)和少量C++類構(gòu)成,實(shí)現(xiàn)了圖像處理和計(jì)算機(jī)視覺方面的很多通用算法。OpenCV其源代碼完全開放,運(yùn)行速度快,由于具有良好的可移植性和統(tǒng)一的結(jié)構(gòu)及其穩(wěn)定性,因此可以縮短系統(tǒng)設(shè)計(jì)的開發(fā)周期,使系統(tǒng)運(yùn)行更加穩(wěn)定。
鑒于OpenCV的特點(diǎn),它主要用于對視頻圖像進(jìn)行一些高級處理,如人臉識別、動態(tài)跟蹤、圖像分割及人機(jī)互動等。
3.校園智能視頻監(jiān)控系統(tǒng)的實(shí)現(xiàn)
3.1 系統(tǒng)工作流程
當(dāng)動態(tài)目標(biāo)出現(xiàn)在可視范圍內(nèi),首先通過背景差分法將前景圖像與背景圖像分離,再對差值進(jìn)行二值化判斷,利用給定的閾值去除噪聲等干擾后,從場景中檢測出動態(tài)目標(biāo)。與之前檢測出的目標(biāo)做特征比對,如果是新目標(biāo)則加入到跟蹤序列中,如果是舊目標(biāo)則舍棄。目標(biāo)跟蹤階段,對跟蹤序列中的目標(biāo)采用CamShift跟蹤算法,提取目標(biāo)特征信息,并獲得其運(yùn)動軌跡,對目標(biāo)進(jìn)行實(shí)時跟蹤。其關(guān)鍵點(diǎn)在于目標(biāo)的特征信息提取和匹配,這是決定目標(biāo)跟蹤效果的重大因素。
3.2 動態(tài)目標(biāo)檢測
動態(tài)目標(biāo)檢測是校園智能視頻監(jiān)控系統(tǒng)的重要組成部分。動態(tài)目標(biāo)檢測的主要目的是從視頻圖像中實(shí)時的提取出動態(tài)目標(biāo)并獲得動態(tài)目標(biāo)的特征信息,如色彩、形狀、輪廓等[2]。動態(tài)目標(biāo)提取的過程就是在連續(xù)的視頻圖像序列中尋找差異,并把由于目標(biāo)運(yùn)動和表現(xiàn)出來的差異提取出來。
動態(tài)目標(biāo)檢測常用的有四種常用方法:連續(xù)幀間差分法、背景差分法、光流法和運(yùn)動能量法[3]。由于背景差分法具有實(shí)現(xiàn)簡單,運(yùn)算速度快,因此最常用。它通過當(dāng)前幀圖像與背景圖像相減并提取出感興趣區(qū)域來檢測動態(tài)目標(biāo),固定場景下應(yīng)用背景差分法進(jìn)行動態(tài)目標(biāo)檢測,關(guān)鍵在于創(chuàng)建和維護(hù)一個可靠的背景。針對這種情況,背景模型應(yīng)運(yùn)而生。評價一個好的背景模型,應(yīng)該從兩個方面進(jìn)行考慮:第一,背景模型對背景變化的響應(yīng)速度要足夠快;第二,背景模型對運(yùn)動目標(biāo)要有較強(qiáng)的抗干擾能力。
3.2.1 提取前景圖像
假設(shè)環(huán)境溫度不變,視頻圖像的背景也不變,當(dāng)動態(tài)目標(biāo)出現(xiàn)時.圖像相應(yīng)像素點(diǎn)的灰度值會發(fā)生明顯的改變,利用圖像減法就可以得到差分灰度圖像[4]。差分灰度圖像包含了動態(tài)目標(biāo)信息,相對于背景圖像又稱之為前景圖像。相減的結(jié)果中每一像素的值和一個預(yù)先設(shè)定的閾值相比較,若這個像素的值大于閾值,則認(rèn)為這點(diǎn)是前景圖像,否則是背景圖像。假設(shè)利用圖像平均法可得到當(dāng)前背景圖像BK(x,y),當(dāng)前的輸入圖像為CK(x,y),則前景圖像DK(x,y)可以表示為當(dāng)前圖像與背景圖像差的絕對值即:DK(x,y)=|CK(x,y)-BK(x,y)|
3.2.2 差分圖像二值化
選取T為閾值,對差分圖像進(jìn)行二值化[5]:
1,DK(x,y)≥T
EK=
0,DK(x,y)
其中,EK為進(jìn)行二值化后的圖像,當(dāng)差分圖像中像素值大于某一給定的閾值T時,則認(rèn)為該像素為前景像素,即認(rèn)為該像素可能為目標(biāo)上的一點(diǎn),反之則認(rèn)為是背景像素。
在OpenCV中,差分圖像的二值化是由函數(shù)void cvTheshold實(shí)現(xiàn)的。
由于背景差分法受外界光線的變化、背景中含有輕微擾動的對象,如樹枝、樹葉的搖動等的影響,因此對前景圖像還要進(jìn)行一系列的圖像處理。包括:平滑處理,形態(tài)學(xué)膨脹、腐蝕,二值化操作,輪廓提取等。但是并不是所有的輪廓都是由目標(biāo)產(chǎn)生的,有些是目標(biāo)的子輪廓或者是噪聲產(chǎn)生的輪廓,因此必須對輪廓進(jìn)行篩選,淘汰偽目標(biāo)的輪廓,把目標(biāo)輪廓篩選出來后加入到跟蹤隊(duì)列。
3.3 動態(tài)目標(biāo)跟蹤
在校園智能視頻監(jiān)控系統(tǒng)中,動態(tài)目標(biāo)跟蹤起著承上啟下的作用,它是利用圖像處理和計(jì)算機(jī)視覺等相關(guān)技術(shù)對視頻圖像序列進(jìn)行處理和分析,在連續(xù)的圖像序列中找到動態(tài)目標(biāo)的位置和相關(guān)信息,比如動態(tài)目標(biāo)的速度、形狀等。為了實(shí)現(xiàn)該功能,本文采用了OpenCV中的CamShift目標(biāo)跟蹤算法。它主要通過視頻圖像中動態(tài)目標(biāo)的顏色信息來達(dá)到跟蹤的目的。
3.3.1 CamShift算法簡介
Gary R.Bradski提出的CamShift算法,是以顏色直方圖為目標(biāo)模式的目標(biāo)跟蹤算法,是對MeanShift算法的改良,可以有效地解決目標(biāo)變形和部分遮擋的問題,而且運(yùn)算效率很高。它的基本思想是將視頻圖像的所有幀做MeanShift運(yùn)算,將上一幀的運(yùn)算信息作為搜索窗口的初始值,并將初始值作為對下一幀圖像運(yùn)算的輸入,進(jìn)行迭代后實(shí)現(xiàn)對動態(tài)目標(biāo)在每一幀圖像序列中的連續(xù)跟蹤。由于RGB顏色空間對光照亮度變化比較敏感,為了減少光照亮度變化對跟蹤效果的影響,CamShift算法將圖像由RGB顏色空間轉(zhuǎn)化到HSV顏色模型,方便對動態(tài)目標(biāo)特征的提取。
3.3.2 CamShift算法實(shí)現(xiàn)
在OpenCV庫中,CvCamShiftTracker類就是用來實(shí)現(xiàn)CamShift算法的,使得進(jìn)行二次開發(fā)變得很簡單[7]。
其中,prob_image為目標(biāo)直方圖的反向投影;Window為初始搜索窗口;criteria為確定窗口搜索停止的準(zhǔn)則;comp為生成的結(jié)果,包含收斂的搜索窗口坐標(biāo)(comprect字段)與窗口內(nèi)部所有像素點(diǎn)的和(comparea字段);box為目標(biāo)的最小矩形。如果非NULL,則包含目標(biāo)的尺寸和方向。
利用該函數(shù),在VC++2010開發(fā)環(huán)境下,就很容易實(shí)現(xiàn)CamShift算法跟蹤動態(tài)目標(biāo)。
4.結(jié)束語
本文設(shè)計(jì)的基于OpenCV的校園智能視頻監(jiān)控系統(tǒng),由于其較低的計(jì)算復(fù)雜度和較高的魯棒性,具有廣闊的應(yīng)用前景。采用了背景差分法作為動態(tài)目標(biāo)檢測的方法。檢測是跟蹤的前提,檢測結(jié)果的精確性直接影響跟蹤的可靠性。利用CamShift跟蹤算法提取每個動態(tài)目標(biāo)的顏色特征信息,實(shí)現(xiàn)對多個動態(tài)目標(biāo)的精確跟蹤,最后將動態(tài)目標(biāo)的輪廓和運(yùn)動軌跡描述出來。
該系統(tǒng)平臺簡單,大大縮短工作人員的開發(fā)周期,只需根據(jù)不同的需要進(jìn)行簡單的改進(jìn),就可以實(shí)現(xiàn)多種場合的不同應(yīng)用。實(shí)驗(yàn)證明,系統(tǒng)運(yùn)行穩(wěn)定,檢測結(jié)果真實(shí)可靠,具有較高的精確度。
參考文獻(xiàn)
[1]Gary Bradski,Adrian Kaehler.學(xué)習(xí)OpenCV[M].北京:清華大學(xué)出版社,2009.
[2]譚歆,武岳.基于OpenCV的運(yùn)動目標(biāo)檢測方法研究與應(yīng)用[J].視頻應(yīng)用與工程,2010,34(S1):184-187.
[3]尹俊超,劉直芳.基于OpenCV的運(yùn)動目標(biāo)檢測與跟蹤[J].計(jì)算機(jī)工程與設(shè)計(jì),2011,32(8):2817-2820.
[4]林洪文,姚作,涂丹,李國輝.基于減背景技術(shù)的運(yùn)動目標(biāo)檢測方法研究[J].國防科技大學(xué)學(xué)報,2003, 25(3):66-69.
[5]侯宏錄,李寧烏,劉迪迪,陳杰.智能視頻監(jiān)控中運(yùn)動目標(biāo)檢測的研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2012,22(2):49-52.
關(guān)鍵詞:數(shù)據(jù)融合傳感器無損檢測精確林業(yè)應(yīng)用
多傳感器融合系統(tǒng)由于具有較高的可靠性和魯棒性,較寬的時間和空間的觀測范圍,較強(qiáng)的數(shù)據(jù)可信度和分辨能力,已廣泛應(yīng)用于軍事、工業(yè)、農(nóng)業(yè)、航天、交通管制、機(jī)器人、海洋監(jiān)視和管理、目標(biāo)跟蹤和慣性導(dǎo)航等領(lǐng)域。筆者在分析數(shù)據(jù)融合技術(shù)概念和內(nèi)容的基礎(chǔ)上,對該技術(shù)在林業(yè)工程中的應(yīng)用及前景進(jìn)行了綜述。
一、數(shù)據(jù)融合
1.1概念的提出
1973年,數(shù)據(jù)融合技術(shù)在美國國防部資助開發(fā)的聲納信號理解系統(tǒng)中得到了最早的體現(xiàn)。
70年代末,在公開的技術(shù)文獻(xiàn)中開始出現(xiàn)基于多系統(tǒng)的信息整合意義的融合技術(shù)。1984年美國國防部數(shù)據(jù)融合小組(DFS)定義數(shù)據(jù)融合為:“對多源的數(shù)據(jù)和信息進(jìn)行多方的關(guān)聯(lián)、相關(guān)和綜合處理,以更好地進(jìn)行定位與估計(jì),并完全能對態(tài)勢及帶來的威脅進(jìn)行實(shí)時評估”。
1998年1月,Buchroithner和Wald重新定義了數(shù)據(jù)融合:“數(shù)據(jù)融合是一種規(guī)范框架,這個框架里人們闡明如何使用特定的手段和工具來整合來自不同渠道的數(shù)據(jù),以獲得實(shí)際需要的信息”。
Wald定義的數(shù)據(jù)融合的概念原理中,強(qiáng)調(diào)以質(zhì)量作為數(shù)據(jù)融合的明確目標(biāo),這正是很多關(guān)于數(shù)據(jù)融合的文獻(xiàn)中忽略但又是非常重要的方面。這里的“質(zhì)量”指經(jīng)過數(shù)據(jù)融合后獲得的信息對用戶而言較融合前具有更高的滿意度,如可改善分類精度,獲得更有效、更相關(guān)的信息,甚至可更好地用于開發(fā)項(xiàng)目的資金、人力資源等。
1.2基本內(nèi)容
信息融合是生物系統(tǒng)所具備的一個基本功能,人類本能地將各感官獲得的信息與先驗(yàn)知識進(jìn)行綜合,對周圍環(huán)境和發(fā)生的事件做出估計(jì)和判斷。當(dāng)運(yùn)用各種現(xiàn)代信息處理方法,通過計(jì)算機(jī)實(shí)現(xiàn)這一功能時,就形成了數(shù)據(jù)融合技術(shù)。
數(shù)據(jù)融合就是充分利用多傳感器資源,通過對這些多傳感器及觀測信息的合理支配和使用,把多傳感器在空間或時間上的冗余或互補(bǔ)信息依據(jù)某些準(zhǔn)則進(jìn)行組合,以獲得被測對象的一致性解釋或描述。數(shù)據(jù)融合的內(nèi)容主要包括:
(1)數(shù)據(jù)關(guān)聯(lián)。確定來自多傳感器的數(shù)據(jù)反映的是否是同源目標(biāo)。
(2)多傳感器ID/軌跡估計(jì)。假設(shè)多傳感器的報告反映的是同源目標(biāo),對這些數(shù)據(jù)進(jìn)行綜合,改進(jìn)對該目標(biāo)的估計(jì),或?qū)φ麄€當(dāng)前或未來情況的估計(jì)。
(3)采集管理。給定傳感器環(huán)境的一種認(rèn)識狀態(tài),通過分配多個信息捕獲和處理源,最大限度地發(fā)揮其性能,從而使其操作成本降到最低。傳感器的數(shù)據(jù)融合功能主要包括多傳感器的目標(biāo)探測、數(shù)據(jù)關(guān)聯(lián)、跟蹤與識別、情況評估和預(yù)測。
根據(jù)融合系統(tǒng)所處理的信息層次,目前常將信息融合系統(tǒng)劃分為3個層次:
(l)數(shù)據(jù)層融合。直接將各傳感器的原始數(shù)據(jù)進(jìn)行關(guān)聯(lián)后,送入融合中心,完成對被測對象的綜合評價。其優(yōu)點(diǎn)是保持了盡可能多的原始信號信息,但是該種融合處理的信息量大、速度慢、實(shí)時性差,通常只用于數(shù)據(jù)之間配準(zhǔn)精度較高的圖像處理。
(2)特征層融合。從原始數(shù)據(jù)中提取特征,進(jìn)行數(shù)據(jù)關(guān)聯(lián)和歸一化等處理后,送入融合中心進(jìn)行分析與綜合,完成對被測對象的綜合評價。這種融合既保留了足夠數(shù)量的原始信息,又實(shí)現(xiàn)了一定的數(shù)據(jù)壓縮,有利于實(shí)時處理,而且由于在特征提取方面有許多成果可以借鑒,所以特征層融合是目前應(yīng)用較多的一種技術(shù)。但是該技術(shù)在復(fù)雜環(huán)境中的穩(wěn)健性和系統(tǒng)的容錯性與可靠性有待進(jìn)一步改善。
(3)決策層融合。首先每一傳感器分別獨(dú)立地完成特征提取和決策等任務(wù),然后進(jìn)行關(guān)聯(lián),再送入融合中心處理。這種方法的實(shí)質(zhì)是根據(jù)一定的準(zhǔn)則和每個決策的可信度做出最優(yōu)的決策。其優(yōu)點(diǎn)是數(shù)據(jù)通訊量小、實(shí)時性好,可以處理非同步信息,能有效地融合不同類型的信息。而且在一個或幾個傳感器失效時,系統(tǒng)仍能繼續(xù)工作,具有良好的容錯性,系統(tǒng)可靠性高,因此是目前信息融合研究的一個熱點(diǎn)。但是這種技術(shù)也有不足,如原始信息的損失、被測對象的時變特征、先驗(yàn)知識的獲取困難,以及知識庫的巨量特性等。
1.3處理模型
美國數(shù)據(jù)融合工作小組提出的數(shù)據(jù)融合處理模型,當(dāng)時僅應(yīng)用于軍事方面,但該模型對人們理解數(shù)據(jù)融合的基本概念有重要意義。模型每個模塊的基本功能如下:
數(shù)據(jù)源。包括傳感器及其相關(guān)數(shù)據(jù)(數(shù)據(jù)庫和人的先驗(yàn)知識等)。
源數(shù)據(jù)預(yù)處理。進(jìn)行數(shù)據(jù)的預(yù)篩選和數(shù)據(jù)分配,以減輕融合中心的計(jì)算負(fù)擔(dān),有時需要為融合中心提供最重要的數(shù)據(jù)。目標(biāo)評估。融合目標(biāo)的位置、速度、身份等參數(shù),以達(dá)到對這些參數(shù)的精確表達(dá)。主要包括數(shù)據(jù)配準(zhǔn)、跟蹤和數(shù)據(jù)關(guān)聯(lián)、辨識。
態(tài)勢評估。根據(jù)當(dāng)前的環(huán)境推斷出檢測目標(biāo)與事件之間的關(guān)系,以判斷檢測目標(biāo)的意圖。威脅評估。結(jié)合當(dāng)前的態(tài)勢判斷對方的威脅程度和敵我雙方的攻擊能力等,這一過程應(yīng)同時考慮當(dāng)前的政治環(huán)境和對敵策略等因素,所以較為困難。
處理過程評估。監(jiān)視系統(tǒng)的性能,辨識改善性能所需的數(shù)據(jù),進(jìn)行傳感器資源的合理配置。人機(jī)接口。提供人與計(jì)算機(jī)間的交互功能,如人工操作員的指導(dǎo)和評價、多媒體功能等。
二、多傳感器在林業(yè)中的應(yīng)用
2.1在森林防火中的應(yīng)用
在用MODIS(ModerateResolutionImagingSpectroradiometer)數(shù)據(jù)測定森林火點(diǎn)時的20、22、23波段的傳感器輻射值已達(dá)飽和狀態(tài),用一般圖像增強(qiáng)處理方法探測燃燒區(qū)火點(diǎn)的結(jié)果不理想。余啟剛運(yùn)用數(shù)據(jù)融合技術(shù),在空間分辨率為1000m的熱輻射通道的數(shù)據(jù)外加入空間分辨率為250m的可見光通道的數(shù)據(jù),較好地進(jìn)行了不同空間分辨率信息的數(shù)據(jù)融合,大大提高了對火點(diǎn)位置的判斷準(zhǔn)確度。為進(jìn)一步提高衛(wèi)星光譜圖像數(shù)據(jù)分析的準(zhǔn)確性與可靠性,利用原有森林防火用的林區(qū)紅外探測器網(wǎng),將其與衛(wèi)星光譜圖像數(shù)據(jù)融合,可以使計(jì)算機(jī)獲得GPS接收機(jī)輸出的有關(guān)信息通過與RS實(shí)現(xiàn)高效互補(bǔ)性融合,從而彌補(bǔ)衛(wèi)星圖譜不理想的缺失區(qū)數(shù)據(jù)信息,大大提高燃燒區(qū)火點(diǎn)信息準(zhǔn)確度和敏感性。
2.2森林蓄積特征的估計(jì)
HampusHolmstrom等在瑞典南部的試驗(yàn)區(qū)將SPOT-4×S衛(wèi)星數(shù)據(jù)和CARABAS-IIVHFSAR傳感器的雷達(dá)數(shù)據(jù)進(jìn)行了融合,采用KNN(knearestneighbor)方法對森林的蓄積特征(林分蓄積、樹種組成與年齡)進(jìn)行了估計(jì)。
KNN方法就是采用目標(biāo)樣地鄰近k個(k=10)最近樣地的加權(quán)來估計(jì)目標(biāo)樣地的森林特征。研究者應(yīng)用衛(wèi)星光譜數(shù)據(jù)、雷達(dá)數(shù)據(jù)融合技術(shù)對試驗(yàn)區(qū)的不同林分的蓄積特征進(jìn)行估計(jì),并對三種不同的數(shù)據(jù)方法進(jìn)行誤差分析。試驗(yàn)表明,融合后的數(shù)據(jù)作出的估計(jì)比單一的衛(wèi)星數(shù)據(jù)或雷達(dá)數(shù)據(jù)的精度高且穩(wěn)定性好。
2.3用非垂直航空攝像數(shù)據(jù)融合GIS信息更新調(diào)查數(shù)據(jù)
森林資源調(diào)查是掌握森林資源現(xiàn)狀與變化的調(diào)查方法,一般以地面調(diào)查的方法為主,我國5年復(fù)查一次。由于森林資源調(diào)查的工作量巨大,且要花費(fèi)大量的人力、物力和資金。國內(nèi)外許多學(xué)者都在探索航空、航天的遙感調(diào)查與估計(jì)方法。
TrevorJDavis等2002年提出采用非垂直的航空攝影數(shù)據(jù)融合對應(yīng)的GIS數(shù)據(jù)信息實(shí)現(xiàn)森林調(diào)查數(shù)據(jù)的快速更新,認(rèn)為對森林資源整體而言,僅某些特殊地區(qū)的資源數(shù)據(jù)需要更新。在直升飛機(jī)側(cè)面裝上可視的數(shù)字?jǐn)z像裝置,利用GPS對測點(diǎn)進(jìn)行定位,對特殊地區(qū)的攝像進(jìn)行拍攝,同時與對應(yīng)的GIS數(shù)據(jù)進(jìn)行融合,做出資源變化的估計(jì)或影像的修正。
試驗(yàn)表明,融合后的數(shù)據(jù)可以同高分辨率矯正圖像相比,該方法花費(fèi)少,精度高,能充分利用影像的可視性,應(yīng)用于偏遠(yuǎn)、地形復(fù)雜、不易操作、成本高的區(qū)域,同時可避免遙感圖像受云層遮蓋。
三、數(shù)據(jù)融合在林業(yè)中的應(yīng)用展望
3.1在木材檢測中的應(yīng)用
3.1.1木材缺陷及其影響
木材是天然生長的有機(jī)體,生長過程中不可避免地有尖削度、彎曲度、節(jié)子等生長缺陷,這些缺陷極大地影響了木材及其制品的優(yōu)良特性,以及木材的使用率、強(qiáng)度、外觀質(zhì)量,并限制了其應(yīng)用領(lǐng)域。在傳統(tǒng)木制品生產(chǎn)過程中,主要依靠人的肉眼來識別木材缺陷,而木材板材表面缺陷在大小、形狀和色澤上都有較大的差異,且受木材紋理的影響,識別起來非常困難,勞動強(qiáng)度大,效率低,同時由于熟練程度、標(biāo)準(zhǔn)掌握等人為因素,可能造成較大的誤差。另外在集成材加工中,板材缺陷的非雙面識別嚴(yán)重影響了生產(chǎn)線的生產(chǎn)節(jié)拍。因此必須開發(fā)一種能夠?qū)Π宀碾p面缺陷進(jìn)行在線識別和自動剔除技術(shù),以解決集成材加工中節(jié)子人工識別誤差大、難以實(shí)現(xiàn)雙面識別、剔除機(jī)械調(diào)整時間長等問題。
3.1.2單一傳感器在木材檢測中的應(yīng)用
對木材及人造板進(jìn)行無損檢測的方法很多,如超聲波、微波、射線、機(jī)械應(yīng)力、震動、沖擊應(yīng)力波、快速傅立葉變換分析等檢測方法。超聲技術(shù)在木材工業(yè)中的應(yīng)用研究主要集中在研究聲波與木材種類、木材結(jié)構(gòu)和性能之間的關(guān)系、木材結(jié)構(gòu)及缺陷分析、膠的固化過程分析等。
隨著計(jì)算機(jī)視覺技術(shù)的發(fā)展,人們也將視覺傳感器應(yīng)用于木材檢測中。新西蘭科學(xué)家用視頻傳感器研究和測量了紙漿中的纖維橫切面的寬度、厚度、壁面積、壁厚度、腔比率、壁比率等,同時準(zhǔn)確地測量單個纖維和全部纖維的幾何尺寸及其變化趨勢,能夠區(qū)分不同紙漿類型,測定木材纖維材料加固結(jié)合力,并動態(tài)地觀察木材纖維在材料中的結(jié)合機(jī)理。
新西蘭的基于視覺傳感器的板材缺陷識別的軟件已經(jīng)產(chǎn)業(yè)化,該軟件利用數(shù)碼相機(jī)或激光掃描儀采集板材的圖像,自動識別板材節(jié)子和缺陷的位置,控制板材的加工。該軟件還具有進(jìn)行原木三維模型真實(shí)再現(xiàn)的計(jì)算機(jī)視覺識別功能,利用激光掃描儀自動采集原木的三維幾何數(shù)據(jù)。
美國林產(chǎn)品實(shí)驗(yàn)室利用計(jì)算機(jī)視覺技術(shù)對木材刨花的尺寸大小進(jìn)行分級,確定各種刨花在板中的比例和刨花的排列方向;日本京都大學(xué)基于視覺傳感器進(jìn)行了定向刨花板內(nèi)刨花定向程度的檢測,從而可以通過調(diào)整定向鋪裝設(shè)備優(yōu)化刨花的排列方向來提高定向刨花板的強(qiáng)度。
在制材加工過程中,利用計(jì)算機(jī)視覺技術(shù)在線實(shí)時檢測原木的形狀及尺寸,選擇最佳下鋸方法,提高原木的出材率。同時可對鋸材的質(zhì)量進(jìn)行分級,實(shí)現(xiàn)木材的優(yōu)化使用;在膠合板的生產(chǎn)過程中,利用計(jì)算機(jī)視覺技術(shù)在線實(shí)時檢測單板上的各種缺陷,實(shí)現(xiàn)單板的智能和自動剪切,并可測量在剪切過程中的單板破損率,對單板進(jìn)行分等分級,實(shí)現(xiàn)自動化生產(chǎn)過程。Wengert等在綜合了大量的板材分類經(jīng)驗(yàn)的基礎(chǔ)上,建立了板材分級分類的計(jì)算機(jī)視覺專家系統(tǒng)。在國內(nèi)這方面的研究較少,王金滿等用計(jì)算機(jī)視覺技術(shù)對刨花板施膠效果進(jìn)行了定量分析。
X射線對木材及木質(zhì)復(fù)合材料的性能檢測已得到了廣泛的應(yīng)用,目前該技術(shù)主要應(yīng)用于對木材密度、含水率、纖維素相對結(jié)晶度和結(jié)晶區(qū)大小、纖維的化學(xué)結(jié)構(gòu)和性質(zhì)等進(jìn)行檢測,并對木材內(nèi)部的各種缺陷進(jìn)行檢測。
3.1.3數(shù)據(jù)融合在木材檢測中的應(yīng)用展望
單一傳感器在木材工業(yè)中已得到了一定程度的應(yīng)用,但各種單項(xiàng)技術(shù)在應(yīng)用上存在一定的局限性。如視覺傳感器不能檢測到有些與木材具有相同顏色的節(jié)子,有時會把木板上的臟物或油脂當(dāng)成節(jié)子,造成誤判,有時也會受到木材的種類或粗糙度和濕度的影響,此外,這種技術(shù)只能檢測部分表面缺陷,而無法檢測到內(nèi)部缺陷;超聲、微波、核磁共振和X射線技術(shù)均能測量密度及內(nèi)部特征,但是它們不能測定木材的顏色和瑕疵,因?yàn)檫@些缺陷的密度往往同木板相同。因此,一個理想的檢測系統(tǒng)應(yīng)該集成各種傳感技術(shù),才能準(zhǔn)確、可靠地檢測到木材的缺陷。
基于多傳感器(機(jī)器視覺及X射線等)數(shù)據(jù)融合技術(shù)的木材及木制品表面缺陷檢測,可以集成多個傳統(tǒng)單項(xiàng)技術(shù),更可靠、準(zhǔn)確地實(shí)時檢測出木材表面的各種缺陷,為實(shí)現(xiàn)木材分級自動化、智能化奠定基礎(chǔ),同時為集裁除鋸、自動調(diào)整、自動裁除節(jié)子等為一身的新型視頻識別集成材雙面節(jié)子數(shù)控自動剔除成套設(shè)備提供技術(shù)支持。
3.2在精確林業(yè)中的應(yīng)用
美國華盛頓大學(xué)研究人員開展了樹形自動分析、林業(yè)作業(yè)規(guī)劃等研究工作;Auburn大學(xué)的生物系統(tǒng)工程系和USDA南方林業(yè)實(shí)驗(yàn)站與有關(guān)公司合作開展用GPS和其他傳感器研究林業(yè)機(jī)器系統(tǒng)的性能和生產(chǎn)效率。
目前單項(xiàng)的GPS、RS、GIS正從“自動化孤島”形式應(yīng)用于林業(yè)生產(chǎn)向集成技術(shù)轉(zhuǎn)變。林業(yè)生產(chǎn)系統(tǒng)作為一個多組分的復(fù)雜系統(tǒng),是由能量流動、物質(zhì)循環(huán)、信息流動所推動的具有一定的結(jié)構(gòu)和功能的復(fù)合體,各組分間的關(guān)系和結(jié)合方式影響系統(tǒng)整體的結(jié)構(gòu)和功能。因此應(yīng)該在計(jì)算機(jī)集成系統(tǒng)框架下,有效地融合GPS、GIS、RS等數(shù)據(jù),解決這些信息在空間和時間上的質(zhì)的差異及空間數(shù)據(jù)類型的多樣性,如地理統(tǒng)計(jì)數(shù)據(jù)、柵格數(shù)據(jù)、點(diǎn)數(shù)據(jù)等。利用智能DSS(決策支持系統(tǒng))以及VRT(可變量技術(shù))等,使林業(yè)生產(chǎn)成為一個高效、柔性和開放的體系,從而實(shí)現(xiàn)林業(yè)生產(chǎn)的標(biāo)準(zhǔn)化、規(guī)范化、開放性,建立基于信息流融合的精確林業(yè)系統(tǒng)。
南京林業(yè)大學(xué)提出了“精確林業(yè)工程系統(tǒng)”。研究包括精確林業(yè)工程系統(tǒng)的領(lǐng)域體系結(jié)構(gòu)、隨時空變化的數(shù)據(jù)采集處理與融合技術(shù)、精確控制林業(yè)生產(chǎn)的智能決策支持系統(tǒng)、可變量控制技術(shù)等,實(shí)現(xiàn)基于自然界生物及其所賴以生存的環(huán)境資源的時空變異性的客觀現(xiàn)實(shí),以最小資源投入、最小環(huán)境危害和最大產(chǎn)出效益為目標(biāo),建立關(guān)于林業(yè)管理系統(tǒng)戰(zhàn)略思想的精確林業(yè)微觀管理系統(tǒng)。
[參考文獻(xiàn)]
摘要:計(jì)算機(jī);DSP;智能視頻系統(tǒng)
中圖分類號:TP277文獻(xiàn)標(biāo)識碼:A文章編號:1007-9599 (2011) 20-0000-01
Intelligent Video Systems Analysis and Research on Computer and DSP
Cheng Zhi
(School of Physics and Engineering,Qufu Normal University,Qufu273165,China)
Abstract:In recent years,as computer performance and DSP chip performance continues to improve,there has been intelligent video of this emerging technology,its applications have greatly expanded control over the people for the site conditions,and to make video surveillance more accurate and timely,has become new direction for the future development of the video.Based on computer vision technology and DSP technology,made two kinds of computer-based intelligent video systems and DSP implementations,while their software has done a more detailed description.In computer-based system due to the use of the OpenCV vision library to make the video more rapid development:DSP is used in TI's recently launched TMS320DM6446,its unique design allows faster image processing,real-time fully meet the needs of the scene.
Abstract:Computer;DSP;Intelligent video systems
智能視頻技術(shù)主要是指“自動的分析和抽取視頻源中的關(guān)鍵信息”。如果把攝像機(jī)看作人的眼睛,那智能視頻系統(tǒng)或設(shè)備就可以看作是人的大腦。借助計(jì)算機(jī)或是專用的數(shù)字處理芯片DSP強(qiáng)大的數(shù)據(jù)處理功能,能對視頻畫面中的海量數(shù)據(jù)進(jìn)行高速分析,過濾掉用戶不關(guān)心的信息,只為監(jiān)控者提供有用的關(guān)鍵信息:。近兒年,隨著計(jì)算機(jī)性能的不斷提高及高性能DSP芯片的出現(xiàn),利用其對視頻信息進(jìn)行分析,從而使視頻監(jiān)控系統(tǒng)在數(shù)字化基礎(chǔ)上真正實(shí)現(xiàn)了智能化。
本文研究了兩種不同系統(tǒng),分別基于計(jì)算機(jī)和DSP?;谟?jì)算機(jī)的視頻系統(tǒng)借助于計(jì)算機(jī)的巨大的處理功能,集合各種函數(shù)庫,特別是OpenCV的應(yīng)用,能幫助監(jiān)控者快速準(zhǔn)
確地對圖像做出相關(guān)處理?;贒SP的視頻系統(tǒng),通過對軟硬件的開發(fā)與設(shè)計(jì)完成數(shù)字化視頻處理,與前一系統(tǒng)相比靈活性,實(shí)時性增加并且功能能進(jìn)行更多的擴(kuò)展,在實(shí)際中得到更為廣泛的應(yīng)用。
一、基于計(jì)算機(jī)視覺技術(shù)的視頻系統(tǒng)
其基本系統(tǒng)構(gòu)成是微型計(jì)算機(jī)和前端圖像獲取,圖像獲取包括必要的圖像采集單元和圖像存儲單元。通過圖像采集單元采集來的圖像被存儲在圖像存儲單元,借助于網(wǎng)絡(luò),實(shí)現(xiàn)計(jì)算機(jī)與存儲單元的通信,圖像從存儲單元進(jìn)入計(jì)算機(jī),在計(jì)算機(jī)中對圖像進(jìn)行相關(guān)處理完成日標(biāo)的檢測。系統(tǒng)需根據(jù)實(shí)際的需要選擇好相關(guān)的視頻采集跟存儲單元硬件,如在實(shí)驗(yàn)室條件下完成簡單的視頻開發(fā)可以采用普通的攝像頭作為圖像前端獲取,圖像存儲單元在只對一幀圖像做處理時也可省略,這樣一個攝像頭一臺計(jì)算機(jī)就可以實(shí)現(xiàn)最簡單的視頻系統(tǒng)的搭建。在軟件設(shè)計(jì)方面可以直接利用計(jì)算機(jī)開源的視覺代碼庫OpenCV來實(shí)現(xiàn),其在圖像處理方面提供了大量的庫函數(shù)以供選擇,與DSP的視頻系統(tǒng)相比編程更加簡單,功能更易實(shí)現(xiàn),且開發(fā)的速度快,價格便宜,非常適合研究初期的應(yīng)用。但系統(tǒng)有其自身的局限性,由于只能在計(jì)算機(jī)上實(shí)現(xiàn)圖像的相關(guān)處理,可移植性差,系統(tǒng)的靈活性大大降低,并且處理速度慢,不適合大數(shù)據(jù)量復(fù)雜場景的現(xiàn)場檢測。但對于夜間巡檢等場合由于背景簡單,需要處理的數(shù)據(jù)量少,采用本系統(tǒng)在降低成本的同時保證了檢測的準(zhǔn)確性,有一定的可選度,但總體來說應(yīng)用面比較窄,局限性比較大,前景應(yīng)用不及基于DSP的視頻系統(tǒng)。
二、基于DSP的視頻系統(tǒng)
基于DSP的智能視頻系統(tǒng),體積小安裝靈活,易形成大批量的獨(dú)立產(chǎn)品且在上位機(jī)利用計(jì)算機(jī)能為用戶提供友好的人機(jī)界面,近兒年來得到業(yè)界廣泛重視。本中介紹的基于DSP的視頻系統(tǒng)選用的芯片是達(dá)芬奇視頻處理芯片TMS320DM6446,與其他6000系列芯片相比由于具有雙核處理器,處理速度更快,并且系統(tǒng)的設(shè)計(jì)充分發(fā)揮了達(dá)芬奇高集成度硬件、音視頻軟件算法優(yōu)勢,使視頻數(shù)字化,監(jiān)控網(wǎng)絡(luò)化,系統(tǒng)集成化,管理智能化,具有體積小、布線簡單、成本低、不占用主機(jī)資源等特點(diǎn),雖然在協(xié)調(diào)雙核工作時與其他芯片相比存在一定的困難,但是其強(qiáng)大的功能使行業(yè)內(nèi)對其開發(fā)逐漸升溫。
基于DSP的視頻系統(tǒng)主要由上位機(jī)人機(jī)交互界面,下位機(jī)DSP實(shí)現(xiàn)兩部分組成。
1.上位機(jī)的實(shí)現(xiàn)。主要是指在計(jì)算機(jī)中實(shí)現(xiàn)可視化的界面,使交互更加便于操作。
2.下位機(jī)的實(shí)現(xiàn).下位機(jī)使用的主要處理芯片是TMS320DM6446,具體包括視頻解碼、圖像數(shù)據(jù)存儲、圖像數(shù)據(jù)處理等兒個部分組成。視頻信息通過攝像頭進(jìn)入到視頻系統(tǒng),在丁VP5I46PFP的作用下有模擬信號變?yōu)閅CBCr模式的數(shù)字信號,進(jìn)入DSP6446中進(jìn)行相關(guān)算法處理。同時,在片選信號的控制下,把需要進(jìn)行存儲的圖像數(shù)據(jù)通過數(shù)據(jù)線送入圖像存儲器DDR2 SDRAM中進(jìn)行存儲。經(jīng)由DSP6446處理完成的視頻數(shù)據(jù)則通過其視頻輸出端口輸出到視頻輸出設(shè)備。
參考文獻(xiàn):
[1]黎洪松.全子一圖像矢量量化頻率敏感自組織神經(jīng)網(wǎng)絡(luò)算法[J].通信學(xué)報,1995,16(3):59-64