前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計(jì)算機(jī)視覺(jué)的優(yōu)點(diǎn)主題范文,僅供參考,歡迎閱讀并收藏。
關(guān)鍵詞:計(jì)算機(jī)視覺(jué)技術(shù);食品工業(yè);分級(jí);圖像處理
中圖分類號(hào): TS207 文獻(xiàn)標(biāo)識(shí)碼:A
隨著微型個(gè)人計(jì)算機(jī)應(yīng)用的越來(lái)越廣泛,以及計(jì)算機(jī)在綜合學(xué)科中應(yīng)用的深入研究,現(xiàn)如今在工農(nóng)業(yè)、軍事國(guó)防、醫(yī)學(xué)衛(wèi)生等眾多領(lǐng)域的使用和研究方面計(jì)算機(jī)視覺(jué)技術(shù)都起到了至關(guān)重要的作用,為了節(jié)省人力、降低成本、減少誤差,該項(xiàng)技術(shù)在食品企業(yè)、科研院所、檢測(cè)機(jī)構(gòu)中的應(yīng)用更加普遍。如今,在農(nóng)產(chǎn)品藥物殘留檢測(cè)、水果重量分級(jí)、等級(jí)篩選、質(zhì)量監(jiān)管等方面計(jì)算機(jī)視覺(jué)技術(shù)有眾多應(yīng)用。
1 計(jì)算機(jī)視覺(jué)技術(shù)概述
計(jì)算機(jī)視覺(jué)技術(shù)是利用計(jì)算機(jī)、攝像機(jī)、圖像卡以及相關(guān)處理技術(shù)來(lái)模擬人的視覺(jué),用以識(shí)別、感知和認(rèn)識(shí)我們生活的世界[1]。該技術(shù)是模擬識(shí)別人工智能、心理物理學(xué)、圖像處理、計(jì)算機(jī)科學(xué)及神經(jīng)生物學(xué)等多領(lǐng)域的綜合學(xué)科。計(jì)算機(jī)視覺(jué)技術(shù)用攝像機(jī)模擬人眼,用計(jì)算機(jī)模擬大腦,用計(jì)算機(jī)程序和算法來(lái)模擬人對(duì)事物的認(rèn)識(shí)和思考,替代人類完成程序?yàn)槠湓O(shè)定的工作。該技術(shù)由多個(gè)相關(guān)的圖像處理系統(tǒng)組成,主要包括光源提供系統(tǒng)、圖像提取系統(tǒng)、計(jì)算機(jī)數(shù)據(jù)運(yùn)算系統(tǒng)等。原理是:首先通過(guò)攝像機(jī)獲得所需要的圖像信息,然后利用信號(hào)轉(zhuǎn)換將獲得的圖像信息轉(zhuǎn)變?yōu)閿?shù)字圖像以便計(jì)算機(jī)正確識(shí)別[2]。隨著科學(xué)技術(shù)的發(fā)展,計(jì)算機(jī)技術(shù)在各個(gè)領(lǐng)域得到廣泛應(yīng)用,計(jì)算機(jī)視覺(jué)技術(shù)不僅在代替人類視覺(jué)上取得了重大成就,而且在很多具體工作方便超越了人的視覺(jué)功能。計(jì)算機(jī)視覺(jué)計(jì)算有如此快速的發(fā)展,是因?yàn)榕c人類的視覺(jué)相比該技術(shù)具有以下顯著優(yōu)勢(shì)[3]。
1.1 自動(dòng)化程度高
計(jì)算機(jī)視覺(jué)可以實(shí)現(xiàn)對(duì)農(nóng)產(chǎn)品的多個(gè)外形和內(nèi)在品質(zhì)指標(biāo)進(jìn)行同時(shí)檢測(cè)分析,可以進(jìn)行整體識(shí)別、增強(qiáng)對(duì)目標(biāo)識(shí)別的準(zhǔn)確性。
1.2 實(shí)現(xiàn)無(wú)損檢測(cè)
由于計(jì)算機(jī)視覺(jué)技術(shù)對(duì)農(nóng)產(chǎn)品的識(shí)別是通過(guò)掃描、攝像,而不需要直接接觸,可以減少對(duì)所檢測(cè)食品的傷害。
1.3 穩(wěn)定的檢測(cè)精度
設(shè)計(jì)的運(yùn)行程序確定后,計(jì)算機(jī)視覺(jué)技術(shù)的識(shí)別功能就會(huì)具有統(tǒng)一的識(shí)別標(biāo)準(zhǔn),具有穩(wěn)定的檢測(cè)精度,避免了人工識(shí)別和檢測(cè)時(shí)主觀因素所造成的差異。
2 計(jì)算機(jī)視覺(jué)技術(shù)在食品檢測(cè)中的應(yīng)用
20世紀(jì)70年代初,學(xué)者開(kāi)始研究計(jì)算機(jī)視覺(jué)技術(shù)在食品工業(yè)中的應(yīng)用,近幾十年電子技術(shù)得到快速發(fā)展,計(jì)算機(jī)視覺(jué)技術(shù)也越來(lái)越成熟。國(guó)內(nèi)外學(xué)者在研究計(jì)算機(jī)視覺(jué)技術(shù)在食品工業(yè)中的應(yīng)用方面主要集中在該技術(shù)對(duì)果蔬的外部形態(tài)(如形狀、重量、外觀損傷、色澤等)的識(shí)別、內(nèi)部無(wú)損檢測(cè)等方面。國(guó)內(nèi)有關(guān)計(jì)算機(jī)視覺(jué)技術(shù)在食品業(yè)中的應(yīng)用研究起始于90年代,比國(guó)外發(fā)達(dá)國(guó)家晚多達(dá)20a,但是發(fā)展很快。
2.1 計(jì)算機(jī)視覺(jué)技術(shù)在果蔬分級(jí)中的應(yīng)用研究
計(jì)算機(jī)視覺(jué)技術(shù)在食品檢測(cè)中的應(yīng)用研究相當(dāng)廣泛,從外部直徑、成熟度的檢測(cè)到內(nèi)部腐爛程度的檢測(cè)都有研究。韓偉等[4]采用分割水果的拍攝圖像和新的計(jì)算機(jī)算法計(jì)算水果的半徑,進(jìn)而得出果蔬的最大直徑。研究表明,該算法不僅降低了計(jì)算量而且提高了計(jì)算精度,此方法用于水果分級(jí)的誤差不超過(guò)2mm,高于國(guó)際水果分級(jí)標(biāo)準(zhǔn)所規(guī)定的5mm分類標(biāo)準(zhǔn)差,可在工業(yè)生產(chǎn)中很好應(yīng)用。李慶中[5]也利用圖像的缺陷分割算法研究了計(jì)算機(jī)視覺(jué)技術(shù)在蘋果檢測(cè)與分級(jí)中的應(yīng)用,結(jié)果表明此算法能快速、有效地分割出蘋果的表面缺陷。孫洪勝等[6]以蘋果色澤特征比率的變化規(guī)律為理論基礎(chǔ),結(jié)合模糊聚類知識(shí)利用計(jì)算機(jī)視覺(jué)技術(shù)來(lái)檢測(cè)蘋果缺陷域,檢測(cè)不僅快速而且結(jié)果精確。劉禾等[7]通過(guò)研究認(rèn)為蘋果的表面缺陷可以利用計(jì)算機(jī)視覺(jué)技術(shù)進(jìn)行檢測(cè),計(jì)算機(jī)視覺(jué)技術(shù)還可以將蘋果按照檢測(cè)結(jié)果進(jìn)行分級(jí),把檢測(cè)過(guò)的蘋果分成裂果、刺傷果、碰傷果和蟲傷果等類別。梨的果梗是否存在是梨類分級(jí)的重要特征之一,應(yīng)義斌等[8]通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)、圖像處理技術(shù)、傅立葉描述子的方法來(lái)描述和識(shí)別果形以及有無(wú)果柄,其識(shí)別率達(dá)到90%。楊秀坤等[9]綜合運(yùn)用計(jì)算機(jī)視覺(jué)技術(shù)、遺傳算法、多層前饋神經(jīng)網(wǎng)絡(luò)系統(tǒng),實(shí)現(xiàn)了具有精確度高、靈活性強(qiáng)和速度快等優(yōu)點(diǎn)的蘋果成熟度自動(dòng)判別。陳育彥等[10]采用半導(dǎo)體激光技術(shù)、計(jì)算機(jī)視覺(jué)技術(shù)和圖像分析技術(shù)相結(jié)合的方法檢測(cè)蘋果表面的機(jī)械損傷和果實(shí)內(nèi)部的腐爛情況,初步驗(yàn)證了計(jì)算機(jī)視覺(jué)技術(shù)檢測(cè)蘋果表面的損傷和內(nèi)部腐爛是可行的。馮斌等[11]通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)對(duì)水果圖像的邊緣進(jìn)行檢測(cè),然后確定水果的大小用以水果分級(jí)。試驗(yàn)表明,該方法比傳統(tǒng)的檢測(cè)方法速度快、準(zhǔn)確率高,適用于計(jì)算機(jī)視覺(jué)的實(shí)時(shí)檢測(cè)。朱偉[12]在模糊顏色的基礎(chǔ)上,分析西紅柿損傷部分和完好部分模糊顏色的差別,用分割方法對(duì)西紅柿的缺陷進(jìn)行分割,結(jié)果顯示準(zhǔn)確率高達(dá)96%。曹樂(lè)平等[13]人研究了溫州蜜柑的果皮顏色與果實(shí)可滴定酸含量以及糖分含量之間的相關(guān)性,然而根據(jù)相關(guān)性,樣品檢測(cè)的正確識(shí)別率分別只有約74%和67%。劉剛等[14]從垂直和水平兩個(gè)方向獲取蘋果的圖像,并通過(guò)計(jì)算機(jī)自動(dòng)分析圖像數(shù)據(jù),對(duì)蘋果的外徑、體積、以及圓形度等參數(shù)進(jìn)行處理,與人工檢測(cè)相比,計(jì)算機(jī)視覺(jué)技術(shù)具有檢測(cè)效率高,檢測(cè)標(biāo)準(zhǔn)統(tǒng)一性好等優(yōu)點(diǎn)。Blasco. J [15]通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)分析柑橘果皮的缺陷,進(jìn)而對(duì)其在線分級(jí),正確率約為95%。趙廣華等[16]人綜合計(jì)算機(jī)視覺(jué)識(shí)別系統(tǒng)、輸送轉(zhuǎn)換系統(tǒng)、輸送翻轉(zhuǎn)系統(tǒng)、差速勻果系統(tǒng)和分選系統(tǒng),研制出一款適于實(shí)時(shí)監(jiān)測(cè)、品質(zhì)動(dòng)態(tài)的智能分級(jí)系統(tǒng),能夠很好地實(shí)現(xiàn)蘋果分級(jí)。王江楓等[17]建立了芒果重量與攝影圖像的相互關(guān)系,應(yīng)用計(jì)算機(jī)視覺(jué)技術(shù)檢測(cè)桂香芒果和紫花芒果的重量和果面損傷,按重量分級(jí)其準(zhǔn)確率均為92%,按果面損傷分級(jí)的準(zhǔn)確率分別為76%和80%。
2.2 計(jì)算機(jī)視覺(jué)技術(shù)在禽蛋檢測(cè)中的應(yīng)用研究
禽蛋企業(yè)在生產(chǎn)過(guò)程中,產(chǎn)品的分級(jí)、品質(zhì)檢測(cè)主要采用人工方法,不僅需要大量的物力人力,而且存在勞動(dòng)強(qiáng)度大、人為誤差大、工作效率低等缺點(diǎn),計(jì)算機(jī)視覺(jué)技術(shù)可以很好的解決這類產(chǎn)品工業(yè)生產(chǎn)中存在的困擾。歐陽(yáng)靜怡等[18]利用計(jì)算機(jī)視覺(jué)技術(shù)來(lái)檢測(cè)雞蛋蛋殼裂紋,利用攝像機(jī)獲取雞蛋圖像后,采用fisher、同態(tài)濾波和BET算法等優(yōu)化后的圖像處理技術(shù),獲得裂紋形狀并判斷,試驗(yàn)結(jié)果表明,計(jì)算機(jī)視覺(jué)技術(shù)對(duì)雞蛋蛋殼裂紋的檢測(cè)準(zhǔn)確率高達(dá)98%。汪俊德等[19]以計(jì)算機(jī)視覺(jué)技術(shù)為基礎(chǔ),設(shè)計(jì)出一套雙黃雞蛋檢測(cè)系統(tǒng)。該系統(tǒng)獲取蛋黃指數(shù)、蛋黃特征和蛋形尺寸等特征,和設(shè)計(jì)的數(shù)學(xué)模型對(duì)比來(lái)實(shí)現(xiàn)雙黃雞蛋的檢測(cè)和識(shí)別,檢測(cè)準(zhǔn)確率高達(dá)95%。鄭麗敏等[20]人通過(guò)高分辨率的數(shù)字?jǐn)z像頭獲取雞蛋圖像,根據(jù)圖像特征建立數(shù)學(xué)模型來(lái)預(yù)測(cè)雞蛋的新鮮度和貯藏期,結(jié)果表明,計(jì)算機(jī)視覺(jué)技術(shù)對(duì)雞蛋的新鮮度、貯藏期進(jìn)行預(yù)測(cè)的結(jié)果準(zhǔn)確率為94%。潘磊慶等[21]通過(guò)計(jì)算機(jī)視覺(jué)技術(shù)和聲學(xué)響應(yīng)信息技術(shù)相結(jié)合的方法檢測(cè)裂紋雞蛋,其檢測(cè)準(zhǔn)確率達(dá)到98%。Mertens K等[22]人基于計(jì)算機(jī)視覺(jué)技術(shù)研發(fā)了雞蛋的分級(jí)檢測(cè)系統(tǒng),該系統(tǒng)識(shí)別帶污漬雞蛋的正確率高達(dá)99%。
2.3 計(jì)算機(jī)視覺(jué)技術(shù)在檢測(cè)食品中微生物含量中的應(yīng)用研究
計(jì)算機(jī)技術(shù)和圖像處理技術(shù)在綜合學(xué)科中的應(yīng)用得到快速發(fā)展,在微生物快速檢測(cè)中的應(yīng)用也越來(lái)越多,主要是針對(duì)微生物微菌落的處理。食品工業(yè)中計(jì)算機(jī)視覺(jué)技術(shù)在微生物檢測(cè)方面的研究和應(yīng)用以研究單個(gè)細(xì)胞為主,并在個(gè)體細(xì)胞的研究上取得了一定的進(jìn)展。殷涌光等[23]以顏色特征分辨技術(shù)為基礎(chǔ),設(shè)計(jì)了一套應(yīng)用計(jì)算機(jī)視覺(jué)技術(shù)快速定量檢測(cè)食品中大腸桿菌的系統(tǒng),該系統(tǒng)檢測(cè)結(jié)果與傳統(tǒng)方法的檢測(cè)結(jié)果具有很好的相關(guān)性,但與傳統(tǒng)方法相比,可以節(jié)省5d時(shí)間,檢測(cè)時(shí)間在18h以內(nèi),并且能夠有效提高產(chǎn)品品質(zhì)。Lawless等[24]人等時(shí)間段測(cè)定培養(yǎng)基上的細(xì)胞密度,然后通過(guò)計(jì)算機(jī)技術(shù)建立時(shí)間和細(xì)胞密度之間的動(dòng)態(tài)關(guān)聯(lián),利用該關(guān)聯(lián)可以預(yù)測(cè)和自動(dòng)檢測(cè)微生物的生長(zhǎng)情況,如通過(guò)計(jì)算機(jī)控制自動(dòng)定量采集檢測(cè)對(duì)象,然后分析菌落的邊緣形態(tài),根據(jù)菌落的邊緣形態(tài)計(jì)算機(jī)可以顯示被檢測(cè)菌落的具置,并且根據(jù)動(dòng)態(tài)關(guān)聯(lián)計(jì)算機(jī)視覺(jué)系統(tǒng)可以同時(shí)處理多個(gè)不同的樣品。郭培源等[25]人對(duì)計(jì)算機(jī)視覺(jué)技術(shù)用于豬肉的分級(jí)進(jìn)行了研究,結(jié)果顯示計(jì)算機(jī)視覺(jué)技術(shù)在識(shí)別豬肉表面微生物數(shù)量上與國(guó)標(biāo)方法檢測(cè)的結(jié)果顯著相關(guān),該技術(shù)可以有效地計(jì)算微生物的數(shù)量。Bayraktar. B等[26]人采用計(jì)算機(jī)視覺(jué)技術(shù)、光散射技術(shù)(BARDOT)和模式識(shí)別技術(shù)相結(jié)合的方法來(lái)快速檢測(cè)李斯特菌,在獲取該菌菌落中的形態(tài)特征有對(duì)圖像進(jìn)行分析處理達(dá)到對(duì)該菌的分類識(shí)別。殷涌光等[27]人綜合利用計(jì)算機(jī)視覺(jué)、活體染色、人工神經(jīng)網(wǎng)絡(luò)、圖像處理等技術(shù),用分辨率為520萬(wàn)像素的數(shù)字?jǐn)z像機(jī)拍攝細(xì)菌內(nèi)部的染色效果,并結(jié)合新的圖像處理算法,對(duì)細(xì)菌形態(tài)學(xué)的8個(gè)特征參數(shù)進(jìn)行檢測(cè),檢測(cè)結(jié)果與傳統(tǒng)檢測(cè)結(jié)果顯著相關(guān)(相關(guān)系數(shù)R=0.9987),和傳統(tǒng)檢測(cè)方法相比該方法具有操作簡(jiǎn)單、快速、結(jié)果準(zhǔn)確、適合現(xiàn)場(chǎng)快速檢測(cè)等特點(diǎn)。魯靜[28]和劉侃[29]利用顯微鏡和圖像采集儀器,獲取乳制品的掃描圖像,然后微生物的圖像特征,識(shí)別出微生物數(shù)量,并以此作為衡量乳制品質(zhì)量是否達(dá)標(biāo)的依據(jù),并對(duì)產(chǎn)品進(jìn)行分級(jí)。
2.4計(jì)算機(jī)視覺(jué)技術(shù)在其他食品產(chǎn)業(yè)中的應(yīng)用研究
里紅杰等[30]通過(guò)提取貝類和蝦類等海產(chǎn)品的形狀、尺寸、紋理、顏色等外形特征,對(duì)照數(shù)學(xué)模型,采用數(shù)字圖像處理技術(shù)、計(jì)算機(jī)識(shí)別技術(shù)實(shí)現(xiàn)了對(duì)貝類和蝦類等海產(chǎn)品的無(wú)損檢測(cè)和自動(dòng)化分類、分級(jí)和質(zhì)量評(píng)估,并通過(guò)實(shí)例詳細(xì)闡述了該技術(shù)的實(shí)現(xiàn)方法,證實(shí)了此項(xiàng)技術(shù)的有效性。計(jì)算機(jī)視覺(jué)技術(shù)還可以檢驗(yàn)玉米粒形和玉米種子質(zhì)量、識(shí)別玉米品種和玉米田間雜草[31]。晁德起等[32]通過(guò)x射線照射獲取毛葉棗的透視圖像后,運(yùn)用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)圖像進(jìn)行分析評(píng)估,毛葉棗可食率的評(píng)估結(jié)果與運(yùn)用物理方法測(cè)得的結(jié)果平均誤差僅為1.47%,因此得出結(jié)論:計(jì)算機(jī)視覺(jué)技術(shù)可以應(yīng)用于毛葉棗的自動(dòng)分級(jí)。Gokmen,V等通用對(duì)薯片制作過(guò)程中圖像像素的變化來(lái)研究薯片的褐變率,通過(guò)分析特色參數(shù)來(lái)研究薯片中丙烯酰胺的含量和褐變率也關(guān)系,結(jié)果顯示兩項(xiàng)參數(shù)相關(guān)性為0.989,從而可以應(yīng)用計(jì)算機(jī)視覺(jué)技術(shù)來(lái)預(yù)測(cè)加熱食品中丙烯酰胺的含量,該方法可以在加熱食品行業(yè)中得到廣泛應(yīng)用。韓仲志等人拍攝和掃描11類花生籽粒,每類100顆不同等級(jí)的花生籽粒的正反面圖像,利用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)花生內(nèi)部和外部采集圖像,并通過(guò)圖像對(duì)其外在品質(zhì)和內(nèi)在品質(zhì)進(jìn)行分析,并建立相應(yīng)的數(shù)學(xué)模型,該技術(shù)在對(duì)待檢樣品進(jìn)行分級(jí)檢測(cè)時(shí)的正確率高達(dá)92%。另外,郭培源等人以國(guó)家標(biāo)準(zhǔn)為依據(jù),通過(guò)數(shù)字?jǐn)z像技術(shù)獲取豬肉的細(xì)菌菌斑面積、脂肪細(xì)胞數(shù)、顏色特征值以及氨氣等品質(zhì)指標(biāo)來(lái)實(shí)現(xiàn)豬肉新鮮程度的分級(jí)辨認(rèn)。
3 展望
新技術(shù)的研究與應(yīng)用必然伴隨著坎坷,從70年代初計(jì)算機(jī)視覺(jué)技術(shù)在食品工業(yè)中進(jìn)行應(yīng)用開(kāi)始,就遇到了很多問(wèn)題。計(jì)算機(jī)視覺(jué)技術(shù)在食品工業(yè)中的研究及應(yīng)用主要存在以下幾方面的問(wèn)題。
3.1 檢測(cè)指標(biāo)有限
計(jì)算機(jī)視覺(jué)技術(shù)在檢測(cè)食品單一指標(biāo)或者以一個(gè)指標(biāo)作為分級(jí)標(biāo)準(zhǔn)進(jìn)行分級(jí)時(shí)具有理想效果,但以同一食品的多個(gè)指標(biāo)共同作為分級(jí)標(biāo)準(zhǔn)進(jìn)行檢測(cè)分級(jí),則分級(jí)結(jié)果誤差較大。例如,Davenel等通過(guò)計(jì)算機(jī)視覺(jué)對(duì)蘋果的大小、重量、外觀損傷進(jìn)行分析,但研究結(jié)果顯示,系統(tǒng)會(huì)把花粵和果梗標(biāo)記為缺陷,還由于蘋果表面碰壓傷等缺陷情況復(fù)雜,造成分級(jí)誤差很大,分級(jí)正確率只有69%。Nozer等以計(jì)算機(jī)視覺(jué)為主要技術(shù)手段,獲取水果的圖像,進(jìn)而通過(guò)分析圖像來(lái)確定水果的形狀、大小、顏色和重量,并進(jìn)行分級(jí),其正確率僅為85.1%。
3.2 兼容性差
計(jì)算機(jī)視覺(jué)技術(shù)針對(duì)單一種類的果蔬分級(jí)檢測(cè)效果顯著,但是同一套系統(tǒng)和設(shè)備很難用于其他種類的果蔬,甚至同一種類不同品種的農(nóng)產(chǎn)品也很難公用一套計(jì)算機(jī)視覺(jué)設(shè)備。Reyerzwiggelaar等利用計(jì)算機(jī)視覺(jué)檢查杏和桃的損傷程度,發(fā)現(xiàn)其檢測(cè)桃子的準(zhǔn)確率顯著高于杏的。Majumdar.S等利用計(jì)算機(jī)視覺(jué)技術(shù)區(qū)分不同種類的麥粒,小麥、燕麥、大麥的識(shí)別正確率有明顯差異。
3.3 檢測(cè)性能受環(huán)境制約
現(xiàn)階段的計(jì)算機(jī)視覺(jué)技術(shù)和配套的數(shù)學(xué)模型適用于簡(jiǎn)單的環(huán)境,在復(fù)雜環(huán)境下工作時(shí)會(huì)產(chǎn)生較大的誤差。Plebe等利用計(jì)算機(jī)視覺(jué)技術(shù)對(duì)果樹(shù)上的水果進(jìn)行識(shí)別定位,但研究發(fā)現(xiàn)由于光照條件以及周邊環(huán)境的影響,水果的識(shí)別和定位精度不高,不能滿足實(shí)際生產(chǎn)的需要。
綜上所述,可看出國(guó)內(nèi)外學(xué)者對(duì)計(jì)算機(jī)視覺(jué)技術(shù)在食品工業(yè)中的應(yīng)用進(jìn)行了大量的研究,有些研究從單一方面入手,有些研究綜合了多個(gè)學(xué)科,在研究和應(yīng)用的過(guò)程中,取得了較大的經(jīng)濟(jì)效益,也遇到了很多問(wèn)題,在新的形勢(shì)下,計(jì)算機(jī)視覺(jué)技術(shù)和數(shù)碼拍攝、圖像處理、人工神經(jīng)網(wǎng)絡(luò),數(shù)學(xué)模型建設(shè)、微生物快速計(jì)量等高新技術(shù)相融合的綜合技術(shù)逐漸成為了各個(gè)領(lǐng)域?qū)W者的研究熱點(diǎn),以計(jì)算機(jī)視覺(jué)為基礎(chǔ)的綜合技術(shù)也將在食品工業(yè)中發(fā)揮更加重要的作用。
參考文獻(xiàn)
[1] 寧紀(jì)鋒,龍滿生,何東健.農(nóng)業(yè)領(lǐng)域中的計(jì)算機(jī)視覺(jué)研究[J].計(jì)算機(jī)與農(nóng)業(yè),2001(01):1-3.
[2] 李崢.基于計(jì)算機(jī)視覺(jué)的蔬菜顏色檢測(cè)系統(tǒng)研究[D].吉林:吉林大學(xué),2004.
[3] 曾愛(ài)群.基于計(jì)算機(jī)視覺(jué)與神經(jīng)網(wǎng)絡(luò)的芒果等級(jí)分類研究[D].桂林:桂林工學(xué)院,2008.
[4] 韓偉,曾慶山.基于計(jì)算機(jī)視覺(jué)的水果直徑檢測(cè)方法的研究[J].中國(guó)農(nóng)機(jī)化,2011(05):25-29.
[5] 李慶中.蘋果自動(dòng)分級(jí)中計(jì)算機(jī)視覺(jué)信息快速獲取與處理技術(shù)的研究[D].北京:中國(guó)農(nóng)業(yè)大學(xué),2000.
[6] 孫洪勝,李宇鵬,王成,等.基于計(jì)算機(jī)視覺(jué)的蘋果在線高效檢測(cè)與分級(jí)系統(tǒng)[J].儀表技術(shù)與傳感器,2011(06):62-65.
[7] 劉禾,汀慰華.水果果形判別人工神經(jīng)網(wǎng)絡(luò)專家系統(tǒng)的研究[J].農(nóng)業(yè)工程學(xué)報(bào),1996,12(0l):171-176.
[8] 應(yīng)義斌,景寒松,馬俊福.用計(jì)算機(jī)視覺(jué)進(jìn)行黃花梨果梗識(shí)別的新方法[J].農(nóng)業(yè)工程學(xué)報(bào),1998,14(02):221-225.
[9] 楊秀坤,陳曉光,馬成林,等.用遺傳神經(jīng)網(wǎng)絡(luò)方法進(jìn)行蘋果顏色白動(dòng)檢測(cè)的研究[J].農(nóng)業(yè)工程學(xué)報(bào),1997,13(02):193-176.
[10] 陳育彥,屠康,柴麗月,等.基于激光圖像分析的蘋果表面損傷和內(nèi)部腐爛檢測(cè)[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2009,40(07):133-137.
[11] 馮斌,汪憋華.基于計(jì)算機(jī)視覺(jué)的水果大小檢測(cè)方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2003,34(01):73-75.
[12] 朱偉,曹其新.基于模糊彩色聚類方法的西紅柿缺陷分割[J].農(nóng)業(yè)工程學(xué)報(bào),2003,19(03):133-136.
[13] 曹樂(lè)平,溫芝元,沈陸明.基于色調(diào)分形維數(shù)的柑橘糖度和有效酸度檢測(cè)[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2009,41(03):143-148.
[14] 劉剛,王立香,柳兆君.基于計(jì)算機(jī)視覺(jué)的蘋果質(zhì)量檢測(cè)[J].安徽農(nóng)業(yè)科學(xué),2012,40(08):5014-5016.
[15] Blasco J,Aleixos N,Molto puter vision detection of peel defects in citrus by means of a region oriented segmentation algorithm[J].Journal of Food Engineering,2007,81(03):535-543.
[16] 趙廣華,飛,陸奎榮,等.智能化蘋果品質(zhì)實(shí)時(shí)分選系統(tǒng)[J].中國(guó)科技信息.
[17] 王江楓,羅錫文,洪添勝,等.計(jì)算機(jī)視覺(jué)技術(shù)在芒果重量及果面壞損檢測(cè)中的應(yīng)用[J].農(nóng)業(yè)工程學(xué)報(bào),1998(12):186-189.
[18] 歐陽(yáng)靜怡,劉木華.基于計(jì)算機(jī)視覺(jué)的雞蛋裂紋檢測(cè)方法研究[J].農(nóng)機(jī)化研究,2012(03):91-93.
[19] 汪俊德,鄭麗敏,徐桂云,等.基于計(jì)算機(jī)視覺(jué)技術(shù)的雙黃雞蛋檢測(cè)系統(tǒng)研究[J].農(nóng)機(jī)化研究,2012(09):195-199.
[20] 鄭麗敏,楊旭,徐桂云,等.基于計(jì)算機(jī)視覺(jué)的雞蛋新鮮度無(wú)損檢測(cè)[J].農(nóng)業(yè)工程學(xué)報(bào),2009,25(03):335-339.
[21] 潘磊慶,屠康,詹歌,等.基于計(jì)算機(jī)視覺(jué)和聲學(xué)響應(yīng)信息融合的雞蛋裂紋檢測(cè)[J].農(nóng)業(yè)工程學(xué)報(bào),2010,26(11):332-337.
[22] Mertens K,De Ketelaere B,Kamers B,et al.Dirt detection on brown eggs by means of colorcomputer vision[J]. Poultry Science,2005,84(10):1653-1659.
[23] 殷涌光,丁筠.基于計(jì)算機(jī)視覺(jué)的食品中大腸桿菌快速定量檢測(cè)[J].吉林大學(xué)學(xué)報(bào)(工學(xué)版),2009,39(02):344-348.
[24] Lawless C,Wilkinson DJ,Young A,et al.Colonyzer: automated quantification of micro-organism growth characteristics on solid agar[J].BMC Bioinformatics,2010(08):38-44.
[25] 郭培源,畢松,袁芳.豬肉新鮮度智能檢測(cè)分級(jí)系統(tǒng)研究[J].食品科學(xué),2010,31(15):68-72.
[26] Bayraktar B,Banada PP,Hirleman ED,et al.Feature extraction from light-scatter patterns of Listeria colonies for identification and classification [J].Journal of Biomedical Optics,2006,11(03):34- 36.
[27] 殷涌光,丁筠.基于計(jì)算機(jī)視覺(jué)的蔬菜中活菌總數(shù)的快速檢測(cè)[J].農(nóng)業(yè)工程學(xué)報(bào),2009,25(07):249-254.
[28] 魯靜.乳品微生物自動(dòng)檢測(cè)系統(tǒng)的設(shè)計(jì)[J].湖北第二師范學(xué)院學(xué)報(bào),2010,27(08):115-117.
[29] 劉侃.鮮奶含菌量快速檢測(cè)系統(tǒng)[D].華中科技大學(xué),2008.
[30] 里紅杰,陶學(xué)恒,于曉強(qiáng).計(jì)算機(jī)視覺(jué)技術(shù)在海產(chǎn)品質(zhì)量評(píng)估中的應(yīng)用[J].食品與機(jī)械,2012,28(04):154-156.
關(guān)鍵詞 智能交通系統(tǒng);計(jì)算機(jī)視覺(jué);汽車流量
中圖分類號(hào):TN948 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-7597(2014)14-0048-01
基于視覺(jué)的圖像處理器測(cè)量精度高,抗干擾能力強(qiáng),許多自然及人為的干擾都可以被消除,運(yùn)用預(yù)測(cè)技術(shù)可以再捕獲瞬間丟失的目標(biāo),并且能實(shí)現(xiàn)對(duì)記憶的跟蹤。它通常安裝在路邊或架空安裝,不會(huì)重新鋪設(shè)路面,也不會(huì)影響埋在地下的水和天然氣管道,更不會(huì)干擾交通。 基于視覺(jué)的圖像處理有其突出的優(yōu)點(diǎn),表現(xiàn)在:可以獲得的目標(biāo)信息非常巨大,獲取信息的方法也非常方便。
1 研究的實(shí)用意義
車輛檢測(cè)系統(tǒng)在智能交通系統(tǒng)中具有很重要的地位。機(jī)動(dòng)車輛流量計(jì)數(shù)與監(jiān)控為智能控制提供了相當(dāng)重要的數(shù)據(jù)來(lái)源,通過(guò)計(jì)算機(jī)視覺(jué)的機(jī)動(dòng)車流量統(tǒng)計(jì)系統(tǒng)可以檢測(cè)很多交通參數(shù),便于我們檢測(cè)和監(jiān)控,這些參數(shù)中的一個(gè)重要參數(shù)就是汽車
流量。
基于視頻的檢測(cè)法作為最有前途的方法之一,有以下優(yōu)點(diǎn)。
1)能高效、準(zhǔn)確、安全可靠地的監(jiān)視和控制道路交通,能夠提供高質(zhì)量高分辨率的圖像信息。
2)用于交通監(jiān)視和控制的主要設(shè)備就是安裝視頻攝像機(jī),現(xiàn)在我國(guó)所有城市基本都已經(jīng)安裝了視頻攝像機(jī),甚至高清視頻攝像機(jī)。因?yàn)榘惭b視頻攝像機(jī)破壞性非常低、很方便、也很經(jīng)濟(jì)。
3)由計(jì)算機(jī)視覺(jué)得到的交通信息可以通過(guò)聯(lián)網(wǎng)工作,非常有利于對(duì)道路交通網(wǎng)的監(jiān)視以及控制。
4)由于目前對(duì)智能交通系統(tǒng)的安全性、實(shí)時(shí)性和可靠性的要求都非常高,計(jì)算機(jī)技術(shù)和圖像處理技術(shù)的發(fā)展顯得極其
重要。
2 研究?jī)?nèi)容
本研究主要包含兩大部份:一部分就是采用分類和分割方法把采集到的視頻圖像的目標(biāo)進(jìn)行識(shí)別;另一部分就是通過(guò)定位方法來(lái)實(shí)現(xiàn)目標(biāo)的跟蹤。這兩部份是缺一不可,緊密聯(lián)系在一起的。
首先先介紹視頻圖像的目標(biāo)識(shí)別,視頻圖像目標(biāo)的識(shí)別方法有很多,但總體上主要有兩種方法:一是大家熟悉的相關(guān)匹配法,二是特征匹配法。相關(guān)匹配法是通過(guò)找到最大相關(guān)值(最大相關(guān)值指的就是當(dāng)前圖像與參考圖像間的相關(guān)系數(shù)的大?。┧诘奈恢脕?lái)確定當(dāng)前輸入圖像中的目標(biāo)位置。相關(guān)匹配法優(yōu)點(diǎn)是可以在信噪比很小的條件下工作,對(duì)噪聲抑制能力非常強(qiáng),在計(jì)算形式上比較簡(jiǎn)單,很容易實(shí)現(xiàn)。但它的缺點(diǎn)也很明顯,由于相關(guān)匹配法對(duì)幾何和灰度畸變十分敏感,反而計(jì)算量偏大,造成的直接后果就是非常容易產(chǎn)生累積誤差,而且最關(guān)鍵的就是不能充分利用視頻圖像目標(biāo)的幾何特性,就不能保證對(duì)識(shí)別目標(biāo)的跟蹤精度。相關(guān)匹配法比較適合于對(duì)目標(biāo)的尺寸變化不大并且場(chǎng)景各部分的相關(guān)性不強(qiáng),當(dāng)前輸入圖像和參考圖像的產(chǎn)生條件較為一致的場(chǎng)合。特征匹配方法是目前研究較多的一類圖像匹配方法,它是通過(guò)目標(biāo)的特征與輸入圖像中目標(biāo)的特征來(lái)比較辨識(shí)目標(biāo)。它首先提取輸入圖像和參考圖像的相關(guān)特征信息,比如邊緣、角點(diǎn)等。然后通過(guò)測(cè)量距離來(lái)比較輸入圖像與參考圖像的特征集合,如果輸入圖像的特征集與參考圖像的特征集距離是最小的(在滿足給定約束條件下),則判定該目標(biāo)被識(shí)別。它對(duì)目標(biāo)的幾何特征、灰度畸變一點(diǎn)都不敏感,但它充分利用了目標(biāo)圖像的特征信息,因而可以保證較高的跟蹤精度。
上面介紹了視頻圖像目標(biāo)的識(shí)別,現(xiàn)在介紹本研究第二部分:通過(guò)定位方法來(lái)實(shí)現(xiàn)目標(biāo)的跟蹤。對(duì)于圖像目標(biāo)的跟蹤方法通常有下面幾個(gè)方法。
亮度中心法,其實(shí)這種方法計(jì)算很簡(jiǎn)單,只要確定了一個(gè)點(diǎn),就能完成定位。這個(gè)點(diǎn)就是一個(gè)跟蹤點(diǎn),它就是具有最高灰度的像素點(diǎn)(來(lái)自獲得的視頻目標(biāo)圖像)或這個(gè)點(diǎn)上的一個(gè)鄰域。這種方法、性能很穩(wěn)定、容易實(shí)現(xiàn),工程上運(yùn)用的很多。但這種跟蹤非常容易受干擾,因?yàn)樗饕m用于紅外和其他放射性目標(biāo)的跟蹤。
最佳空間濾波法是常用跟蹤方法之一,它完全是在亮度中心法的基礎(chǔ)上建立起來(lái)的,為了提高跟蹤性能,就要把目標(biāo)的大小、形狀、運(yùn)動(dòng)特性等特征都完全利用起來(lái)。但目前這類方法也有明顯缺點(diǎn),在實(shí)用性、定位精度上和計(jì)算量方面都有較大的限制。
投影、形心法是通過(guò)目標(biāo)的投影或形心來(lái)確定目標(biāo)的實(shí)際位置和運(yùn)動(dòng)姿態(tài)。對(duì)比前面兩種跟蹤方法,投影、形心法的優(yōu)點(diǎn)是計(jì)算量非常小,容易通過(guò)硬件方式來(lái)實(shí)現(xiàn)。缺點(diǎn)是它的抗干擾性能力比較差,主要用于均勻背景下跟蹤孤立目標(biāo)。
從以上對(duì)研究?jī)?nèi)容的介紹,現(xiàn)有的各類識(shí)別和定位方法都各有優(yōu)缺點(diǎn),要想找到一個(gè)合適的方法,都達(dá)不到滿意的效果。要想取得較好的性能,都只能在目標(biāo)尺寸相對(duì)對(duì)比度變化都不大、對(duì)噪聲的干擾又比較小、圖像灰度的空間變化并不明顯的理論環(huán)境中。然而實(shí)際的環(huán)境通常是變化無(wú)常的,通過(guò)一種方法來(lái)實(shí)現(xiàn)目標(biāo)的識(shí)別與跟蹤很難有合適的效果。最近幾年,結(jié)合這些方法的優(yōu)點(diǎn)和缺點(diǎn),混合定位識(shí)別的方法確能將上述各類基本的識(shí)別方法進(jìn)行混合定位,使它們能夠合二為一,相互補(bǔ)充。這代表著目標(biāo)識(shí)別方法非常具有理論研究和應(yīng)用價(jià)值,是一個(gè)重要發(fā)展方向。
3 技術(shù)路線
研究的技術(shù)路線(如圖1):首先提取出攝像機(jī)采集到的視頻,該視頻是以幀為單位的圖片文件形式。然后對(duì)圖像數(shù)據(jù)進(jìn)行數(shù)學(xué)上的處理,比如二值化、提取邊緣等。這樣就可以識(shí)別汽車的位置進(jìn)行定位,最后對(duì)識(shí)別出來(lái)的汽車數(shù)量通過(guò)計(jì)數(shù)器計(jì)數(shù)。
4 研究實(shí)現(xiàn)
通過(guò)基于計(jì)算機(jī)視覺(jué)的研究,我們?cè)O(shè)計(jì)出了能夠?qū)崿F(xiàn)機(jī)動(dòng)車流量的檢測(cè)和計(jì)數(shù)的系統(tǒng)。并且該系統(tǒng)能夠?qū)\(yùn)動(dòng)目標(biāo)進(jìn)行識(shí)別與跟蹤定位,對(duì)出現(xiàn)多目標(biāo)遮擋和丟失目標(biāo),還可以重新匹配。
5 結(jié)束語(yǔ)
本文創(chuàng)新之處就是將上述各類基本的識(shí)別方法進(jìn)行混合定位,使它們能夠相互補(bǔ)充。這代表著目標(biāo)識(shí)別方法非常具有理論研究和應(yīng)用價(jià)值,是一個(gè)重要發(fā)展方向。
參考文獻(xiàn)
[1]章毓晉.圖像工程(第2版)[M].清華大學(xué)出版社,2007.
[2]夏文龍.基于計(jì)算機(jī)視覺(jué)的汽車流量檢測(cè)研究[D].四川大學(xué),2003.
[3]葛群輝,淺談基于視覺(jué)的高速公路車流檢測(cè)技術(shù)[J].科技資訊,2010(2).
[4]劉萌萌,基于無(wú)標(biāo)度攝像機(jī)的車流跟蹤與速度估計(jì)算法研究[D].西南交通大學(xué),2005.
計(jì)算機(jī)視覺(jué)的第一步是特征提取,即檢測(cè)圖像中的關(guān)鍵點(diǎn)并獲取有關(guān)這些關(guān)鍵點(diǎn)的有意義信息。特征提取過(guò)程本身包含4個(gè)基本階段:圖像準(zhǔn)備、關(guān)鍵點(diǎn)檢測(cè)、描述符生成和分類。實(shí)際上,這個(gè)過(guò)程會(huì)檢查每個(gè)像素,以查看是否有特征存在干該像素中。
特征提取算法將圖像描述為指向圖像中的關(guān)鍵元素的一組特征向量。本文將回顧一系列的特征檢測(cè)算法,在這個(gè)過(guò)程中,看看一般目標(biāo)識(shí)別和具體特征識(shí)別在這些年經(jīng)歷了怎樣的發(fā)展。
早期特征檢測(cè)器
Scale Invariant Feature Transform(SIFT)及Good Features To Track(GFTT)是特征提取技術(shù)的早期實(shí)現(xiàn)。但這些屬于計(jì)算密集型算法,涉及到大量的浮點(diǎn)運(yùn)算,所以它們不適合實(shí)時(shí)嵌入式平臺(tái)。
以SIFT為例,這種高精度的算法,在許多情況下都能產(chǎn)生不錯(cuò)的結(jié)果。它會(huì)查找具有子像素精度的特征,但只保留類似于角落的特征。而且,盡管SIFT非常準(zhǔn)確,但要實(shí)時(shí)實(shí)現(xiàn)也很復(fù)雜,并且通常使用較低的輸入圖像分辨率。
因此,SIFT在目前并不常用,它主要是用作一個(gè)參考基準(zhǔn)來(lái)衡量新算法的質(zhì)量。因?yàn)樾枰档陀?jì)算復(fù)雜度,所以最終導(dǎo)致要開(kāi)發(fā)一套更容易實(shí)現(xiàn)的新型特征提取算法。
二代算法
Speeded Up Robust Features(SURF)是最早考慮實(shí)現(xiàn)效率的特征檢測(cè)器之一。它使用不同矩形尺寸中的一系列加法和減法取代了SIFT中浩繁的運(yùn)算。而且,這些運(yùn)算容易矢量化,需要的內(nèi)存較少。
接下來(lái),HOG(Histograms ofOriented Gradients)這種在汽車行業(yè)中常用的熱門行人檢測(cè)算法可以變動(dòng),采用不同的尺度來(lái)檢測(cè)不同大小的對(duì)象,并使用塊之間的重疊量來(lái)提高檢測(cè)質(zhì)量,而不增加計(jì)算量。它可以利用并行存儲(chǔ)器訪問(wèn),而不像傳統(tǒng)存儲(chǔ)系統(tǒng)那樣每次只處理一個(gè)查找表,因此根據(jù)內(nèi)存的并行程度加快了查找速度。
然后,ORB(Oriented FASTand Rotated BRIEF)這種用來(lái)替代SIFT的高效算法將使用二進(jìn)制描述符來(lái)提取特征。ORB將方向的增加與FAST角點(diǎn)檢測(cè)器相結(jié)合,并旋轉(zhuǎn)BRIEF描述符,使其與角方向?qū)R。二進(jìn)制描述符與FAST和HarrisCorner等輕量級(jí)函數(shù)相結(jié)合產(chǎn)生了一個(gè)計(jì)算效率非常高而且相當(dāng)準(zhǔn)確的描述圖。
CNN:嵌入式平臺(tái)目標(biāo)識(shí)別的下一個(gè)前沿領(lǐng)域
配有攝像頭的智能手機(jī)、平板電腦、可穿戴設(shè)備、監(jiān)控系統(tǒng)和汽車系統(tǒng)采用智能視覺(jué)功能將這個(gè)行業(yè)帶到了一個(gè)十字路口,需要更先進(jìn)的算法來(lái)實(shí)現(xiàn)計(jì)算密集型應(yīng)用,從而提供更能根據(jù)周邊環(huán)境智能調(diào)整的用戶體驗(yàn)。因此,需要再一次降低計(jì)算復(fù)雜度來(lái)適應(yīng)這些移動(dòng)和嵌入式設(shè)備中使用的強(qiáng)大算法的嚴(yán)苛要求。
不可避免地,對(duì)更高精度和更靈活算法的需求會(huì)催生出矢量加速深度學(xué)習(xí)算法,如卷積神經(jīng)網(wǎng)絡(luò)(CNN),用于分類、定位和檢測(cè)圖像中的目標(biāo)。例如,在使用交通標(biāo)志識(shí)別的情況下,基于CNN的算法在識(shí)別準(zhǔn)確度上勝過(guò)目前所有的目標(biāo)檢測(cè)算法。除了質(zhì)量高之外,CNN與傳統(tǒng)目標(biāo)檢測(cè)算法相比的主要優(yōu)點(diǎn)是,CNN的自適應(yīng)能力非常強(qiáng)。它可以在不改變算法代碼的情況下快速地被重新“訓(xùn)練(tuning)”以適應(yīng)新的目標(biāo)。因此,CNN和其他深度學(xué)習(xí)算法在不久的將來(lái)就會(huì)成為主流目標(biāo)檢測(cè)方法。
CNN對(duì)移動(dòng)和嵌入式設(shè)備有非??量痰挠?jì)算要求。卷積是CNN計(jì)算的主要部分。CNN的二維卷積層允許用戶利用重疊卷積,通過(guò)對(duì)同一輸入同時(shí)執(zhí)行一個(gè)或多個(gè)過(guò)濾器來(lái)提高處理效率。所以,對(duì)于嵌入式平臺(tái),設(shè)計(jì)師應(yīng)該能夠非常高效地執(zhí)行卷積,以充分利用CNN流。
事實(shí)上,CNN嚴(yán)格來(lái)說(shuō)并不是一種算法,而是一種實(shí)現(xiàn)框架。它允許用戶優(yōu)化基本構(gòu)件塊,并建立一個(gè)高效的神經(jīng)網(wǎng)絡(luò)檢測(cè)應(yīng)用,因?yàn)镃NN框架是對(duì)每個(gè)像素逐一計(jì)算,而且逐像素計(jì)算是一種要求非常苛刻的運(yùn)算,所以它需要更多的計(jì)算量。
不懈改進(jìn)視覺(jué)處理器
關(guān)鍵詞:ARM OPENCV AdaBoost
近年來(lái),功能各異的視頻監(jiān)控設(shè)備越來(lái)越多,但是,大多只能簡(jiǎn)單記錄視頻畫面,將監(jiān)控到的視頻信息存儲(chǔ)起來(lái),而不能對(duì)所監(jiān)控到的視頻做一定的處理分析和預(yù)測(cè)?;贏RM的人臉檢測(cè)系統(tǒng),為我們的視頻監(jiān)控設(shè)備提供了一個(gè)視頻處理的參考解決方案,在一定基礎(chǔ)上加以擴(kuò)充,可以完成人物識(shí)別,危險(xiǎn)行為檢測(cè)與報(bào)警等,使視頻監(jiān)控設(shè)備更加智能化。
1、視頻監(jiān)控的幾項(xiàng)關(guān)鍵技術(shù)及發(fā)展方向
視頻監(jiān)控的關(guān)鍵技術(shù)主要有視頻采集壓縮算法、視頻信號(hào)可靠地傳輸、信息存儲(chǔ)調(diào)用的智能化與系統(tǒng)的集中管理等。視頻監(jiān)控技術(shù)發(fā)展方向?yàn)榉植疾杉泄芾?、高品質(zhì)圖象壓縮處理、開(kāi)放標(biāo)準(zhǔn)統(tǒng)一接口、統(tǒng)一認(rèn)證以確保安全、操作人性化以及功能集成化、結(jié)構(gòu)模塊化和傳輸多樣化。隨著不斷發(fā)展的網(wǎng)絡(luò)技術(shù),基于嵌入式技術(shù)的網(wǎng)絡(luò)數(shù)字監(jiān)控系統(tǒng)不再是處理模擬視頻信號(hào),而是把攝像機(jī)輸出的模擬視頻信號(hào)通過(guò)視頻編碼器直接轉(zhuǎn)換為IP數(shù)字信號(hào)。
2、平臺(tái)的搭建
ARM之所以應(yīng)用廣泛,是因?yàn)橛休^快得運(yùn)算速度,較低的價(jià)格,開(kāi)發(fā)人員也比較容易接觸,程序較易移植過(guò)來(lái)等特點(diǎn)。EmbeddedLinux也是Linux家族的成員,支持廣泛的硬件平臺(tái),如PPC、ARM、MIPS等,也繼承了Linux的優(yōu)點(diǎn)——開(kāi)源、免費(fèi),同時(shí)也有廣泛的應(yīng)用軟件支持,能夠比較方便的移植操作系統(tǒng)與應(yīng)用軟件。
3、OPENCV簡(jiǎn)介
OpenCV是一個(gè)開(kāi)源的計(jì)算機(jī)視覺(jué)庫(kù),采用C/C++語(yǔ)言進(jìn)行編寫,可以運(yùn)行在Linux/Windows/Mac等操作系統(tǒng)上,同時(shí)還提供了Python、Ruby以及其他語(yǔ)言的接口。其設(shè)計(jì)目標(biāo)就是執(zhí)行速度盡量快,它采用優(yōu)化的C語(yǔ)言編寫,能夠充分利用多核處理器的優(yōu)勢(shì)。除此之外,另外一個(gè)目標(biāo)就是構(gòu)建一個(gè)簡(jiǎn)單易用的計(jì)算機(jī)視覺(jué)框架,開(kāi)發(fā)人員可以利用它更便捷地設(shè)計(jì)復(fù)雜的計(jì)算機(jī)視覺(jué)相關(guān)應(yīng)用程序。其中包含的函數(shù)有500多個(gè),覆蓋了計(jì)算機(jī)視覺(jué)的許多應(yīng)用領(lǐng)域,如工廠產(chǎn)品檢測(cè)、醫(yī)學(xué)成像、信息安全、攝像機(jī)標(biāo)定、立體視覺(jué)和機(jī)器人等。
4、人臉檢測(cè)的原理
人臉檢測(cè)技術(shù)的研究要追溯到20世紀(jì)70年代,早期的研究主要致力于模板匹配、子空間方法、變形模板匹配等,近幾年,集中研究基于數(shù)據(jù)驅(qū)動(dòng)的學(xué)習(xí)方法,如統(tǒng)計(jì)模型方法,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法,統(tǒng)計(jì)知識(shí)理論和支持向量計(jì)算方法,基于馬爾可夫[1]隨機(jī)域的方法,以及基于膚色的人臉檢測(cè)等。目前在實(shí)際中應(yīng)用的人臉檢測(cè)方法多為基于Adaboost[2]學(xué)習(xí)算法的方法。
Viola是AdaBoost算法的一種,主要基于積分圖和級(jí)聯(lián)檢測(cè)器,其方法框架可大至分為以下三大部分:第一部分,使用Harr-like特征來(lái)表示人臉,并且使用“積分圖”實(shí)現(xiàn)特征數(shù)值的快速計(jì)算;第二部分,使用Adaboost算法挑選出一些最能代表人臉的矩形特征,用弱分類器按照加權(quán)投票的方式,構(gòu)造為一個(gè)強(qiáng)分類器;第三部分,為有效的提高檢測(cè)速度,將訓(xùn)練得到的若干強(qiáng)分類器串聯(lián)組成一個(gè)級(jí)聯(lián)結(jié)構(gòu)的層疊分類器。
人臉檢測(cè)的目的就是從圖片之中找出所有包含人臉的子窗口,對(duì)人臉的子窗口與非人臉的子窗口進(jìn)行區(qū)分。第一步,在一個(gè)20*20的圖片中提取出一些簡(jiǎn)單的特征(Harr特征),將白色區(qū)域內(nèi)的像素減去黑色區(qū)域,因此在人臉與非人臉圖片的相同位置上,有著大小不一樣的數(shù)值,這些特征就是區(qū)分人臉和非人臉的依據(jù)。第二步,使用上萬(wàn)張切割好的人臉圖片和上萬(wàn)張背景圖片作為訓(xùn)練樣本。訓(xùn)練圖片一般都調(diào)到到20*20的大小。在這樣大小的圖片中,可供haar使用的特征數(shù)大概有1萬(wàn)個(gè)左右,然后通過(guò)機(jī)器學(xué)習(xí)算法也就是Adaboost算法挑選數(shù)千個(gè)有效的haar特征,用來(lái)組成人臉檢測(cè)器。第三步,學(xué)習(xí)算法訓(xùn)練出一個(gè)人臉檢測(cè)器后,便可以在各種各樣的場(chǎng)合使用了。使用時(shí),依次縮放圖像比例,最后在縮放后的圖片20*20的子窗口中依次判別是否是人臉。
人臉檢測(cè)技術(shù)在門禁系統(tǒng)、智能監(jiān)控系統(tǒng)中已經(jīng)得到了很好的應(yīng)用。另外,目前的筆記本電腦登錄時(shí),也陸續(xù)使用人臉識(shí)別技術(shù)作為憑證。同時(shí),人臉檢測(cè)算法也在數(shù)碼相機(jī)和手機(jī)中起作用,作為一個(gè)新新的功能提供用戶使用。
5、結(jié)語(yǔ)
ARM上進(jìn)行圖像處理以及人臉檢測(cè)與識(shí)別等是可行的方案,可以減少硬件成本。 采用Linux+Qt4+OpenCv+Arm是一個(gè)方案合理、技術(shù)成熟、成本低廉、應(yīng)用廣泛的人臉檢測(cè)與圖像處理的解決方案。
參考文獻(xiàn)
關(guān)鍵詞:數(shù)字圖像技術(shù);應(yīng)用;發(fā)展趨勢(shì)
中圖分類號(hào):TP391.41
計(jì)算機(jī)的特點(diǎn)在于能夠處理各種數(shù)據(jù),數(shù)字圖像能夠經(jīng)過(guò)增強(qiáng)、復(fù)原、分割等處理,隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展和進(jìn)步,現(xiàn)在的數(shù)字圖像技術(shù)具有圖像處理多樣性、精度高、圖像的再現(xiàn)性好、處理量大的優(yōu)點(diǎn),本文主要研究數(shù)字圖像處理技術(shù)的發(fā)展現(xiàn)狀和發(fā)展趨勢(shì)。
1 數(shù)字圖像處理技術(shù)研究現(xiàn)狀
所謂圖像處理是指利用計(jì)算機(jī)來(lái)處理圖像的過(guò)程,主要是實(shí)現(xiàn)改善圖像的視覺(jué)效果,研究的內(nèi)容主要包括圖像數(shù)字化、圖像增強(qiáng)、圖像還原以及圖像分割等。數(shù)字圖像處理最早來(lái)源于20世紀(jì)20年代的報(bào)紙業(yè),到20世紀(jì)50年代,隨著計(jì)算機(jī)的發(fā)展,數(shù)字圖像處理技術(shù)得到人們的普遍關(guān)注,數(shù)字圖像處理技術(shù)隨著太空計(jì)劃得到很大的發(fā)展,最具有典型的例子,是對(duì)月球照片的處理。
進(jìn)入到20世紀(jì)70年代后,數(shù)字圖像處理技術(shù)隨著計(jì)算機(jī)斷層掃面(CT)的出現(xiàn)得到發(fā)展,在以后的時(shí)間里,數(shù)字圖像處理技術(shù)不斷有新的研究成果,1975年EWI公司研究的CT裝置獲得諾貝爾獎(jiǎng),目前數(shù)字圖像技術(shù)已廣泛應(yīng)用在各行各業(yè)中。
2 數(shù)字圖像處理技術(shù)的應(yīng)用
數(shù)字圖像處理技術(shù)目前在各行各業(yè)中都得到了很大的進(jìn)展。在遙感航空航天方面,不少國(guó)家都派出了偵查飛機(jī)對(duì)目標(biāo)地區(qū)進(jìn)行空中攝影,進(jìn)而通過(guò)圖像處理技術(shù)來(lái)分析照片,節(jié)省了人力、物理,也能夠從圖片中得到其他的有用信息。在20世紀(jì)60年代以來(lái),美國(guó)以及其他的一些國(guó)家發(fā)射了資源遙感衛(wèi)星,由于成像條件非常差,因此圖像本身的質(zhì)量也不高,需要采取數(shù)字圖像處理技術(shù)處理,如采用多波段掃描器進(jìn)行掃描成像,圖像分辨率為30m,這些圖像轉(zhuǎn)變?yōu)閿?shù)字信號(hào)傳送下來(lái),再經(jīng)過(guò)處理。數(shù)字圖像處理技術(shù)在各國(guó)的應(yīng)用中已非常廣泛,如用在森林調(diào)查、災(zāi)害監(jiān)測(cè)、資源勘查以及城市規(guī)劃中。
數(shù)字圖像處理技術(shù)最早來(lái)源于醫(yī)藥方面,因此在生物醫(yī)學(xué)工程方面,數(shù)字圖像處理技術(shù)也發(fā)揮出了巨大作用,除了上文所講述的CT之外,還有一些顯微圖像處理技術(shù),主要是識(shí)別紅細(xì)胞、白細(xì)胞以及染色體分析等,在醫(yī)學(xué)診治方面X光肺圖像增強(qiáng)、心電圖分析以及超聲波圖像處理技術(shù)等發(fā)揮出了重要作用。
在通信工程方面,目前通信主要的發(fā)展趨勢(shì)為綜合性的多媒體通信,也就是將電視、計(jì)算機(jī)以及電話聯(lián)合在一起在數(shù)字通信網(wǎng)上傳輸,在傳輸?shù)倪^(guò)程中最為復(fù)雜和困難的地方集中在圖像的處理中,比如說(shuō),彩色電視信號(hào)速率為100Mbit/s以上,想要傳輸出去就需要壓縮信息的比特量,因此技術(shù)成敗的關(guān)鍵就在于編碼壓縮。目前國(guó)家正在大力研發(fā)的新的編碼方法,如小波變換圖像壓縮編碼以及自適應(yīng)圖像網(wǎng)絡(luò)編碼等。
在工業(yè)和工程方面,主要的應(yīng)用集中在自動(dòng)裝置配線中檢測(cè)零件的質(zhì)量、彈性力學(xué)照片的應(yīng)力分析以及郵政信件的自動(dòng)分檢等,另外在智能機(jī)器人中也有應(yīng)用。在軍事、公安方面,數(shù)字圖像處理技術(shù)的應(yīng)用主要集中在導(dǎo)彈的精確制導(dǎo)、偵查照片以及圖像的傳輸和顯示方面,在公安方面,主要應(yīng)用在鑒別人臉、識(shí)別指紋以及圖片復(fù)原方面。數(shù)字圖像處理技術(shù)除了以上所講述的應(yīng)用領(lǐng)域之外,在電視圖像的編輯、服裝設(shè)計(jì)、發(fā)型設(shè)計(jì)以及文物資料復(fù)原等方面也有廣泛的使用。
3 數(shù)字圖像處理技術(shù)的發(fā)展趨勢(shì)
目前數(shù)字圖像技術(shù)隨著科技的進(jìn)步得到了很大的發(fā)展,隨著低成本硬件相關(guān)技術(shù)的發(fā)展可以想象數(shù)字圖像技術(shù)將會(huì)得到更加廣泛的應(yīng)用,目前國(guó)內(nèi)的研究成果主要集中在一些診斷、圖像壓縮編碼以及目標(biāo)識(shí)別等方面,但是還沒(méi)有廣泛應(yīng)用在實(shí)際生活中。數(shù)字圖像處理技術(shù)將會(huì)向著高分辨率、立體化、超高速以及智能化等方面發(fā)展,下面具體講述數(shù)字圖像處理技術(shù)的發(fā)展趨勢(shì)。
隨著計(jì)算機(jī)、人工智能以及思維科學(xué)研究的不斷發(fā)展,數(shù)字圖像處理技術(shù)在計(jì)算機(jī)視覺(jué)方面將會(huì)進(jìn)一步的發(fā)展,智能機(jī)器人的重要感覺(jué)器官是視覺(jué),目前研究的開(kāi)放話題集中在理解和識(shí)別三維應(yīng)力,將會(huì)應(yīng)用在軍事勘察、危險(xiǎn)環(huán)境作業(yè)以及家庭服務(wù)等方面,目前人們對(duì)于自身的視覺(jué)了解的還非常少,因此在計(jì)算機(jī)視覺(jué)方面還需要進(jìn)一步的探索。
數(shù)字圖像處理技術(shù)還會(huì)向著虛擬現(xiàn)實(shí)發(fā)展,所謂虛擬現(xiàn)實(shí)就是使用計(jì)算機(jī)構(gòu)成一個(gè)虛擬的三維空間,這項(xiàng)技術(shù)的發(fā)展是在計(jì)算機(jī)硬件技術(shù)的提高方面提出的,人們應(yīng)用機(jī)器人身上的攝像機(jī)能夠真實(shí)的感受到所在的環(huán)境,進(jìn)而操縱機(jī)器人的行為,另外網(wǎng)上虛擬現(xiàn)實(shí)也是未來(lái)的一個(gè)發(fā)展方向。人們?cè)谕瓿缮鐣?huì)生產(chǎn)中往往習(xí)慣使用自身的認(rèn)識(shí)和工具,將這些掌握在自身手中,因此目前時(shí)代的發(fā)展趨勢(shì)就是將原來(lái)二維的東西向著三維發(fā)展,如三維重建技術(shù)在地圖方面的使用,在軍事方面能夠使用電子沙盤實(shí)現(xiàn)任意角度的轉(zhuǎn)化和計(jì)算,也能夠真實(shí)的直觀的反應(yīng)兩點(diǎn)之間的障礙物等,還能夠?qū)崿F(xiàn)模擬飛行路線,為作戰(zhàn)指揮帶來(lái)極大的便利。在計(jì)算機(jī)中進(jìn)行三維重建目前的熱點(diǎn)和難點(diǎn)問(wèn)題主要是計(jì)算機(jī)視覺(jué)研究領(lǐng)域。在圖像壓縮、識(shí)別以及分割方面,目前已取得很大的研究進(jìn)展,目前圖像處理面臨的新的問(wèn)題主要是圖像專業(yè)壓縮算法、圖像識(shí)別算法等。
4 結(jié)束語(yǔ)
綜上所述,本文先分析了數(shù)字圖像處理技術(shù)研究現(xiàn)狀和主要的應(yīng)用領(lǐng)域,進(jìn)而研究數(shù)字圖像技術(shù)的發(fā)展趨勢(shì)。目前數(shù)字圖像處理技術(shù)已廣泛的應(yīng)用在生活中,如在網(wǎng)絡(luò)、手機(jī)等中的應(yīng)用,數(shù)字圖像處理技術(shù)的發(fā)展與人們的生活息息相關(guān),隨著技術(shù)的不斷發(fā)展,數(shù)字圖像處理技術(shù)還會(huì)不斷得到進(jìn)步,這些還需要更多的人努力去研究。
參考文獻(xiàn):
[1]孔大力,崔洋.數(shù)字圖像處理技術(shù)的研究現(xiàn)狀與發(fā)展方向[J].山東水利職業(yè)學(xué)院院刊,2012(04):11-14.
[2]陳炳權(quán),劉宏立,孟凡斌.數(shù)字圖像處理技術(shù)的現(xiàn)狀及其發(fā)展方向[J].吉首大學(xué)學(xué)報(bào)(自然科學(xué)版),2009(01):63-70.
[3]呂戈靜.淺談數(shù)字圖像處理技術(shù)的現(xiàn)狀及發(fā)展[J].電腦知識(shí)與技術(shù),2012(33):8035-8036.
[4]丁可.數(shù)字圖像處理技術(shù)研究與發(fā)展方向[J].經(jīng)濟(jì)研究導(dǎo)刊,2013(18):246+270.
關(guān)鍵詞:圖像識(shí)別;SURF算法;特征點(diǎn);魯棒性
中圖分類號(hào):TP391 文獻(xiàn)標(biāo)志碼:A
圖像識(shí)別,是利用計(jì)算機(jī)對(duì)圖像進(jìn)行處理、分析和理解,以識(shí)別各種不同模式的目標(biāo)和對(duì)像的技術(shù)。圖像的局部不變特征有著在多種圖像變換(如光照變換,幾何變換等)下的不變性、獨(dú)特性、低冗余性以及無(wú)需預(yù)先對(duì)圖像分割等特點(diǎn),已經(jīng)被廣泛應(yīng)用于圖像匹配領(lǐng)域?;谔卣鞑蛔兊姆椒ň哂芯雀?、執(zhí)行速度快、壓縮信息量和魯棒性好等優(yōu)點(diǎn)。尺度不變特征轉(zhuǎn)換(Scale-invariant feature transform,SIFT)算法便是其中的代表,該算法由David Lowe于1999年在ICCV上提出,并于2004年完善總結(jié)。SIFT算法匹配能力較強(qiáng),能提取穩(wěn)定的特征,可以處理兩幅圖像之間發(fā)生平移、旋轉(zhuǎn)、仿射變換、視角變換和光照變換等情況下的匹配問(wèn)題,但該算法數(shù)據(jù)量大,復(fù)雜度高,耗時(shí)長(zhǎng),同時(shí)也存在著特征提取及匹配速度慢,在灰度變化相似的區(qū)域容易產(chǎn)生誤匹配的缺陷,限制了該算法的應(yīng)用。SURF算法是針對(duì)SIFT算法的不足而改進(jìn)的一種有效算法。
1SURF算法描述
快速魯棒特征[1](Speeded-up Robust Features,SURF)是一種高魯棒性的局部特征點(diǎn)檢測(cè)器,由Herbert Bay等人于2006年在ECCV上提出的。該算法比SIFT更快更加具有魯棒性,對(duì)圖像分辨率、旋轉(zhuǎn)、尺度縮放、平移和亮度變化等保持不變,而且對(duì)仿射變換、噪聲以及視角變化等也能保持一定程度的穩(wěn)定性。
SURF算法的基本流程主要包括:特征點(diǎn)檢測(cè)、特征點(diǎn)描述和特征點(diǎn)匹配三部分。該算法中有三個(gè)關(guān)鍵技術(shù),分別為:使用積分圖像完成圖像卷積操作,減少了時(shí)間計(jì)算的復(fù)雜度,提高計(jì)算速度;采用基于Hessian矩陣的檢測(cè)器檢測(cè)特征值,其在可重復(fù)性和穩(wěn)定性方面都優(yōu)于基于HarTis的檢測(cè)器;采用Haar小波作為特征描述子,Harr特征速度快,能夠減少計(jì)算時(shí)間并增加魯棒性。
1.1積分圖像
積分圖像是一種對(duì)原始圖像的特征表示方法。對(duì)于一幅灰度的圖像,積分圖像中的任意一點(diǎn)(x,y)的值是指從圖像的左上角到這個(gè)點(diǎn)所構(gòu)成的矩形區(qū)域內(nèi)所有的點(diǎn)的灰度值之和[2]。圖1所示填充區(qū)域即為點(diǎn)(x,y)的積分值。
1.2尺度空間的建立
圖像的尺度空間是在視覺(jué)信息(圖像信息)處理模型中引入一個(gè)被視為尺度的參數(shù),通過(guò)連續(xù)變化尺度參數(shù)獲得不同尺度下的視覺(jué)處理信息,然后綜合這些信息以深入地挖掘圖像的本質(zhì)特征。一幅圖像的尺度空間可定義為原始圖像與高斯核的卷積運(yùn)算,圖像的尺度大小可以用高斯標(biāo)準(zhǔn)差來(lái)表示[3]。在計(jì)算機(jī)視覺(jué)領(lǐng)域, 尺度空間被表示為一個(gè)圖像金字塔。在SIFT算法中,輸入圖像函數(shù)反復(fù)與高斯函數(shù)的核卷積并反復(fù)對(duì)其進(jìn)行二次抽樣,但因?yàn)槊繉訄D像依賴于前一層圖像, 并且需要重設(shè)圖像尺寸,所以使得運(yùn)算量較大。SURF算法與SIFT算法在使用金字塔原理上的不同之處在于SURF算法申請(qǐng)?jiān)黾訄D像核的尺寸,允許尺度空間的多層同時(shí)被處理,并且不需要對(duì)圖像進(jìn)行二次抽樣, 從而提高了算法性能。同時(shí)SURF算法采用了尺度插值和3*3*3的非極值抑制方法以提取尺度不變的特征點(diǎn)。圖2中A圖是運(yùn)用傳統(tǒng)方式建立的一個(gè)圖像金字塔結(jié)構(gòu),運(yùn)算會(huì)反復(fù)使用高斯函數(shù)對(duì)子層進(jìn)行平滑處理, 且圖像的尺寸是變化的。B圖的SURF算法保持原始圖像不變而只是改變?yōu)V波器的大小。
1.3Hessian特征檢測(cè)
2算法實(shí)現(xiàn)
根據(jù)SURF算法的基本原理,設(shè)計(jì)算法的實(shí)現(xiàn)過(guò)程。首先通過(guò)視頻采集設(shè)備獲取模板圖像,并對(duì)其建立積分圖像和構(gòu)建尺度空間結(jié)構(gòu),再通過(guò)視頻采集設(shè)備捕捉當(dāng)前視頻幀,然后檢測(cè)出模板圖像及當(dāng)前視頻幀的特征點(diǎn), 并保存每個(gè)特征點(diǎn)各項(xiàng)特性的描述信息,最后比較模板圖像與當(dāng)前幀圖像特征點(diǎn)的描述子信息進(jìn)行圖像匹配。
3OpenCV技術(shù)
OpenCV(Open Source Computer Vision Library)[5]于1999年由Intel建立,是一個(gè)基于(開(kāi)源)發(fā)行的跨平臺(tái)計(jì)算機(jī)視覺(jué)庫(kù),可以運(yùn)行在Linux、Windows和Mac OS操作系統(tǒng)上。OpenCV輕量級(jí)而且高效,由一系列C函數(shù)和少量C++類構(gòu)成, 實(shí)現(xiàn)了計(jì)算機(jī)視覺(jué),圖像處理和模式識(shí)別等方面的很多通用算法。
OpenCV為Intel公司的Integrated Performance Primitives(IPP)提供了透明接口,這意味著如果有為Intel處理器優(yōu)化的IPP庫(kù),OpenCV將在運(yùn)行時(shí)自動(dòng)加載這些庫(kù)。OpenCV致力于真實(shí)世界的實(shí)時(shí)應(yīng)用,通過(guò)優(yōu)化的C代碼的編寫對(duì)其執(zhí)行速度帶來(lái)了可觀的提升,編寫程序過(guò)程中調(diào)用OpenCV的基礎(chǔ)函數(shù)庫(kù), 即可完成十分復(fù)雜的開(kāi)發(fā)任務(wù), 極大的提高開(kāi)發(fā)效率。
3.1OpenCV的特點(diǎn)
1) 跨平臺(tái),Windows,Linux,Mac OS;
2) 免費(fèi),開(kāi)源;
3) 代碼經(jīng)過(guò)優(yōu)化,可用于實(shí)時(shí)處理圖像;
4) 統(tǒng)一的結(jié)構(gòu)和功能定義;
5) 強(qiáng)大的矩陣運(yùn)算和圖像處理能力;
6) 具有底層和高層的應(yīng)用開(kāi)發(fā)包;
7) 用戶接口方便靈活。
3.2OpenCV的功能
1) 對(duì)圖像數(shù)據(jù)的操作,包括分配、釋放、復(fù)制和轉(zhuǎn)換數(shù)據(jù)。
2) 具有對(duì)矩陣和向量的操作以及線性代數(shù)的算法程序,包括矩陣、解方程,特征值以及奇異值。
3) 具有基本的數(shù)字圖像處理能力,如可進(jìn)行濾波、邊緣檢測(cè)、角點(diǎn)檢測(cè)、采樣與差值、色彩轉(zhuǎn)換、形態(tài)操作、直方圖和圖像金字塔等操作。
4) 對(duì)運(yùn)動(dòng)的分析,如對(duì)光流、運(yùn)動(dòng)分割和跟蹤的分析。
5) 對(duì)目標(biāo)的識(shí)別,可采用特征法和隱馬爾科夫模型(HMM)法。
6) 具有基本的GUI功能,包括圖像與視頻顯示、鍵盤和鼠標(biāo)事件處理及滾動(dòng)條等。
3.3OpenCV模塊
1) CV核心函數(shù)庫(kù),實(shí)現(xiàn)圖像處理,結(jié)構(gòu)分析,運(yùn)動(dòng)分析,對(duì)象識(shí)別,攝像機(jī)標(biāo)定和3D重構(gòu)等功能。
2) CVAUX輔助函數(shù)庫(kù),實(shí)現(xiàn)通過(guò)立體視覺(jué)來(lái)實(shí)現(xiàn)的動(dòng)作識(shí)別,基于輪廓線的形狀匹配,模式識(shí)別,紋理描述等功能。
3) CXCORE數(shù)據(jù)結(jié)構(gòu)與線性代數(shù)庫(kù),實(shí)現(xiàn)數(shù)據(jù)變換,矩陣運(yùn)算等功能。
4) HIGHGUI圖像界面函數(shù)庫(kù),實(shí)現(xiàn)圖像獲取,用戶界面設(shè)計(jì)等功能。
5) ML機(jī)器學(xué)習(xí)函數(shù)庫(kù),包括模式分類和回歸分析等。
4Android上的系統(tǒng)實(shí)現(xiàn)
Android是基于Linux開(kāi)放性內(nèi)核的操作系統(tǒng),是Google公司在2007年l1月5日公布的手機(jī)操作系統(tǒng)。Android采用軟件堆層的架構(gòu),主要分三部分:底層以Linux核心為基礎(chǔ),提供基本功能;中間層包括函數(shù)庫(kù)和虛擬機(jī);最上層是各種應(yīng)用軟件。Android應(yīng)用程序用Java語(yǔ)言編寫。每個(gè)應(yīng)用程序都擁有一個(gè)獨(dú)立的Dalvik虛擬機(jī)實(shí)例,這個(gè)實(shí)例駐留在一個(gè)由Linux內(nèi)核管理的進(jìn)程中[6]。
在Android系統(tǒng)上使用OpenCV來(lái)實(shí)現(xiàn)該系統(tǒng),需利用JNI編寫相應(yīng)的本地代碼組件并通過(guò)Android NDK工具集將其嵌入到Android應(yīng)用程序中。首先,利用Android應(yīng)用程序框架編寫相應(yīng)的Java代碼;然后通過(guò)JNI與OpenCV提供的函數(shù)編寫本地C/C++代碼,并使用Android NDK將本地代碼文件編譯生成可由Java代碼調(diào)用的共享庫(kù)(動(dòng)態(tài)鏈接庫(kù)),最后通過(guò)SDK生成完整的Android應(yīng)用程序[7]。
4.1JNI
JNI(Java Native Interface),即JAVA本地調(diào)用。它允許Java代碼和其他語(yǔ)言編寫的代碼進(jìn)行交互。
5結(jié)論
本文提出了一種基于SURF算法的圖像識(shí)別方法,并運(yùn)用此方法實(shí)現(xiàn)了一套基于Android平臺(tái)的圖像識(shí)別系統(tǒng)。由于系統(tǒng)需要進(jìn)行大量的圖像處理運(yùn)算, 因此通過(guò)使用Android NDK調(diào)用OpenCV圖像處理函數(shù)庫(kù)以提高編程效率,。系統(tǒng)通過(guò)手機(jī)攝像頭提取視頻幀, 并使用SURF算法對(duì)其進(jìn)行快速魯棒特征檢測(cè)。實(shí)驗(yàn)結(jié)果表明, 該方法復(fù)雜度低、實(shí)時(shí)性好并且具有良好的魯棒性,將系統(tǒng)用于移動(dòng)設(shè)備圖像識(shí)別加密,以及視頻監(jiān)控等方面,會(huì)使其擁有更好的識(shí)別效率和可靠性。
參考文獻(xiàn):
[1]彭欣,劉富強(qiáng),宋華軍.基于SURF目標(biāo)跟蹤算法研究[J].長(zhǎng)春理工大學(xué)學(xué)報(bào), 2011,34(2):138-141.
[2]徐秀云.基于特征點(diǎn)的景象匹配技術(shù)研究[D].南京:南京理工大學(xué),2009:1-68.
[3]高健, 黃心漢, 彭剛,等. 一種簡(jiǎn)化的SIFT圖像特征點(diǎn)提取算法[J].計(jì)算機(jī)應(yīng)用研究,2008,25(7):2 213-2 215.
[4]VASILEIOS K,CHRISTOPHOROS NIKOU,ARISTIDIS LIKAS.Visual Tracking by Adaptive Kalman Filtering and Mean Shift[J].Springer-Verlag Berlin Heidelberg,2010,6040:153-162.
[5]黎松,平西定,丁益洪.開(kāi)放源代碼的計(jì)算機(jī)視覺(jué)類庫(kù)OpenCV的應(yīng)用[J].計(jì)算機(jī)應(yīng)用與技術(shù),2005,22(8):134-136.
[6]韓超,梁泉.Android系統(tǒng)原理及開(kāi)發(fā)要點(diǎn)詳解[M]北京:電子工業(yè)出版社,2010:70-93.
[7]韓露.一種Java與OpenCV結(jié)合實(shí)現(xiàn)的目標(biāo)檢測(cè)模塊[J].計(jì)算機(jī)應(yīng)用,2008(3):773-775.
[8]HUIYU ZHOU,YUAN YUAN,CHUNMEI SHI.Object tracking using SIFT features and mean shift[J]. Computer Vision and Image Understanding,2009,113:345-352.
[9]HERBERT BAY, ANDREAS ESS, TINNE TUYTELAARS,et al.Speeded-Up Robust Features(SURF)[J].Preprint submitted to Elsevier,2008:233-245.
[10]TA D N CHEN,W C GELFAND,N PULLI K.SURFTrac:Efficient Tracking and Continuous Object Recognition using Local Feature Descriptors[C]//Coumputer Vision and Pattern Recognition(CVPR'09),2009:2 937-2 943.
[11]紀(jì)華,吳元昊,孫宏海,等.結(jié)合全局信息的SIFT特征匹配算法[J].光學(xué)精密工程,2009,17(2):439-444.
[12]CHAVES A,GUSTAFUSON D.Vision——Based Obstacle Avoidance Using SIFT Features[C]//Proceedings of the 5th International Symposium on Advances in Visual Computing.2009:550-557.
[13]公磊,周聰.基于Android的移動(dòng)終端應(yīng)用程序開(kāi)發(fā)與研究[J].計(jì)算機(jī)與現(xiàn)代化,2008(8):85-89.
本文深入地分析了當(dāng)前實(shí)施人臉檢測(cè)技術(shù)的可行性,并對(duì)本方案實(shí)施的優(yōu)勢(shì)進(jìn)行了概括。
【關(guān)鍵詞】人臉檢測(cè)技術(shù) 計(jì)算機(jī)技術(shù) 識(shí)別技術(shù)
1 人臉檢測(cè)的前景
人臉檢測(cè)作為近年來(lái)生物識(shí)別領(lǐng)域的一個(gè)熱門研究方向,具有操作方便,用戶易于接受,事后追蹤能力強(qiáng)等優(yōu)點(diǎn)。但是因?yàn)槿四槞z測(cè)與識(shí)別運(yùn)行的過(guò)程往往需要大量的運(yùn)算,并且其算法并不簡(jiǎn)單,因此目前大部分人臉檢測(cè)與識(shí)別系統(tǒng)的設(shè)計(jì)與開(kāi)發(fā)都需要立足于計(jì)算機(jī)技術(shù)。下面筆者將會(huì)對(duì)以計(jì)算機(jī)平臺(tái)為基礎(chǔ)的人臉檢測(cè)的實(shí)現(xiàn)過(guò)程展開(kāi)詳細(xì)的論述與分析。
2 相關(guān)技術(shù)研究現(xiàn)狀
2.1 人臉圖像的獲取與預(yù)處理
一般情況下,攝像頭負(fù)責(zé)對(duì)人臉圖像的攝取,除此之外,專門的圖像庫(kù)也是人臉圖像的來(lái)源之一。前者多應(yīng)用于系統(tǒng)的應(yīng)用階段,一般來(lái)說(shuō),它不僅僅可以作為應(yīng)用系統(tǒng)存在,也可以作為研究系統(tǒng)存在;而后者多應(yīng)用于研究階段,并且它只能作為研究系統(tǒng)存在,是基于標(biāo)準(zhǔn)人臉圖像庫(kù)而存在的。
獲得需要的圖像之后,接下來(lái)就要對(duì)圖像進(jìn)行預(yù)處理,這一環(huán)節(jié)對(duì)于人臉檢測(cè)與識(shí)別系統(tǒng)的應(yīng)用來(lái)說(shuō),是非常關(guān)鍵的。在獲取圖像的過(guò)程中,會(huì)受到外部復(fù)雜環(huán)境的影響,例如燈光亮度、配套設(shè)施好壞、噪聲干擾、對(duì)比不明顯等等。并且,由于距離與焦距存在的差異,導(dǎo)致無(wú)法確定人臉?biāo)幍木咧?。因此,圖像預(yù)處理這一環(huán)節(jié)是必不可少的,有了這一環(huán)節(jié)才能確保圖像上人臉?biāo)幬恢门c大小比較恰當(dāng)。人臉?lè)稣⑷四槇D像增強(qiáng)及其幾何歸一化和灰度歸一化等都是圖像預(yù)處理環(huán)節(jié)主要的工作內(nèi)容。而圖像變換增強(qiáng)、直方圖均衡法、非線性平滑濾波、圖像的歸一化等則是圖像預(yù)處理過(guò)程之中所運(yùn)用的主要方法。
2.2 人臉檢測(cè)技術(shù)
人臉識(shí)別是否能夠具有較好的識(shí)別性能,取決于人臉檢測(cè)的性能水平的高低,因此可以說(shuō),人臉檢測(cè)是人臉識(shí)別得以實(shí)現(xiàn)的前提條件。借助人臉檢測(cè)算法技術(shù),檢查并測(cè)驗(yàn)靜態(tài)圖像(動(dòng)態(tài)視頻幀),從而準(zhǔn)確的對(duì)此圖像(視頻)進(jìn)行判斷,從而知道此圖像是否具有人臉圖像,假若判斷此圖像具有人臉圖像,則需要明確其所處區(qū)域及圖像數(shù)值大小,這就是人臉檢測(cè)。高效率與檢測(cè)精準(zhǔn)是用戶對(duì)人臉檢測(cè)的一個(gè)普遍性評(píng)價(jià),現(xiàn)如今這項(xiàng)技術(shù)已經(jīng)獲得了用戶的認(rèn)可,專家學(xué)者也對(duì)其展開(kāi)了更深入的分析研究。
人臉圖像所囊概的特征是非常豐富的,例如膚色、人的輪廓、結(jié)構(gòu)等特征都是極具代表性的,此外其系列圖像往往還會(huì)涉及到一些其他信息,例如運(yùn)動(dòng)狀態(tài)等?;谶@些特征信息,研究者設(shè)計(jì)了許多人臉識(shí)別的檢測(cè)算法,按照這些方法的思想策略大致可將人臉檢測(cè)方法分為4類:基于知識(shí)的方法、基于模塊匹配的方法、基于外觀形狀的方法和基于特征的方法。
2.3 人臉識(shí)別技術(shù)
借助對(duì)相應(yīng)的人臉識(shí)別算法的運(yùn)用,辨別出圖像上的人臉的身份信息,第一步是對(duì)圖像進(jìn)行搜索,從而找出圖像上的人臉目標(biāo),然后識(shí)別人臉目標(biāo)體的身份信息,這就是人臉識(shí)別。
以人臉識(shí)別技術(shù)的發(fā)展?fàn)顩r作為劃分的依據(jù),研究工作往往將人臉識(shí)別技術(shù)劃分為四種類別,分別為:其一是幾何特征為基礎(chǔ)的;其二是以統(tǒng)計(jì)特征為基礎(chǔ)的;其三是以機(jī)器靴子為基礎(chǔ)的;其四是以局部模式為基礎(chǔ)的;
3 選擇的硬件平臺(tái)
3.1 圖像輸入
人臉圖像的輸入部分可以是普通的USB攝像機(jī)、網(wǎng)絡(luò)攝像機(jī)等,也可以將已經(jīng)拍攝好的圖像存儲(chǔ)在硬盤等存儲(chǔ)設(shè)備。因此其應(yīng)用往往不會(huì)受限于特定的場(chǎng)所。
如果攝像機(jī)選擇的性能比較差一些,會(huì)增加后面算法的復(fù)雜度;此外還會(huì)對(duì)人臉檢測(cè)與識(shí)別的最終效果造成一定的影響;為了提高系統(tǒng)的性能,所以應(yīng)該選擇性能比較好,產(chǎn)生的相片噪聲比較小的相機(jī)。
3.2 中央處理
本方案中的中央處理部分選取的是計(jì)算機(jī)的CPU;因?yàn)楝F(xiàn)在CPU的功能強(qiáng)大,再加上良好的微軟系統(tǒng),使得系統(tǒng)的性能大大的提升。
作為系統(tǒng)的中心處理部分,應(yīng)該選擇一臺(tái)專門的服務(wù)器來(lái)處理圖像的檢測(cè)和識(shí)別。這是由于圖像往往需要占據(jù)大量的內(nèi)存,在實(shí)施算法的過(guò)程之中會(huì)耗用較多的資源。
4 檢測(cè)系統(tǒng)的組成
4.1 計(jì)算機(jī)視覺(jué)庫(kù)OpenCV的介紹
Open CV是計(jì)算機(jī)視覺(jué)庫(kù),它是跨平臺(tái)的,并且以(開(kāi)源)發(fā)行為基礎(chǔ),能夠在很多操作系統(tǒng)上運(yùn)用,例如Linux、Windows、Mac OS,其具有的C函數(shù)跨平臺(tái)的中、高層API高達(dá)五百個(gè)。由于其有著豐富的視覺(jué)處理算法,因此在數(shù)字圖像處理領(lǐng)域之中的運(yùn)用非常普遍,例如物體、人體、人臉等的識(shí)別。本文后面分析工作的開(kāi)展都是以O(shè)pen CV計(jì)算機(jī)視覺(jué)庫(kù)為基礎(chǔ)的。
4.2 人臉圖像采集模塊
原始的人臉圖像一般是在用戶注冊(cè)時(shí)采集的,一般會(huì)在幾副到十幾幅之間, 且采集到的這些人臉圖像需包含該人臉的不同的表情和多種姿態(tài)。人臉采集是人臉檢測(cè)的第一個(gè)步驟,筆者在前文現(xiàn)狀分析的基礎(chǔ)上,為使人臉檢測(cè)更加精確,結(jié)合了人眼與人臉檢測(cè)兩種技術(shù)。成功獲取人臉圖像后將會(huì)步入圖像預(yù)處理這一步驟,相應(yīng)的工作內(nèi)容不再贅述。
當(dāng)然進(jìn)行人臉識(shí)別時(shí)的圖像采集工作也是由此模塊來(lái)完成,采集完需要進(jìn)行歸一化、圖像均衡、灰度化、直方圖增強(qiáng)等預(yù)處理,之后根據(jù)當(dāng)前處于訓(xùn)練階段還是識(shí)別階段將其送入人臉特征提取模塊。
4.3 人臉特征提取模塊
這一模塊的主要工作是提取人臉圖片的特征,隨后開(kāi)展降維處理,最終在數(shù)據(jù)庫(kù)之中錄入該特征,方便人臉圖像識(shí)別模塊對(duì)圖像的識(shí)別。在前文人臉識(shí)別技術(shù)研究現(xiàn)狀分析的基礎(chǔ)上,筆者認(rèn)為此模塊工作的開(kāi)展,首先可以采取人臉區(qū)域先分塊再提取特征的方法。
4.4 人臉圖像識(shí)別模塊
人臉識(shí)別系統(tǒng)的好壞很大程度上取決于人臉識(shí)別的設(shè)計(jì)水平與其所挑選的計(jì)算方法,因此可以說(shuō),人臉識(shí)別系統(tǒng)的關(guān)鍵在于人臉識(shí)別?,F(xiàn)如今,以小波分析為基礎(chǔ)、以視覺(jué)聯(lián)想為基礎(chǔ)、以人臉表情為基礎(chǔ)的人臉識(shí)別技術(shù)是運(yùn)用最普遍的。因此,本文的關(guān)鍵點(diǎn)就在于此,要查閱相關(guān)資料,從而挑選出最恰當(dāng)?shù)乃惴ā?/p>
5 結(jié)論
我們以O(shè)penCV和計(jì)算機(jī)為平臺(tái),對(duì)人臉圖像的預(yù)處理、人臉圖像的特征提取和人臉圖像的識(shí)別算法進(jìn)行仿真分析和優(yōu)化。這樣,我們就可以充分利用人臉識(shí)別現(xiàn)有的算法,并進(jìn)行優(yōu)化,來(lái)實(shí)現(xiàn)快速高效的檢測(cè)和識(shí)別系統(tǒng)。
參考文獻(xiàn)
[1]朱文佳,戚飛虎.快速人臉檢測(cè)與特征定位 [J].中國(guó)圖像圖形學(xué)報(bào),2005,10(11):1455-1458.
[2]王志良,孟秀艷.人臉工程學(xué)[M].北京:機(jī)械工業(yè)出版社,2008.
作者簡(jiǎn)介
宋家慧(1978-),女,山東省蒼山縣人。大學(xué)本科學(xué)歷?,F(xiàn)為廣西機(jī)電職業(yè)技術(shù)學(xué)院講師。研究方向?yàn)橛?jì)算機(jī)應(yīng)用、數(shù)據(jù)庫(kù)應(yīng)用和數(shù)據(jù)挖掘。
關(guān)鍵詞:運(yùn)動(dòng)目標(biāo)跟蹤;生成方法;圖像感知哈希;OPENCV
中圖分類號(hào):TP392 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2016)14-0179-03
隨著計(jì)算機(jī)信息技術(shù)的發(fā)展,計(jì)算機(jī)視覺(jué)已經(jīng)成為研究熱點(diǎn)之一,運(yùn)動(dòng)目標(biāo)跟蹤更是計(jì)算機(jī)視覺(jué)領(lǐng)域的熱門課題。如今運(yùn)動(dòng)目標(biāo)跟蹤技術(shù)已經(jīng)廣泛用于監(jiān)控、交通、軍事、醫(yī)療的等領(lǐng)域。視頻是一幀一幀連續(xù)播放的圖像序列,目標(biāo)跟蹤是指從視頻的某一幀開(kāi)始,通過(guò)目標(biāo)檢測(cè)方法找到到運(yùn)動(dòng)目標(biāo)或者人工指定跟蹤目標(biāo),在之后的連續(xù)圖像序列中持續(xù)對(duì)目標(biāo)進(jìn)行識(shí)別和跟蹤。
目標(biāo)跟蹤方法通常分為判別方法和生成方法兩種。判別方法把跟蹤看成一個(gè)二分類的問(wèn)題:以目標(biāo)物體作為正樣本,背景作為負(fù)樣本,通過(guò)訓(xùn)練分類器可以把目標(biāo)從背景中分離出來(lái),從而實(shí)現(xiàn)對(duì)目標(biāo)的跟蹤。目前很多判別方法提出,其中STRUCK是判別方法中最杰出的[2],但是此方法需要大量的計(jì)算,速度較慢,并不能滿足實(shí)時(shí)跟蹤的需求。生成方法首先學(xué)習(xí)外觀模型來(lái)表示目標(biāo),然后在搜索區(qū)域的候選模型中選擇出與目標(biāo)模型誤差最小的一個(gè)作為跟蹤結(jié)果。生成方法最早可以追溯到Lucas和Kanade提出的基于原始圖像的整體模板法,即LK方法。僅僅使用原始圖像作為模板,不能很好地提取目標(biāo)外觀特征,適應(yīng)目標(biāo)外觀變化,且需要的計(jì)算量較大。Hager和Belhumeur 等人改進(jìn)了LK方法,對(duì)原始圖像進(jìn)行降維,使用對(duì)光照不敏感的低維特征作為目標(biāo)外觀的表示。在此基礎(chǔ)上,Black和Jepson又提出了使用一定的學(xué)習(xí)策略進(jìn)行模型更新,從而更好的處理目標(biāo)外觀的變化。此時(shí)生成跟蹤方法的框架已經(jīng)形成。隨后很多模型的不同特征被用于跟蹤。如Comaniciu人等結(jié)合顏色直方圖和數(shù)學(xué)上的均值偏移方法,提出了meanshift方法。Collins 拓展了可自適應(yīng)尺度變換的改進(jìn)方法camshift。為了更好的處理遮擋和提升實(shí)時(shí)性能,局部稀疏表示(PCA、稀疏編碼等)和多種特征的聯(lián)合表示也被用于目標(biāo)跟蹤。[1][2]
跟蹤的過(guò)程中會(huì)出現(xiàn)眾多的干擾因素影響跟蹤的性能,如尺度變換,光照變化,偏移,遮擋等問(wèn)題。處理這些因素的關(guān)鍵在于構(gòu)造有效且魯棒的外觀表示模型。文獻(xiàn)[1]證明了模型表示的選擇對(duì)于跟蹤性能的影響最大。于是近些年來(lái),跟蹤問(wèn)題更多的焦點(diǎn)集中在尋找有效的表示模型上。本文提出了一個(gè)有效的生成方法,使用圖像感知哈希作為模型表示進(jìn)行跟蹤,
具有尺度不變性和運(yùn)算速度快的優(yōu)點(diǎn),并且引入了模型更新策略,從而解決了目標(biāo)跟蹤中出現(xiàn)的偏移、遮擋問(wèn)題。
1圖像感知哈希
感知哈希是指將具有相同感知內(nèi)容的多媒體信息映射為一段數(shù)字摘要,用來(lái)對(duì)媒體信息進(jìn)行比對(duì)。圖像感知哈希則是對(duì)數(shù)字圖像的感知信息進(jìn)行摘要。傳統(tǒng)的哈希技術(shù)僅僅簡(jiǎn)單地把圖片看作一個(gè)二進(jìn)制文件進(jìn)行處理,而沒(méi)有考慮到圖像上的感知信息。隨著網(wǎng)絡(luò)上有損壓縮格式的使用,傳統(tǒng)的哈希算法如MD5、SHA1等方式不再適用于圖片的匹配,于是提出了圖像感知哈希技術(shù),利用的圖片的感知特征作為摘要信息來(lái)進(jìn)行圖像的識(shí)別和認(rèn)證[4]。
在MD5、SHA1這樣的加密哈希方法中,得到的哈希值僅僅是一段固定長(zhǎng)度的二進(jìn)制數(shù)字,和其本身的內(nèi)容沒(méi)有關(guān)系。單向性和抗碰撞性要求它對(duì)輸入的二進(jìn)制數(shù)據(jù)的比特變化敏感,也就是說(shuō),即使輸入數(shù)據(jù)一位的比特變化,也會(huì)導(dǎo)致輸出哈希值的明顯的隨機(jī)變化。
對(duì)于數(shù)字圖像而言,圖像數(shù)據(jù)格式的變化,普通的圖像潤(rùn)飾或者加工操作,圖像通信的信道噪聲等在劇烈改變圖像二進(jìn)制數(shù)據(jù)的同時(shí),一般都只會(huì)影響圖像呈現(xiàn)信息的質(zhì)量,而不會(huì)改變其內(nèi)容。因此大部分感知哈希算法都具有共同的基本特性:圖像可以放大縮小,可以有不同的方向、角度,甚至可以有細(xì)微的顏色差別,其哈希值都應(yīng)該保持不變或者在一個(gè)指定的閾值內(nèi)變化。而以上的特性也正好適用于目標(biāo)跟蹤中用來(lái)匹配目標(biāo)。
2提出的算法
近些年來(lái),已經(jīng)有很多不同的圖像感知哈希算法提出[5]。其中包含很多復(fù)雜的甚至可以加密的方法,但是經(jīng)測(cè)試,即使將很簡(jiǎn)單的感知哈希算法作為特征使用到跟蹤中,也能起到很好的效果。
2.1模型表示
本文中采取的感知哈希作為跟蹤目標(biāo)的模型表示,計(jì)算方法如下:
1)將原圖像轉(zhuǎn)化為灰度圖,灰度圖就可以很好的保存圖像輪廓和細(xì)節(jié),減少計(jì)算量,提高速度。
2)縮小圖像尺寸,把原大小轉(zhuǎn)化為8*8的方形圖像??s小尺寸可以大幅度減少圖像的高頻信息,保留低頻信息。低頻信息反映了圖像的整體框架,具有對(duì)放大、縮小、平移、模糊的不變性,這也是圖像哈希可以作為目標(biāo)跟蹤匹配特征的關(guān)鍵原因。
3)計(jì)算所有像素灰度的平均值,用于和每個(gè)像素比較。
4)將所有的像素值與平均值進(jìn)行對(duì)比,大于等于平均值記為1,小于平均值記為0。
5)把這64個(gè)2進(jìn)制位由在原圖像從左到右從上到下的順序排列,形成哈希值。
以Lena圖為例,計(jì)算圖像感知哈希的步驟如圖1所示:
2.2 運(yùn)動(dòng)模型和觀察模型
跟蹤算法使用圖像感知哈希作為模型特征,以兩個(gè)哈希值之間的漢明距離作為評(píng)判相似度的標(biāo)準(zhǔn)(觀察模型)。漢明距離表示哈希值中對(duì)應(yīng)位置二進(jìn)制位不同的個(gè)數(shù),漢明距離越大,說(shuō)明圖像越不相似,反之則越相似。
漢明距離的計(jì)算:d(x,y)=∑x[i]y[i],如下所示。
由[1]我們得知,在選取合適特征情況下,即便是用很簡(jiǎn)單的跟蹤框架也能夠?qū)崿F(xiàn)很好的跟蹤效果。本系統(tǒng)在第一幀使用人工標(biāo)注的方法圈定要跟蹤的目標(biāo),之后的每一幀使用滑動(dòng)窗口作為運(yùn)動(dòng)模型搜尋目標(biāo):在當(dāng)前目標(biāo)2*2的范圍內(nèi)尋找目標(biāo),使用漢明距離作為觀察模型來(lái)從候選的模型中選取最接近目標(biāo)的一個(gè)。如圖2。
2.3偏移問(wèn)題
在模型更新的過(guò)程中,由于誤差積累,會(huì)導(dǎo)致跟蹤結(jié)果偏移。對(duì)于此問(wèn)題,本算法采取使用第一幀和上一幀的權(quán)重共同跟蹤的方法,第t幀的模型M(t)=αM(0)+(1-α)M(t-1),其中α表示第一幀中目標(biāo)模型所占的權(quán)重。隨著時(shí)間變化,第一幀的權(quán)重應(yīng)逐漸減小。本方法中取α=1/(1+t)。
2.4 遮擋問(wèn)題
當(dāng)模型被遮擋時(shí),如果繼續(xù)更新,會(huì)導(dǎo)致更新到覆蓋物更新到了錯(cuò)誤的模型。所以本方法中的模型更新針對(duì)遮擋也提出了解決方法。d(h)表示漢明距離,當(dāng)0
2.5算法流程
1)在視頻的某一幀使用鼠標(biāo)拖拽圈定要跟蹤的目標(biāo),作為模型T,大小為p*q,左上角像素的位置為(m,n)。
2)計(jì)算選中窗口區(qū)域的感知哈希值H(T)。
3)下一幀F(xiàn)中使用在當(dāng)前位置的2*2大小的窗口中滑動(dòng),計(jì)算每個(gè)大小為p*q的子窗口Fi,j的哈希值H(Fi,j)。i,j為子窗口Fi,j 左上角的像素在F圖中的坐標(biāo),稱為參考點(diǎn)。i,j的取值范圍:m-p/2
4)比較搜索窗口和模型窗口的哈希值的漢明距離D(H(T),H(Fi,j)),選取所有子窗口中漢明距離最小的子窗口作為跟蹤結(jié)果。
5)根據(jù)提出的模型更新機(jī)制決定是否將跟蹤結(jié)果Fi,j作為下一幀的跟蹤模型T,重復(fù)步驟2到步驟5。
3 基于Opencv的系統(tǒng)實(shí)現(xiàn)及仿真實(shí)驗(yàn)
Opencv是一個(gè)開(kāi)源的數(shù)字圖像處理和計(jì)算機(jī)視覺(jué)的函數(shù)庫(kù),實(shí)現(xiàn)了圖形圖像處理和計(jì)算機(jī)視覺(jué)方面的很多通用算法,方便開(kāi)發(fā)人員將注意力集中于算法的實(shí)現(xiàn)而不需要自己寫一些底層操作代碼,避免造成時(shí)間和精力上的浪費(fèi)。
Opencv提供了數(shù)組、序列、矩陣、樹(shù)等基本結(jié)構(gòu),也包含了差分方程求解、傅里葉分析、積分運(yùn)算、特殊函數(shù)等眾多高級(jí)數(shù)學(xué)計(jì)算函數(shù),以及各種圖像處理操作和目標(biāo)跟蹤、攝像機(jī)校準(zhǔn)、三維重建等高級(jí)視覺(jué)函數(shù)。本設(shè)計(jì)中的基本功能如讀取視頻,鼠標(biāo)選取操作,縮放圖像,彩色圖像轉(zhuǎn)化為灰度圖像等基本功能都由opencv提供的函數(shù)實(shí)現(xiàn)。
本設(shè)計(jì)基于windows10+visual studio 2013+opencv2.4.11環(huán)境,實(shí)現(xiàn)了在固定的背景的情況下進(jìn)行穩(wěn)健的目標(biāo)跟蹤,具有尺度不變性和光照不變性,達(dá)到不需要預(yù)先訓(xùn)練的每秒30幀以上的實(shí)時(shí)跟蹤效果。圖3為程序在第82、269、550、736幀跟蹤到的結(jié)果。
4 結(jié)論
實(shí)驗(yàn)結(jié)果表明,在目標(biāo)跟蹤中引入圖像匹配中的感知哈希方法作為跟蹤特征,有較快的運(yùn)行速度、準(zhǔn)確度和魯棒性,可以作為一種良好的特征用于目標(biāo)跟蹤。雖然與Object Tracking Benchmark[2]中排名靠前的算法相比,本設(shè)計(jì)仍然有差距,但是提出了一種將圖像感知哈希引入跟蹤的概念。近些年來(lái)還不斷有新的感知哈希算法提出,不乏兼具尺度不變性,旋轉(zhuǎn)不變性等良好特性的感知哈希算法,試想將這些方法用于運(yùn)動(dòng)目標(biāo)跟蹤,會(huì)具有更好的跟蹤效果,可作為目標(biāo)跟蹤發(fā)展的下一步研究方向。
參考文獻(xiàn):
[1] N Wang, J Shi, DY Yeung, J Jia. Understanding and Diagnosing Visual Tracking Systems[C].International Journal of Computer Vision, 2015.
[2] Wu Y, Lim J, Yang M H. Object Tracking Benchmark[J]. Pattern Analysis & Machine Intelligence IEEE Transactions on, 2015.
[3] 徐光柱,雷幫軍.實(shí)用性目標(biāo)檢測(cè)與跟蹤算法原理及應(yīng)用[M].北京,國(guó)防工業(yè)出版社, 2015.
[4] Schneider M, Shih-Fu Chang. A Robust Content based Digital Dignature for Image Authentication[C]. Proc of IEEE International Conference on Image Processing, Lausanne, 1996.
【關(guān)鍵詞】計(jì)算機(jī)技術(shù) 殘障人士 影響 發(fā)展
一 計(jì)算機(jī)技術(shù)帶給殘障人士生活上的影響
(1)對(duì)殘障人士基本生活保障
隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展,計(jì)算機(jī)已經(jīng)進(jìn)入社會(huì)生活的各個(gè)領(lǐng)域,它已經(jīng)和人們的生活息息相關(guān)。它不僅能通過(guò)計(jì)算機(jī)技術(shù)來(lái)提高工作效率、獲取需要的知識(shí)以及進(jìn)行娛樂(lè)。與此同時(shí),處于弱勢(shì)的殘疾人群體,也可以通過(guò)計(jì)算機(jī)與外界溝通、交流并獲取自己所需知識(shí)。一般情況下,殘疾人因?yàn)樾袆?dòng)不便,或者由于語(yǔ)言上的障礙不能正常的外界交流,常失去和其他人公平競(jìng)爭(zhēng)的機(jī)會(huì),這致使很多殘疾人的生活得不到保障。但是,計(jì)算機(jī)技術(shù)的發(fā)展則使他們得到了學(xué)習(xí)知識(shí)的機(jī)會(huì),通過(guò)計(jì)算機(jī)獲取相應(yīng)的知識(shí),以此來(lái)提升自身的能力,使自己的基本生活得到保障。
(2)對(duì)殘障人士學(xué)習(xí)的保障
通過(guò)計(jì)算機(jī),殘疾人可以不用行動(dòng)或通過(guò)交談就可以完成工作,他們也可以通過(guò)計(jì)算機(jī)來(lái)獲取知識(shí)從而增加自身的知識(shí)儲(chǔ)備量。殘疾人在“聽(tīng)”、“說(shuō)”、“看”、“做”等方面有著不同的缺陷,但利用計(jì)算機(jī)技術(shù)可以彌補(bǔ)他們的缺陷方面。如人機(jī)交互技術(shù):隨著語(yǔ)音識(shí)別和計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展,人機(jī)交互技術(shù)成為殘障人士克服各種障礙的重要工具。在一些殘疾人聯(lián)合會(huì),負(fù)責(zé)人通過(guò)組織肢體殘疾者學(xué)習(xí)電腦操作技術(shù),使他們可以借助高科技手段,真正的融入社會(huì)中去。殘疾人借助計(jì)算機(jī)的幫助可以使自己更加靈活的進(jìn)行工作。
(3)對(duì)殘障人士疾病輔助的保障
計(jì)算機(jī)具有速度快、精度高、可靠性高的優(yōu)點(diǎn), 通過(guò)計(jì)算機(jī)技術(shù)我們可以設(shè)計(jì)出有利于殘疾人生活的工具。在以前,輪椅要通過(guò)手來(lái)?yè)u動(dòng)或者人推動(dòng)才能移動(dòng),而現(xiàn)在通過(guò)在輪椅上安裝微型的計(jì)算機(jī),就可以通過(guò)語(yǔ)音或者預(yù)設(shè)來(lái)實(shí)現(xiàn)移動(dòng)。在這方面大大提高了殘疾人出行不便的問(wèn)題。社會(huì)上的一些患有先天性聾啞的兒童,通過(guò)對(duì)他們進(jìn)行康復(fù)訓(xùn)練,糾正他們的發(fā)音,每天記錄他們的學(xué)習(xí)情況,把記錄錄入到計(jì)算機(jī)中,然后通過(guò)一些分析軟件來(lái)進(jìn)行分析,分析出他們每天的進(jìn)步情況,以便為他們制定出更好的康復(fù)計(jì)劃。計(jì)算機(jī)給殘疾人的生活帶來(lái)各種便利,提高了他們各方面的效率,通過(guò)計(jì)算機(jī)網(wǎng)絡(luò)的鏈接,使殘疾人與社會(huì)更加的貼近,在一定的程度上擴(kuò)大了他們的生存空間。
二 計(jì)算機(jī)技術(shù)在殘障設(shè)施上的發(fā)展
(1)計(jì)算機(jī)技術(shù)在“聽(tīng)、看”方面的發(fā)展
隨著計(jì)算機(jī)技術(shù)的發(fā)展,讓盲人閱讀漢字已經(jīng)成為可能。通過(guò)掃描把文字用聲音的方式輸出,盲人最終也可以通過(guò)計(jì)算機(jī)技術(shù)來(lái)閱讀文字。如今有聽(tīng)力障礙的殘疾人有的會(huì)佩戴上人工耳蝸,人工耳蝸它是一種電子裝置,能夠幫助耳聾患者重新恢復(fù)聽(tīng)力。它的原理就是代替了已經(jīng)病變受損的聽(tīng)覺(jué)器官,把聲音通過(guò)電信號(hào)傳遞給內(nèi)耳耳蝸,刺激分布在那里的聽(tīng)覺(jué)神經(jīng),然后大腦就形成了聽(tīng)覺(jué)。而人工眼是使盲人能夠看得見(jiàn)的一個(gè)現(xiàn)代化的科技產(chǎn)品,他通過(guò)電子設(shè)備把景物拍攝下來(lái),然后傳送給人的相關(guān)神經(jīng)。這些技術(shù)的出現(xiàn)使得殘障人士的生活方式、交往方式以及思維方式都發(fā)生了很大的改變,可見(jiàn),計(jì)算機(jī)技術(shù)的發(fā)展對(duì)輔助殘障人士設(shè)施的發(fā)展產(chǎn)生了深遠(yuǎn)的影響。
(2)自然人機(jī)交互技術(shù)領(lǐng)域的發(fā)展
伴隨著計(jì)算機(jī)技術(shù)的發(fā)展,人機(jī)交互技術(shù)也取得了部分的成就,目前,自然人機(jī)交互技術(shù)的飛速發(fā)展給殘疾人帶來(lái)了很大的方便。近期自然人機(jī)交互主要研究及進(jìn)展有筆式交互、語(yǔ)音交互、基于計(jì)算機(jī)視覺(jué)技術(shù)的人機(jī)交互、基于傳感器的交互。腦電波交互、手臂機(jī)交互等比較前沿的人機(jī)交互研究也正在開(kāi)展。像肌電、腦電技術(shù)的開(kāi)展將讓肢體有障礙的人士行動(dòng)自如。20世紀(jì)70年代我國(guó)的肌電假肢得到了很好的發(fā)展,現(xiàn)在此技術(shù)已經(jīng)得到廣泛的應(yīng)用。高位截肢患者的肌肉雖然已經(jīng)被截去,但其控制運(yùn)動(dòng)的神經(jīng)系統(tǒng)還依然存在。但神經(jīng)移植術(shù)[2]為解決這一問(wèn)題開(kāi)辟了途徑,這種技術(shù)就是利用肌的信號(hào)控制多自由度假肢。還有手語(yǔ)識(shí)別和合成將會(huì)使有聽(tīng)覺(jué)障礙的患者“說(shuō)話”。手語(yǔ)識(shí)別即是指通過(guò)計(jì)算機(jī)采集設(shè)備獲得聾啞人手語(yǔ)數(shù)據(jù),采用模式識(shí)別算法,結(jié)合上下文知識(shí),獲知手語(yǔ)含義,進(jìn)而翻譯成語(yǔ)音,傳達(dá)給不懂手語(yǔ)的正常人。而手語(yǔ)合成則是一個(gè)和上述過(guò)程相反的過(guò)程,即是正常人通過(guò)語(yǔ)音表達(dá),然后計(jì)算機(jī)將語(yǔ)音翻譯成手語(yǔ)并表現(xiàn)出來(lái),向有聽(tīng)覺(jué)障礙的患者傳遞信息。這樣,有聽(tīng)覺(jué)障礙的人就可以“聽(tīng)見(jiàn)”聲音了。自然語(yǔ)言理解始終是人機(jī)交互的最重要目標(biāo),雖然目前在語(yǔ)言模型、語(yǔ)料庫(kù)、受限領(lǐng)域應(yīng)用等方面均有進(jìn)展,但由于它的難度,自然語(yǔ)言理解仍是科學(xué)家和語(yǔ)言學(xué)家的一個(gè)長(zhǎng)期研究目標(biāo)。
三、結(jié)論
綜上所述,計(jì)算機(jī)技術(shù)是一個(gè)融匯技術(shù),經(jīng)濟(jì),法律和社會(huì)工作的一門學(xué)科,從它身上不僅僅能看出對(duì)社會(huì)有巨大的價(jià)值,還能看到對(duì)殘疾人的巨大幫助。然而我國(guó)在計(jì)算機(jī)輔助殘疾人技術(shù)的開(kāi)發(fā)設(shè)計(jì)與利用服務(wù)方面還十分的落后,需要培養(yǎng)大量的的輔助技術(shù)領(lǐng)域的引領(lǐng)者,策劃者與服務(wù)者,以推動(dòng)各種高品質(zhì)的輔助技術(shù)產(chǎn)品的開(kāi)發(fā)和輔助技術(shù)服務(wù)的發(fā)展;需要通過(guò)發(fā)展高等輔助技術(shù)教育培養(yǎng)高層次研究人員,以總結(jié),完善和發(fā)展該學(xué)科的理論與技術(shù),發(fā)展輔助技術(shù)高等教育對(duì)支持殘疾人獨(dú)立生活,促使他們向生產(chǎn)性社會(huì)成員方面發(fā)展,開(kāi)發(fā)新的潛在市場(chǎng),有重大意義。我們要通過(guò)實(shí)驗(yàn)來(lái)培養(yǎng)實(shí)際的工作能力、合作精神以及嚴(yán)謹(jǐn)?shù)墓ぷ鲬B(tài)度,這樣我們才會(huì)使我國(guó)的計(jì)算機(jī)技術(shù)繼續(xù)進(jìn)步,那樣才會(huì)更大幅度的改善殘疾人的生活水平,殘疾人才會(huì)擁有更加美好的未來(lái)。計(jì)算機(jī)技術(shù)的發(fā)展,給殘疾人帶來(lái)了本質(zhì)的改變,讓他們能夠更有效的使用計(jì)算機(jī),改善了他們的生活狀況。我們相信,隨著計(jì)算機(jī)技術(shù)的不斷發(fā)展與完善,它將能為殘疾人帶來(lái)更多的便利與幫助。
參考文獻(xiàn):
級(jí)別:北大期刊
榮譽(yù):Caj-cd規(guī)范獲獎(jiǎng)期刊
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)期刊全文數(shù)據(jù)庫(kù)(CJFD)
級(jí)別:北大期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:統(tǒng)計(jì)源期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)
級(jí)別:省級(jí)期刊
榮譽(yù):中國(guó)優(yōu)秀期刊遴選數(shù)據(jù)庫(kù)