前言:一篇好文章的誕生,需要你不斷地搜集資料、整理思路,本站小編為你收集了豐富的計算機視覺研究領域主題范文,僅供參考,歡迎閱讀并收藏。
關鍵詞:計算機視覺;定標方法;應用特點
中圖分類號:TP319文獻標識碼:A文章編號:16727800(2012)007014902
作者簡介:許志雄(1968-),男,浙江紹興人,江漢石油鉆頭股份有限公司工程師,研究方向為計算機多媒體。
0引言
計算機技術的應用在諸多領域占據了主要位置,并得到了人們的極大重視。在此形勢下,攝像機的高清晰度亦成為了人們追逐的目標,而在計算機視覺中的定標方法有各種不同的處理方式,從而為攝像機的發展提供了一個絕好的機會。由此,計算機視覺中的攝像機定標方法成為當今世界攝像機研究領域里至關重要的一個方面,以攝像機得到的圖像信息作為出發點來計算三維空間中自然場景的幾何信息成為計算機視覺的基本任務之一,并且它的應用特點也得到了人們的密切關注。
1攝像機視覺投影原理
透鏡成像的原理利用了光的折射現象,而攝像機的視覺投影原理和透鏡的成像原理相差無幾,只不過在一些細節上進行了相應的改變,使成像更加清晰,以更好地滿足人們的需求。攝像機視覺投影原理就是利用鏡頭的光學原理進行視覺成像,而其中又有許多理論支持,包含鏡頭與焦距和視角。焦距是指鏡頭的焦點之間的距離,對于攝像機而言,就是指從鏡頭的中心位置到攝像管,也可以說是成像的位置之間的距離就是攝像機鏡頭的焦距,只有調整好了這兩者之間的距離,才能保證攝像機的攝像效果,這也是保證攝像機正常工作的首要任務。視角要受到鏡頭焦距的限制,由鏡頭焦距對攝像的大小情況而決定,攝影師們就是通過對焦距的不斷變換來改變對任務的造型,從而改變人們的視覺效果。對于拍攝相同距離的目標而言,鏡頭焦距越大,攝像的水平視角就會變得越窄,這樣帶來的后果就是拍攝到的目標的范圍就越小,使得拍攝效果大打折扣,從而給攝像機帶來不利的使用效益。因此,必須在兩者達到一個較好的組合效果之時,才能夠充分發揮攝像機的作用,并將攝像藝術發揮到極致。由此可見,計算機視覺中的攝像機定標方法將會給攝像機的拍攝效果帶來巨大的轉變。
2計算機視覺中的攝像機定標方法
2.1三維定標法
在人們的平常思維中,凡是物體的影像必定是三維的,本文的理論研究也同樣基于這樣的想法。在討論單幅圖像的設計標定之時,我們所追求的理論基礎就是需要攝像機的定標物是人們所追求的那種三維的效果,在此基礎上再進行相關的理論研究,以達到相得益彰的效果。在此過程中,首先要準確定位定標物上一些比較重要的點的三維坐標,這樣才能夠為后來的工作提供方便;然后在與定標物相對應的成像上找到相應的點的位置,這是至關重要的一步,這也決定了后面成像的具體設計方法;最后在那些比較重要的點的圖像上標出其具體的三維坐標,達到定標物的實際成像效果圖,這樣就可以完全解決攝像機的成像問題了。這種定標方法的基本原理就是充分分析定標物的三維信息,同時與它的具體成像位置相關聯,在這兩者之間形成一種具體的相對應關系。由此我們可以充分利用計算機的快速運算,實現攝像的功能,并適時進行程序功能改進,優化定標物參數的獲取方法,從而達到增加攝像機清晰度的目標。
2.2平面定標法
與上面的定標方法相對立的一種方法就是多幅圖像的設計標定。在這樣的時代背景下,人們的要求應盡可能得到滿足,因而理論研究者會在這個方面下足功夫,弄懂這里面的個中玄機,利用多幅圖像對平面的定標物來進行物體的標定工作,以達到攝像機定標的目的。這樣的平面定標方法就是充分利用平面物體的運動特性,在它和攝像機之間找到一個平衡點,觀察兩者的相對運動,這樣的定標方法也給拍攝運動中的物體帶來了生機。此方法在實施之余也會帶給人們不一樣的感受,讓人們充分體會到攝像的魅力。當然這種考慮運動的平面定標法會受到特征點的增多的影響,隨著點的不斷增加,定標情況就會越來越好,定標物的精度也會不斷提高,于是在定標物相同的前提下,平面定標法自然就可以從定標物上獲得更多的數據信息,為準確對定標物進行定位測量提供了更多的依據。因此,這種方法的效果要比前面的方法好很多,得到推廣的力度也會大大增加,所得到的經濟效益也會增加,設備的成本在原來的基礎上還有降低的趨勢。所以,理論研究者的研究領域就會逐漸向這一方面進行轉變。
2.3兩步定標法
有了前面的研究成果作支撐,攝像機定標方法的進一步研究就會顯得異常容易,人們的進一步要求也會得到滿足,可謂一舉兩得。理論研究者們在有了豐富的理論和實踐基礎之后,利用直接線性的定標方法進行攝像機參數的進一步優化提高,通過透視原理來修改以前的參數,然后將修正的參數進行初始值的確認,把它們作為現在研究階段的起點,在這樣的起點之上綜合考慮各種外界因素,利用最優化的計算機算法進行攝像機成像程序的改進,把原來的程序進行升級處理,使得定標物的精確度得到進一步的提高,這就是我們所提到的兩步定標法。它的基本原理其實很簡單,只不過是充分利用了原有的理論,并進行了一定的創新而已。但就是這樣的創新步伐的邁出,給計算機視覺中的攝像機定標方法帶來了新的生機,也給攝像機鏡頭的優化帶來了很多指導方法。在圖像中心到圖像點的距離保持不變的前提下,參數的數量會顯著減少,這樣不僅節省了材料的用量,而且還進一步提高了攝像機的攝像清晰度,有效彌補了以前清晰度不高的缺點。這樣一來,攝像機的成像效果大大改進,于是才有了現代攝像機的高清效果,確實讓人們享受到了科技帶來的福音。
3計算機視覺中的攝像機定標方法的應用特點
3.1建立于主動視覺上的自我標定
由于計算機視覺中攝像機定標方法的不斷推廣,一些計算機技術在攝像機的制作過程中得到了較好的應用。但是在這之中必不可少地存在一些制作人員或設計人員的主觀因素,這樣攝像機的標定方法中就會形成形色各異的特點,而且彼此之間可能會出現較大的不同,特別是在主動視覺上的自我標定。在主動視覺中,我們所用到的攝像機可以在一個被控制的平臺上被人們固定,利用計算機的高運算能力,計算機可以把平臺上所出現的參數精確地讀出來,我們只需要利用控制攝像機的運轉順序,讓攝像機作一定的周期運動,就可以在這個過程中得到更多的圖像,然后再利用所成的圖像和固定的攝像機的運動參數來確定攝像機的運動情況。這種自我標定方法比較簡單,但是必須為人們提供精確控制攝像機運動的平臺,這種以主觀意識為主的標定特點強化了個人的主觀能動性,讓人們更加易于接受。
3.2進行有層次劃分的逐步標定
近年來,人們對攝像技術的理論研究已經日趨成熟,并根據自己的意愿進行相關的研究工作,把自己的想法融入到攝像機的設計中,真正做到有層次的逐步標定,把所要的標定物以逐個擊破的方式實現有層次的程序算法,從而讓人們在邏輯上能夠有所認識,并且易于接受,從而達到有層次劃分的逐步標定的目的。分層逐步標定法已為標定研究領域中普遍認同的方法之一,在實際的應用中逐漸取代了直接標定的方法。因為進行有層次劃分的逐步標定是符合人們的想法的,而且這種方法的特點是以射影標定作為基礎,以某一幅圖像作為基準圖像,進行其它圖像的射影對齊工作,從而將攝相機中成像未知參數的數量減少,更易于為人們所接受。可以說,進行有層次劃分的逐步標定是人們在實踐中得出的一套符合大勢所趨的標定方法,為世人所推崇。
4結語
綜上所述,計算機視覺中攝像機定標方法在人們的不斷認識中得以應用和推廣,在時代的不斷進步中逐漸向前發展。同時,攝像機標定方法的應用特點也大相徑庭,各有千秋,從而實現百家爭鳴的態勢,進一步推動計算機視覺中的攝像機研究工作的向前發展。
參考文獻:
【關鍵字】非線性濾波 概率密度 重采樣 粒子退化
一、引言
粒子濾波(PF)是一種在處理非線性非高斯系統狀態估計問題時具有較好估計效果的方法,其原理是通過非參數蒙特卡洛方法實現貝葉斯濾波。其最早起源于Hammersley等人在20實際50年代末提出的順序重要性采樣(SIS)濾波思想。
但由于上述方法存在嚴重的樣本權值退化從而導致的粒子數匱乏現象,直到1993年Gordon等人將重采樣技術引入蒙特卡洛重要性采樣過程,提出一種Bootstrap濾波方法,從而奠定了粒子濾波算法的基礎。
二、基本粒子濾波算法
三、粒子濾波算法存在的主要問題及改進
對于SIS算法來說,容易出現粒子的退化問題,目前存在的諸多對SIS算法的改進中,能夠降低該現象影響的有效方法是選擇合適的重要性函數和采用重采樣方法。
針對狀態空間模型的改進算法,如輔助變量粒子濾波算法(APF),局部線性化方法,代表的算法主要有EKF,UKF等。針對重采樣改進方法,文獻通過將遺傳算法和進化算法引入粒子濾波算法中,增加重采樣過程中粒子的多樣性。
然APF算法在過程噪聲較小時,可獲得比標準粒子濾波更高的濾波精度,在過程噪聲較大時,其效果則大大降低。采用局部線性化的方法EKF,UKF都是針對非線性系統的線性卡爾曼濾波方法的變形和改進,因此受到線性卡爾曼濾波算法的條件制約,而對于非高斯分布的狀態模型,其濾波性能變差。
將遺傳算法和進化算法與粒子濾波結合的改進粒子濾波算法,雖取得了較好的濾波效果,然而是以消耗過多計算資源為代價的。
四、粒子濾波的應用
4.1 目標跟蹤
對目標進行定位和跟蹤是典型的動態系統狀態估計問題,在諸如純角度跟蹤的運動模型中,采用粒子濾波方法進行實現目標跟蹤已獲得了較好的跟蹤精度,文獻研究了多目標跟蹤與數據融合問題,文獻給出了基于粒子濾波的群目標跟蹤算法。
4.2 計算機視覺
近年來,通過序列圖像對感興趣的區域進行持續跟蹤問題引起人們廣泛關注,Isard M率先將粒子濾波算法引用了計算機視覺領域,Maccormick J較系統的總結了粒子濾波方法在計算機視覺中的應用,從中可了解粒子濾波算法在該領域中的應用成果和發展趨勢。
【關鍵詞】自動控制技術;農業自動化
由于歷史、觀念和技術等方面的原因, 我國傳統農業機械與發達國家相比有很大差距,已遠遠不能適應農業的科技進步。近些年來, 自動化的研究逐漸被人們所認識, 自動控制在農業上的應用越來越受到重視。例如,把計算機技術、微處理技術、傳感與檢測技術、信息處理技術結合起來, 應用于傳統農業機械, 極大地促進了產品性能的提高。我國農業部門總結了一些地區的農業自動化先進經驗(如臺灣地區的農業生產自動化、漁業生產自動化、畜牧業生產自動化及農產品貿易自動化)的開發與應用情況, 同時也汲取了國外一些國家的先進經驗、技術,如日本的四行半喂人聯合收割機是計算機控制的自動化裝置在半喂人聯合收割機中的應用,英國通過對施肥機散播肥料的動力測量來控制肥料的精確使用量。這些技術和方法是我國農業機械的自動化裝置得到了補充和新的發展,從而形成了一系列適合我國農業特點的自動化控制技術。
1.已有的農業機械及裝置的部分自動化控制
自動化技術提高了已有農業機械及裝置的作業性能和操作性能。浙江省把自動化技術應用于茶葉機械上,成功研制出6CRK-55型可編程控制加壓茶葉揉捻機,它利用計算機控制電功加壓機構,能根據茶葉的具體情況編制最佳揉捻程序實現揉捻過程的自動控制,是機電一體化技術在茶葉機械上的首次成功應用。
1.1應用于拖拉機
在農用拖拉機上已廣泛使用了機械油壓式三點聯結的位調節和力調節系統裝置, 現又在開發和采用性能更完善的電子油壓式三點聯結裝置。
1.2應用于施肥播種機
根據行駛速度和檢測種子粒數來確定播種量是否符合要求的裝置, 以及將馬鈴薯種子割成瓣后播種的裝置等。
1.3應用于谷物干燥機
不受外界條件干擾, 能自動維持熱風溫度的裝置停電或干燥機過熱引起火災時,自動掐斷燃料供給的裝置。
2.微灌自動控制技術
我國從20世紀年50代就開始進行節水灌溉的研究與推廣據統計。到1992年,全國共有節水灌溉工程面積0.133億m2,其中噴灌面積80萬m2, 農業節水工程取得了巨大的進展。灌溉管理自動化是發展高效農業的重要手段,高效農業和精細農業要求必須實現水資源的高效利用。采用遙感遙測等新技術監測土壤墑性和作物生長情況,對灌溉用水進行動態監測預報,實現灌溉用水管理的自動化和動態管理。在微灌技術領域,我國先后研制和改進了等流量滴灌設備、微噴灌設備、微灌帶、孔口滴頭、壓力補償式滴頭、折射式和旋轉式微噴頭、過濾器和進排氣閥等設備,總結出了一套基本適合我國國情的微灌設計參數和計算方法,建立了一批新的試驗示范基地。在一些地區實現了自動化灌溉系統,可以長時間地自動啟閉水泵和自動按一定的輪灌順序進行灌溉。這種系統中應用了灌水器、土壤水分傳感器、溫度傳感器、壓力傳感器、水位傳感器和雨量傳感器、電線等。
3.自動控制技術在精準農業中的應用
提起數字媒體,人們通常會想到傳媒行業,其實數字媒體的應用絕不局限于傳媒。隨著寬帶網絡的普及,人們在日常業務處理過程中,正面對越來越豐富的網上媒體和內容,包括各種視頻、音頻、文本、圖像等。下面,就讓我們跟著諸位數字媒體方面的專家一起來分享這個繽紛的世界。
三維幾何建模與形狀表示
北京大學視覺與聽覺信息處理國家重點實驗室主任教育部長江學者獎勵計劃特聘教授 查紅彬
精彩問答
在背景比較復雜、有干擾的情況下模型檢索的效果怎么樣?
在模型檢索的時候并沒有考慮背景,因為這是做模型檢索比較容易的部分。模型檢索一般是沒有背景的,但也可以做,但是要推廣到背景比較復雜的物體上識別可能有很大的問題,因為這時候匹配不僅僅是局部匹配,而是兩個子集和子集的匹配問題,到目前為止,我們只是做沒有背景的模型檢索。
為什么要重新談論三維形狀表示問題?在多媒體信息處理領域里面,有兩個比較重要的方向,這也是計算機科學技術領域里兩個重要的方向,一個是計算機視覺,一個是計算機圖形學。計算機視覺是從圖像中通過識別或重建處理,得到一個對對象物的描述。反過來說圖形學,是對一個對象和場景的描述,通過繪制和動畫生成圖像和視頻。它們從處理過程來說是逆過程,這兩個領域之間有密切的關聯。
我們現在考慮計算機三維建模或模型的描述,考慮的不僅僅是計算機視覺或計算機圖形學所包含的內容。這里面簡單列舉一下,比如基于模型的三維物體識別和場景識別,這兩個應該是典型的計算機視覺里面考慮的應用。除了這以外還可以用模型干別的事情,比如繪制,還包括基于這樣模型的設計、變形、動畫等等。除了兩個單獨研究的應用之外,還要想怎么把兩者結合起來,把虛擬和真實的東西無縫連接到一起,這些都牽涉到三維模型。
我們考慮的三維模型跟以前相比,應用領域大了很多,要達到這個要求,對模型的表達、形狀的表達也都有了更高的要求。
怎樣找到一些更新更有效地表達形式來符合這些要求呢?這里有四個方面,現在能不能建立一個形狀空間,把考慮的對象完整地在形狀空間里面表達出來。第二點就是針對形狀的特性,表達要具有柔性,對象物的表面不都是連續的,也有一些非連續性和不規律性,這些特性怎樣能夠進行柔性處理。第三個是需要一些描述是局部性的,另外一些要求描述是整體性的,這兩者之間如何有一個很好的結合方法。第四是在大量的計算當中,包括變形和動畫中有很多編輯的工具,所以我們要求對現在的形狀表達有一些比較高的要求。
在計算機視覺里面有一個老大難就是識別,已有模型,但是眼前看到的是一部分三維數據,怎么用這部分數據和模型數據匹配來識別它呢?這就牽涉到局部匹配,我們要解決局部匹配需要什么描述?我們要有一個模型,從大量的數據中建立一個模型庫,并從中抽取很多特征,把這些特征進行組織。這里面牽涉三個比較大的問題,第一個是形狀空間怎么構造,沒有很好的特征表達或整理的形式,后面的匹配以及其他的工作就很難做。第二個是怎么定義基于這種特征的相似度。第三個是怎樣在形狀空間當中搜索到最優的匹配。
針對這些問題我們最近一兩年做了一些工作,最近提出一個廣義形狀分布(Generalized Shape Distributions)描述方式,主要目的有兩點,能不能在三維形狀表示過程當中,找到一些最關鍵的描述指令,并從中找到相互關系,把整體和局部結合起來。如果把之間的關系描述出來,就能把局部結構性的信息用整體觀點加進去,這兩件工作就是我們做這件事情的主要目的。
在形狀描述問題上,我們還有很多工作要做,除了局部、整體描述之外,我們要想辦法把他們結合到一起。今后幾年要用更多的模式識別的辦法,來解決面臨的圖形學或虛擬現實和計算機視覺當中的很多問題。
生活中的計算機視覺
香港中文大學信息工程系終身教授
微軟亞洲研究院視覺計算組負責人 湯曉歐
精彩問答
微軟亞洲研究院視覺計算組在原創思想這一塊,引領下一個方向有沒有什么考慮,您談到很多對人們日常生活影響很大的應用,但是在背后的更深層的考慮,更新的創意在哪里呢?
我們的研究者都很年輕,我本人也才工作七年的時間,很多的算法已經發展這么多年了,所以在開始的時候比較容易想出來的方法,現在已經很難有那么多的原創內容。我們的工作是去找一些非常原創的內容,有的是理論上的,有的是新的發明,這可以有很大的影響。
圖像通過閃光燈的分割,前景和背景深度差會不會影響分割效果,距離會不會影響分割效果呢?
我們這個通過閃光燈對圖像進行分割的技術,會一定程度上受到光的強度和距離的影響。
我們主要的研究領域包括計算機視覺、模式識別、圖像處理和視頻處理。下面就為大家介紹幾個比較典型的應用。
如何將圖片的前景和后景分離?我們現在照兩張圖片,一張打閃光燈,一張沒有打閃光燈,這樣拍出來的照片背景沒有變化,但前景變化很厲害。在開閃光燈的情況下拍的照片,前景和后景可以利用一些技術很容易地分開來。
把一個圖片的前景切割出來放入另一張圖后,那剩下的圖片缺一塊的怎么辦呢?如何修復剩下的圖片呢?在例舉的圖片上,大家可以看到不同的區域,我們可以由一個算法,從其他的地方借過來,再貼上去,經過這樣的處理后,圖像基本上和原來沒有太大的區別。
如此的修修補補又有什么用呢?比如說,你對這張圖像不是很滿意,你可以把圖片上不喜歡的部分劃出來,然后利用一些技術將劃出來的空白部分填上。更有用的地方在于,你照了不想被別人看到的照片后,除了刪除,你多了一個選擇。你可以把不想讓別人看到的照片部分去掉,并利用一些算法把空白的地方填補上,而且讓別人看不出來。
現在大家的電腦上都會有很多照片,怎么快速地瀏覽這些照片呢?我們可以把這些圖像都放在一個屏幕上,可屏幕畢竟有限,怎么才能把照片放得更多一些呢?我們現在做的是可以隨機把照片放到桌面上,但是電腦會對每張照片上的重要信息進行篩選,在放盡可能多的照片的同時,讓每張照片上最重要的信息不被遮掩,而且均勻地分布在桌面上。這樣大家看起來就更清楚了。這個算法就是怎么讓所有圖像均勻分布,同時把所有背景都要蓋上。我們可以對圖像進行各種處理,同時我們也可以利用一些技術知道別人有沒有處理圖像,對圖像有沒有做過手腳。
現在我們來說說視頻方面。比如說抖動很厲害的圖像,怎么把物體移到中間?一個辦法是把除移動圖像外的公共部分切出來,但是移動越大,公共部分就會越來越小,更好的辦法是用一些技術把空處填上。
現在MSN的功能已經越來越豐富。比如說一段電影,你看到一件比較中意的衣服,只要你把鼠標移動衣服的覆蓋范圍,你就能很清楚地知道這件衣服的品牌及價格。如果你把鼠標在那件衣服上輕點,電腦就會直接跳轉到這個衣服的相關網站。
你在視頻聊天的時候如果不想讓對方看到你所處的環境,你就可以很輕松地把背景模糊掉。如果大家對自己的長相不是那么有信心,我們可以幫你改變一下你的長相。為自己添一幅酷酷的墨鏡,換上一個性感的大嘴巴,這些都能輕而易舉地完成。
多媒體傳感器網絡
北京郵電大學教授、博士生導師
智能通信軟件與多媒體北京市重點實驗室主任 馬華東
傳感器研究是IT非常熱門的話題, 首先我為大家介紹一下多媒體傳感器網絡的基本概念。從早期的巨型機到今天的小型機,生物芯片尺寸越來越小,但是效率越來越高;網絡設備聯網和數據交換的需求越來越大,設備之間的傳輸量也越來越大;從信息處理的角度來看,內容逐漸占據了主導地位,由數據為中心轉到以內容處理為中心。這三方面的演化是今天討論多媒體傳感器的背景。
傳感器網絡是一組傳感器節點,由組織方式協作地感知采集和處理感知對象的信息,它的基本特點是造價低、能量敏感、通信能力有限、計算能力弱、動態變化。現在的需求是要求通信能力越來越強,計算能力應付節點的處理的要求。
右圖是目前主流的傳感器節點的配置,從配置來講還是比較低的,現在信息處理側重壓力、溫度、光、震動等簡單的數據或者是標量數據。人類獲取信息80%是視覺信息,10%左右是聽覺信息,也就是說90%左右的信息是多媒體信息。傳感器網絡就是對音頻、視頻信息獲取后提供給使用者,使其對環境信息有一個全方位的了解,對傳感器網絡的應用是非常廣泛的。
從網絡的結構來講,基本結構和原來傳感器網絡差別不是很大,這里面強調增加音頻、視頻獲取處理,網絡傳輸整個過程的各個環節,同時這里面最好可以交互。有了這個概念以后,深入分析一下主要特點,首先是網絡能力的增強,這樣一個傳感器網絡應該集信息的采集、處理傳輸、轉發、能量供應等方面,除了傳統的標量數據,音頻、視頻的圖像數據,都可以進行采集處理。
現在多媒體傳感器網絡目前有哪些問題呢?從需求來看,現在網絡是異構的信息,媒體信息的格式,種類很多,并且差異非常大,數據量比較大,特別是音頻、視頻信息,格式比較復雜。這些信息傳輸過程中需要高速實時地傳輸,對網絡傳輸速率也提出了比較高的要求。媒體信息的安全問題,也是網絡需要考慮的,還有服務質量的問題。針對這些需求,我們可以看到,通信資源和計算資源這兩者之間存在非常大的矛盾,或者非常大的鴻溝,如何解決這兩者之間的差距就是我們研究的問題所在。
最后談一下多媒體傳感器網絡研究的挑戰,首先是節點的芯片設計,這是基礎,這里面需要采用多種技術,包括軟硬件協同設計的技術,各種技術結合,降低成本、能耗、體積、提高運算速度和可靠性。第二是三維場景的覆蓋問題,方向性傳感模型是一個簡單的二維圖形,實際上是三維圖形監測,這是一個三維場景方向的問題,研究這個就復雜多了。還有一個問題是服務質量保證問題,在新的網絡當中服務質量體系是什么樣,也是研究的方向。再一個是信息處理,為了使網絡傳輸數據量比較快,能不能在節點做信息處理的計算。當然信息的安全也比較重要,用這些節點獲取多媒體信息怎么保證安全的質量,使應該看到的人看到這些信息,不應該看到的人看不到這些信息。
在多媒體傳感器網絡中,我們還是做了一些工作,和一些同行學者也有一些交流,這里面也有一些質疑,說多媒體傳感網絡和原來傳感器網絡設計初衷是不是吻合的,原來沒有想讓它處理這么多信息,原來體積比較小,加上這些信息以后,無疑使它的體積增大,這里面和初衷之間是不是有矛盾,傳感器網絡研究有沒有必要性,如果有必要性可行不可行,這都是我們目前研究的問題。
關鍵詞: 人工智能 發展過程 研究熱點 應用領域 未來發展
一、人工智能概述
人工智能(Artificial Intelligence,簡稱AI),也稱機器智能,它是計算機科學、控制論、信息論、神經生理學、心理學、語言學等多種學科互相滲透而發展起來的一門綜合性學科。從計算機應用系統角度來看,人工智能是研究如何制造出智能機器或智能系統,實現模擬人類智能活動的能力,以延伸人們智能的科學。人工智能是一門交叉學科,是一門涉及心理學、認知科學、思維科學、信息科學、系統科學和生物科學等多學科的綜合性技術學科,目前已在知識處理、模式識別、自然語言處理、博弈、自動定理證明、自動程序設計、專家系統、知識庫、智能機器人等多個領域取得舉世矚目的成果,并形成了多元化的發展方向。
二、人工智能的發展過程
人工智能經歷了三次飛躍階段:第一次是實現問題求解,代替人完成部分邏輯推理工作,如機器定理證明和專家系統;第二次是智能系統能夠和環境交互,從運行的環境中獲取信息,代替人完成包括不確定性在內的部分思維工作,通過自身的動作,對環境施加影響,并適應環境的變化,如智能機器人;第三次是智能系統,具有類人的認知和思維能力,能夠發現新的知識,去完成面臨的任務,如基于數據挖掘的系統。
三、人工智能的研究熱點
AI研究出現了新的,這一方面是因為在人工智能理論方面有了新的進展,另一方面是因為計算機硬件突飛猛進地發展。隨著計算機速度的不斷提高、存儲容量的不斷擴大、價格的不斷降低,以及網絡技術的不斷發展,許多原來無法完成的工作現在已經能夠實現。目前人工智能研究的三個熱點是:智能接口、數據挖掘、主體及多主體系統。
1.智能接口技術是研究如何使人們能夠方便自然地與計算機交流。為了實現這一目標,要求計算機能夠看懂文字、聽懂語言、說話表達,甚至能夠進行不同語言之間的翻譯,而這些功能的實現又依賴于知識表示方法的研究。因此,智能接口技術的研究既有巨大的應用價值,又有基礎的理論意義。目前,智能接口技術已經取得了顯著成果,文字識別、語音識別、語音合成、圖像識別、機器翻譯及自然語言理解等技術已經開始實用化。
2.數據挖掘就是從大量的、不完全的、有噪聲的、模糊的、隨機的實際應用數據中提取隱含在其中的、人們事先不知道的、但是又潛在有用的信息和知識的過程。數據挖掘和知識發現的研究目前已經形成了三根強大的技術支柱:數據庫、人工智能和數理統計。主要研究內容包括基礎理論、發現算法、數據倉庫、可視化技術、定性定量互換模型、知識表示方法、發現知識的維護和再利用、半結構化和非結構化數據中的知識發現及網上數據挖掘等。
3.主體系統是具有信念、愿望、意圖、能力、選擇、承諾等心智狀態的實體,比對象的粒度更大,智能性更高,而且具有一定的自主性。主體試圖自治、獨立地完成任務,而且可以和環境交互,與其他主體通信,通過規劃達到目標。多主體系統主要研究在邏輯上或物理上分離的多個主體之間進行協調智能行為,最終實現問題求解。多主體系統試圖用主體來模擬人的理,主要應用在對現實世界和社會的模擬、機器人及智能機械等領域。目前對主體和多主體系統的研究主要集中在主體和多主體理論、主體的體系結構和組織、主體語言、主體之間的協作和協調、通信和交互技術、多主體學習及多主體系統應用等方面。
四、人工智能的應用領域
1.專家系統
專家系統是一個具有大量專門知識與經驗的程序系統,專家系統存儲著某個專門領域中經過事先總結、分析并按某種模式表示的專家知識,以及擁有類似于領域專家解決實際問題的推理機制。專家系統的開發和研究是人工智能中最活躍的一個應用研究領域,涉及社會各個方面。
2.知識庫系統
知識庫系統也叫數據庫系統,是儲存某學科大量事實的計算機軟件系統,它可以回答用戶提出的有關該學科的各種問題。知識庫系統的設計是計算機科學的一個活躍的分支。為了有效地表示、儲存和檢索大量事實,已經發展出了許多技術。但是在設計智能信息檢索系統時還是遇到很多問題,包括對自然語言的理解,根據儲存的事實演繹答案的問題、理解詢問和演繹答案所需要的知識都可能超出該學科領域數據庫所表示的知識。
3.物景分析
計算機視覺已從模式識別的一個研究領域發展為一門獨立的學科。視覺是感知問題之一。整個感知問題的要點是形成一個精練的表示,以表示難以處理的、極其龐大的未經加工的輸入數據。最終表示的性質和質量取決于感知系統的目標。機器視覺的前沿研究領域包括實時并行處理、主動式定性視覺、動態和時變視覺、三維景物的建模與識別、實時圖像壓縮傳送和復原、多光譜和彩色圖像的處理與解釋等。機器視覺已在機器人裝配、衛星圖像處理、工業過程監控、飛行器跟蹤和制導及電視實況轉播等領域獲得極為廣泛的應用。
4.模式識別
模式識別就是識別出給定物體所模仿的標本或標識。計算機模式識別系統能夠彌補計算機對外部世界感知能力低下的缺陷,使計算機能夠通過感官接受外界信息,識別和理解周圍環境。模式識別在二維的文字、圖形和圖像的識別方面已取得許多成果,在三維景物、活動目標的識別和分析方面是目前研究的熱點,同時它還是智能計算機和智能機器人研究的十分重要的基礎。此外,人工智能還在機器視覺、組合調度問題、自然語言理解、機器學習、博弈、定理證明等研究應用領域發揮著重要作用。可以說人工智能已深入各行各業,對人類社會作出了巨大的貢獻。
5.機器人
機器人學所研究的問題,從機器人手臂的最佳移動到實現機器人目標的動作序列的規劃方法,無所不包。盡管已經建立了一些比較復雜的機器人系統,但是現在工業上運行的機器人都是一些按預先編好的程序執行某些重復作業的簡單裝置,大多數工業機器人是“盲人”。機器人和機器人學的研究促進了許多人工智能思想的發展。智能機器人的研究和應用體現出廣泛的學科交叉,涉及眾多課題。機器人已在工業、農業、商業、旅游業、空中和海洋及國防等多個領域獲得越來越普遍的應用。
五、人工智能的未來發展
目前絕大多數人工智能系統都是建立在物理符號系統假設之上的。在尚未出現能與物理符號系統假設相抗衡的新的人工智能理論之前,無論從設計原理還是從已取得的實驗結果來看,Soar在探討智能行為的一般特征和人類認知的具體特征的艱難征途上都取得了有特色的進展或成就,處在人工智能研究的前沿。上世紀80年代,以NewellA為代表的研究學者總結了專家系統的成功經驗,吸收了認知科學研究的最新成果,提出了作為通用智能基礎的體系結構Soar。目前的Soar已經顯示出強大的問題求解能力。在Soar中已實現了30多種搜索方法,實現了若干知識密集型任務(專家系統),如RI等。對于人工智能未來的發展方向,專家們通過一些前瞻性研究可以看出未來人工智能可能會向以下幾個方面發展:模糊處理、并行化、神經網絡及其情感。
目前,人工智能的推理功能已獲突破,學習及聯想功能正在研究之中,下一步就是模仿人類右腦的模糊處理功能和整個大腦的并行化處理功能。人工神經網絡是未來人工智能應用的新領域。未來智能計算機的構成,可能就是作為主機的馮?諾依曼型機與作為智能的人工神經網絡的結合。研究表明:情感是智能的一部分,而不是與智能相分離的,因此人工智能領域的下一個突破可能在于賦予計算機情感能力。情感能力對于計算機與人的自然交往至關重要。
根據這些前瞻性研究我們也可以通過想象模擬勾畫出人工智能未來發展的三個階段。
1.融合時期(2010―2020年)
(1)用語言操縱和控制的智能化設備十分普及,像遠程醫療這樣的服務也更為完善。
(2)以計算機和互聯網為基礎的遠程教育十分普及,在家就可以上大學。
(3)在身體里植入許多不同功能的芯片已不新奇。
(4)量子計算機和DNA計算機會有更大發展,新材料不斷問世。
(5)抗病毒程序可以防止各種非自然因素引發災難。
2.自信時期(2020―2030年)
(1)智能化計算機和互聯網既能自我修復,也能自行進行研究、生產產品。
(2)一些新型材料的出現,促使智能化向更高層次發展。
(3)有了高水準智能化技術的協助,人們“定居火星夢”可能性大增。
3.非神秘時期(2030―2040年)
(1)新的全息模式世界將取代原有幾何模式的世界。
(2)人們對一些目前無法解釋的自然現象會有更完善的解釋。
(3)人工智能可以模仿人類的智能,因此會出現有關法律來規范這些行為。
愛爾蘭都柏林大學(UCD)教授孫大文(Da-Wen Sun)的經歷無疑就是這句話的具體詮釋。
2010年5月,孫大文當選愛爾蘭皇家科學院院士。成立于1785的愛爾蘭皇家科學院是愛爾蘭自然科學、人文和社會科學的最高學術機構。
2010年6月,國際農業工程委員會(CIGR)第十七屆世界大會上,來自全球40多個國家的近1000位專家學者代表與會。會上,孫大文當選為國際農業工程委員會候任主席,任期從2011年1月開始,并將于2013年起接任主席,為期2年。他成為國際農業工程委員會自成立80年以來的首位華人主席。在這次大會上,孫大文還被授予國際農業工程委員會會士榮譽稱號(CIGR Fellow Award),這是CIGR對國際農業與生物系統工程領域獲得公認卓越地位和作出杰出科學貢獻者的一項殊榮。
豐碩的成果是多年奮斗的收獲,從廣東潮安縣一路走來,孫大文對于事業、人生都有自己的體會。
我的大學
2010年秋,在一個都柏林典型的陰天、大風、細雨交替的日子,我們來到都柏林大學采訪孫大文教授。盡管前一天晚上他才從國外出差回來,但早就訂好了會議室,并準備了茶點。打開電腦,題為《談談我在海外的奮斗經歷和體會》的PPT文檔圖文并茂地為我們一一細說從前。
從當年參加高考的準考證、成績單,到出國留學的很多審批文件,再到后來獲得的多項獎勵……這些無不透著孫大文的嚴謹和認真,以及對于自己人生經歷的珍視。
盡管我們曾經采訪過很多恢復高考后考上大學的留學人員,但真正看到一張1978年的高等學校準考證、成績單,以及諸多的出國審批手續等批件,這還是第一次。
孫大文出生于廣東省潮安縣,讀書時他的學習成績一直名列全校前茅。1977年恢復高考時,還在上高一的孫大文就被學校破格推薦參加全國高考。1978年,孫大文以優異成績被全國重點大學華南工學院(現華南理工大學)錄取。
為了對比當年高考的難度,孫大文特地選用一組數據說明:1978年全國參加高考人數為610萬人,錄取人數40.2萬,錄取率為7%。而2009年全國參加高考人數1020萬人,錄取人數629萬人,錄取率高達62%。
恢復高考后,幾乎所有進入大學的學子都如饑似渴地汲取著知識的營養,因為他們深深地懂得機會的來之不易,孫大文說:“我們的大學生活就是‘宿舍―飯堂―課室’,‘三點一線’是對我們那時候生活的真實寫照。”
和很多同學一樣,孫大文也缺乏英語基礎,英語成為他學習上的瓶頸之一,為了學好英語,他口袋里總是裝著單詞本,甚至連在飯堂排隊打飯以及晚飯后散步的時間都在用功地背英語,只是當時的他并不知道英語將在今后為他打開一扇更大的門,讓他進入一個更廣闊的世界。
回首往事,孫大文感慨道:“在我們那個年代,所有人都崇拜陳景潤,羨慕中國科技大學少年班的學生,家長也以此來激勵自家孩子讀書。那時候上大學,就是用心學習知識,并且我們有一定要把知識學好的精神。”
在華南工學院本科畢業時,按照當時的政策,所有大學生畢業后都要服從分配。一直在南方長大的孫大文沒想到自己竟然被分配到佳木斯,他當時甚至不知道佳木斯在哪里,而研究生的入學通知書又讓他的命運軌跡有了改變。1982年,孫大文以專業第一名的成績考上華南工學院的碩士研究生,研究方向為高聚物流變工程原理。當年全國在校碩士研究生為2.58萬人,博士生約550人,博士生人數與碩士生人數之比為1∶47.2。
今天說來,這成了孫大文在廣州求學的一件軼事!“連我們老師也笑我,要是我當時沒有考研并且成功考上的話,我就要去遙遠的佳木斯了。”
到了研究生學習階段,孫大文的刻苦鉆研有了更多收獲,獲得多項科研獎項。上個世紀80年代中期,國內物價飛漲,腦體倒掛現象突出,“搞導彈的收入不如賣茶葉蛋的,拿手術刀的不如拿剃頭刀的”,這使得全國刮起下海經商的風,很多人的價值取向由此也發生了巨大變化。1985年,碩士畢業的孫大文迎來了自己人生中的第一次選擇:工作還是繼續深造?幾經考量,孫大文選擇了繼續在華南工學院攻讀博士研究生。那一年華南工學院總共招收5名博士生,孫大文是其中之一,他的研究方向轉為傳熱與節能。
在攻讀博士期間,他先后在《稀有金屬》等國際權威性雜志上發表了7篇論文并全部由科學引文索引(SCl)收錄,他的博士成果后來還相繼獲得廣州市和廣東省自然科學獎。這在當時,對很多科研人員來說,也是有很大難度的。孫大文說:“我當時看很多英文科研文章就想,這樣的文章我也可以寫,于是就將自己的科研成果寫成文章投稿,沒想到都發表了。”
跨出國門
1988年,孫大文博士畢業,他又一次面臨著人生的重要選擇:是畢業留校?還是出國深造?
當時出國要歷經多項環節,其過程是耐力、實力、心理的多項考驗:給國外寫信聯系導師,向學校申請留學,經過政審、國家教委審批,然后集訓,再辦理護照和簽證,換取外匯……
孫大文說:“去海外深造是當時很多人的向往,我也希望去國外進一步深造。我已經拿到了德國和日本的邀請函。但是,去德國還是日本?這個問題讓我非常矛盾。鑒于當時的國際形勢和意識形態差異,我還是選擇了去德國深造。”由于當時很多情況不斷變化,孫大文臨時變更了機票,當時他甚至來不及確認自己在國外的聯系人是否收到了早先發去的電傳。帶著僅有的50美元,1989年6月,孫大文前往德國斯圖加特大學繼續深造,從事儲氫材料研究工作。
“國外的一切對我來說都是那么新鮮。在德國,我第一次接觸到Macintosh計算機,第一次使用word軟件,第一次使用E-mail……”太多的第一次讓他甚至來不及適應。在體驗著新鮮刺激的國外生活的同時,孫大文努力讓自己適應新的環境,克服語言和文化上的障礙,潛心從事科研工作,在研究所,他是在那里學習的中國人中第一個的研究人員。
到德國工作1年后,由于需要在工作中用德語交流。孫大文想放棄學習了那么久的英語很可惜,考慮再三。1990年底,他在導師的指引下,前往英國貝爾法斯特女王大學擔任研究員。
此后幾年,孫大文先后于英國紐卡斯爾大學和謝菲爾德大學擔任研究員,也正是在紐卡斯爾大學,孫大文的研究進入了全新的領域。在那里,他還認識了一位退休的中學校長,校長很想學中文,于是孫大文每周一個晚上到他家里教他中文,也向他學習英文口語,從不間斷,孫大文的英語口語水平有了很大的提高。孫大文說:“在紐克斯爾大學進行的谷物干燥研究工作,為我日后在食品工程領域發展打下了堅實的基礎。我改造了那里現有的實驗設備并實現數據采集自動化,并發表了6篇SCI論文。”
在科研之余,孫大文特別喜歡到英國的鄉村種菜,租一塊地,種上自己喜歡的蔬菜,耕作打理,期待著農耕收獲的喜悅。沒想到有一次來到自己的菜地,發現上次離開時已經郁郁蔥蔥的菜地卻一片狼籍,孫大文心想難道是有人破壞?一次碰巧遇到一位在他旁邊種地的本地人,那位英國紳士慢條斯理地說:“你知道你的菜地出什么問題了么?是蛞蝓(slug)搞得鬼……”孫大文才知道這種蟲子專吃蔬菜,趕忙滅蟲。
事業在都柏林騰飛
孫大事情喜歡制定明確的目標和詳細的計劃,通過計劃,合理安排時間和任務,從而達到目標,同時也使自己明確每一個任務的目的。他經常跟學生說做事情要通過制定計劃,腳踏實地、有步驟地去實現它。在學習、工作中不斷努力,不斷修正自己的行動,直到達成目標。
在英國,孫大文給自己定下的目標是45歲之前要做到教授,但在英國的教育機制下,這并不容易。孫大文開始留意別的機會,1995年秋,他在英國的《衛報》上看到愛爾蘭都柏林大學正在招聘大學教師,當時愛爾蘭處于發展期,經濟環境不斷好轉,高技術產業,特別是信息技術和軟件業發展很快,急需大量科研人員。孫大文決定離開英國,他順利在愛爾蘭都柏林大學找到職位。
正應了中國那句古話“萬事開頭難”,當時,愛爾蘭的中國人很少,作為愛爾蘭都柏林大學第一位獲得教席的華人,諸多來自歐美等發達國家的學者、教授對孫大文的出現感到有些異樣。都柏林大學的同事甚至問孫大文:“你為什么跑到這里來教書?你上課學生能聽懂嗎?”孫大文知道自己必須盡快找到突破口并做出成績來,安頓下來的孫大文開始尋找研究方向和合作者,他一邊組建自己的科研團隊,一邊申請課題和科研經費。
孫大文決定在食品工程方面找突破口,考慮到自己初來乍到,必須要有合適的合作伙伴以及團隊,他幾經周折,拿著自己寫好的項目建議,到愛爾蘭國家食品中心找合作者。他說:“因為如果我單獨申請,成功率肯定比較低,但如果找到當地比較權威的專家,讓他做項目主持人,成功率會比較高。”
看到孫大文翔實的資料準備以及項目建議,國家食品中心的專家同意合作,于是兩個人聯名申請的第一筆科研經費順利通過審批,這奠定了孫大文隨后科研的基礎。孫大文說:“在國外搞研究,你必須有好的課題。缺少經費的研究是非常艱難的,在申請到了經費后,一切就走向正規,順利運行起來了。”
此后十幾年間,孫大文一直奮戰在食品工程研究領域,在新興食品加工技術,食品冷卻、冷凍、冷藏和保鮮技術,食品快速檢測計算機視覺技術,食品加工過程模擬、優化和控制等多個領域走在全球食品工程研究領域的前沿。由于有著寬廣的學術積累,孫大文能從材料、加工、農業工程等諸多領域進行分析研究,并密切關注科研成果的社會轉化等,使得他可以從不同角度看待研究課題,從而找到最佳對接點。
孫大文在愛爾蘭這片陌生的土地上逐漸確立了自己的科研地位,他先后從歐盟、愛爾蘭政府的有關部門和企業界獲得了超過100萬歐元的科研經費,組建了自己的科研隊伍,并成立了食品冷凍及計算機化食品技術研究所。該研究所目前擁有4個專業實驗室,配備有門類齊全的現代化科研設備與測試系統,承擔著歐盟、愛爾蘭政府及企業的多項科研項目。
在歐洲,熟肉制品是以鮮畜禽肉為主要原料,經選料、修整、腌制、調味、成型、熟化和包裝等工藝制成的肉類加工食品,為歐洲主要日常食品。歐洲食品安全條例極其嚴格,歐洲工業界為了減少浪費和提高效率,通常加工生產重約5~7公斤的超大產品。由于肉制品具有極低的導熱系數,采用目前通用的風冷或水冷的冷卻方法根本無法達到歐洲食品安全條例的要求。于是,孫大文首次采用冷卻機理完全不同的真空冷卻方法,以蒸發相變傳熱過程取代傳統方法中以熱傳導傳熱模式為主的傳熱過程。由于水分蒸發潛熱很大,他所開發的新型真空冷卻技術可以達到超快速冷卻效果,從根本上克服了傳統熱傳導傳熱模式所存在的低效率問題。近年來,由于即食食品具有方便和大眾化的優點,適合現代人快節奏生活,即食食品產業在歐洲得到大規模發展,因此歐盟對其冷卻時間具有極為嚴格的規定,孫大文開發的真空冷卻技術對即食食品及其所含的眾多配料都具有極其明顯的超快速凍效果。
在計算機視覺領域,孫大文的研究也取得了世界領先的原創性成果。計算機視覺技術正越來越廣泛地用于食品工業產品質量檢測和生產控制,它能有效地提高生產自動化程度,提高產品質量和生產效率。比薩餅是歐洲最主要的方便食品之一,顧客對外觀品質尤為重視。但目前通用的外觀品質檢測手段仍然采用費時和客觀性差的肉眼觀察方法,從而導致產品質量的波動。比薩餅表面飾料多種多樣且分布復雜,孫大文提出了一種基于區域的圖象分割算法,汲取了常見的門限化、邊界分割法和區域分割法的優點,極大地改進了傳統區域增長算法,研制出適用于比薩餅外觀品質快速檢測計算機圖像處理識別系統。這一系統很適合像比薩餅表面復雜的圖像處理,在對表面飾料包括青椒、火腿、番茄醬等數十種比薩餅和糕點的圖像分析表明,該視覺系統對餅基表面各種飾料的識別準確率達到95%以上。在此基礎上,孫大文還把計算機視覺技術成功地運用于干酪熔化特性量化測定和肉品品質檢測與控制,以代替傳統的儀器測量與感官評定手段。這一系列研究開創了對食品,特別是比薩餅生產質量和屬性進行自動檢測的應用先例。英國著名的《新科學家》雜志等多家世界新聞媒體紛紛報道了這一最新成就。
為國效力
雖然在國外多年,但孫大文一直希望能有機會為祖國服務。近年來,孫大文經常利用自己的休假時間,回國講學,與國內科研機構建立了長期和密切的合作關系,他與華南理工大學共同建立研究基地,雙方聯手共同開拓食品冷凍方面的科研新課題。孫大文與哈爾濱工業大學簽訂了5年的合作合同,每年為哈工大招收培養博士生,期間以哈工大為第一作者單位聯合發表了8篇SCI論文,并多次推薦和邀請該校老師參加國際學術活動。
孫大文與江南大學聯合培養的一位博士生,攻讀博士學位期間共在國際知名期刊上發表6篇論文并全部由SCI收錄。他與江南大學聯合開發的基于豆類蛋白質的無色無味透明的可食用膜用于水果和蔬菜保鮮可使產品的貨架期延長了好幾個星期。如對獼猴桃的實驗結果,顯示使用該涂膜保鮮可使獼猴桃貨架期從原先的2周延長至37天,這一成果再次引起了工業界的高度重視。英國著名的《新科學家》雜志對這一成果報道后,世界各地傳媒也相繼報道了這一技術。
關鍵詞:數據處理;數據挖掘;特征提取;聚類分析
中圖分類號:TP18 文獻標識碼:A 文章編號:1009-3044(2016)31-0164-04
Abstract:With the rapid development of computer technology and Internet technology, the amount of data accumulated in the human gradually increased dramatically. For the vast amounts of data into useful information for the user to provide decision support, clustering algorithm has been widely attention and applied to all types of data processing and data mining applications. The project based on the analysis of visual features on the image, through the effective integration of color, texture and shape features of the image information, the use of K-Means algorithm to cluster. The proposed method can be carried out experiments on the acquired image data set, and has a good clustering effect .
Key words: data processing; data mining;feature extraction;cluster analysis
F今,互聯網上的圖像信息數量如海洋般龐大,我們雖可以通過眼睛獲取十分豐富的信息,然而人類可以接受的范圍是有限的,如何從海量的數據之中準確、快速地將圖像進行聚類,最終為人類社會的發展服務,是當前圖像特征提取領域的一個研究焦點。
圖像聚類就是運用計算機對圖像庫中圖像進行定量分析,再把圖像劃分到某一種特征類別中,以代替人類對圖像的視覺判別。圖像聚類的過程實質上就是一個基于知識的圖像理解過程,同時也是人類對圖像的視覺判別的延續與發展。
基于視覺特征的圖像聚類研究是解決視覺圖像問題的一條重要途徑,也是一個聚集了計算機視覺、圖像處理、數據挖掘等多個研究領域的交叉研究方向。現如今,基于視覺特征的圖像分類研究已越來越受到國內外研究者的關注,在近幾年舉辦的與該領域研究相關的一些頂級國際會議,如計算機視覺與圖像處理國際會議CVPR、數據挖掘國際會議KDD、ICDM等等,都有相關文獻發表。
文獻[2]中,孫君頂等人在形狀特征提取中提出一種新的圖像分塊形狀特征的描述方法,對圖像采用固定塊的分割方法。文獻[4]中,劉麗等人介紹了關于紋理特征的所有研究方法。文獻[6]中,趙書蓮在應用研究過程中使用Hu不變矩算法進行形狀特征的提取。在博士論文[11]中,朱蓉論述了所有視覺特征的提取方法。
隨著研究者在聚類技術上的不斷改進和創新,許多新奇且高效的聚類算法層出不窮,針對特定的問題和用戶,許多學者研究出了多種具有代表性的聚類算法,并且廣泛地應用于模式識別、生物信息、圖像處理以及數據挖掘等領域。
文獻[7]中,臧少杰介紹了所有聚類算法,并且將這些算法進行了比較。文獻[8]中,路晶等人針對非監督學習,在基于EM算法啟發式迭代優化算法的框架下,提出了6種多例聚類算法。文獻[9]中,周俊祥對模糊C-均值聚類(FCM,全稱為Fuzzy C-Means Algorithm)算法進行改進,有效地降低了孤立點對圖像數據聚類結果的影響。
1 特征提取
基于視覺特征的網絡圖像特征有三個,分別為顏色、紋理、形狀。特征提取是將某一模式的一組測量值進行變換,用以表現這一模式具有代表性特征的方法。通過影像分析和變換,以提取所需特征的方法。
1.1 顏色特征的提取
顏色特征的提取主要有四種方法,為顏色直方圖、顏色矩與顏色熵的研究、顏色相關圖的研究、
顏色聚合向量的研究。在這四種方法中,顏色矩與顏色熵的研究方法的分辨能力比較低,所以通常也必須和其他圖像特征結合起來進行檢索。顏色相關圖的研究計算量很大,近些年來對于顏色相關圖的研究才剛剛起步,主要是結合其他方法一起來研究,在文獻[3]中作者介紹了一種基于顏色相關圖和小波變換的算法。顏色聚合向量的研究當前也主要集中于與其他方法結合來進行效果的改進上,比如該文中作者在顏色直方圖的基礎之上采用了一種基于顏色聚合向量的方法從而提高了檢索的精度。而顏色直方圖具有相似度計算,有特征提取簡潔和不隨圖像尺度、旋轉等變化而變化的特點。所以顏色直方圖相較于其他方法更適合于顏色特征的提取。具體方法如下:
1.2紋理特征的提取
紋理是指在圖像中重復出現的局部模式及其排列規則。紋理特征與顏色特征相似,同樣也是一個整體性的特征。近年來,對紋理分析方法的種種理論或者方法在紋理特征提取中的實踐已然基本成形,Tuceryan和Jain將紋理特征提取的方法歸納為五大類,即結構統計、 模型、信號處理、幾何和結構家族。這種分類方法被大多學者所采納。
模型家族的方法能兼顧紋理局部的隨機性與整體上的規律性,而且有很強大的靈活性;主要優勢是提供了用來表示空間上相關的隨機變量之間的相互作用的模型。它的不足在于模型系數的求解有難度,需要相當大的計算量,往往需要迭代了數百次才能達到收斂。信號處理家族對紋理進行多分辨描述,可以在更精準的尺度之上分析紋理。但有有效性不佳和計算量大的缺陷。
而本文推薦使用的統計家族方法簡便,容易實現,特別是灰度共生矩陣(GLCM,全稱為Gray Level Co-occurrence Matrix)方法是世界公認的有效方法,具有比較強的適應性。
灰度共生矩陣是被廣泛使用的紋理提取的算法,也是分析圖像的基礎,它運用統計學當中的概率來反映圖像灰度的有關方向和間隔等整體信息。其算法描述如下:
是圖像中任意一點,是圖像中移動后的另一點,因此形成一個點對, 是該點對的灰度值,即m是點的灰度值, n是點的灰度值。然后固定和,通過點的改動,來明確相應的值,所以相應灰度值的組合為(灰度值的級數為L)。對于研究的圖像,計算出值出現的頻率,化其積分為1,它的概率為,則灰度共生矩陣(灰度聯合概率密度)為。
對于有區別的紋理周期分布,就有不一樣的離差分值,即不一樣的與值。在紋理比較細致的情況下,選取(1,0),(0,1),(1,1),(-1,1)等小的差分值是非常有效果的。若與取值比較小,則表明紋理圖像變化情況遲緩,那么在灰度聯合概率矩陣對角線上的數值就相對較大,適合于做對角線分布;若與取值比較大,那么說明紋理變化愈快,則在灰度聯合概率矩陣對角線上的數值就愈小,適合于做均勻分布。一系列的紋理特征的y計量能夠通過灰度共生矩陣而得到,其中常用的有以下8個紋理特征值。
(1)角二階矩
(2)對比度其中。
(3)灰度相關其中分別為與的標準差和準值。
(4)熵
(5)逆差矩其中k為常數且。
(6)最大概率
(7)相異
(8)反差
1.3 形狀特征的提取
形狀特征提取表示方法有2種,一種是區域特性,它主要是針對于圖像的整個形狀區域;另一種是輪廓特性,它主要針對于物體的外邊界。前人關于形狀特征提取的典型方法有:邊界特征值法、幾何參數法、形狀不變矩法、傅里葉形狀描述法等。本文采用Hu不變矩算法來提取形狀特征。
Hu不變矩是由Hu在1962年提出來的。不變矩是一種經過提取具有平移、旋轉與比例不變性的圖像特征,不變矩的中心思想是使用對變換不敏感的基于區域的幾個矩陣作為形狀特征,從而進行圖像識別的方法。矩不變量因為具有不隨圖像的位置、大小與方向而變化的特點,對于提取圖像中的形狀特征而言,是一個很常用的工具。
2 聚類分析
聚類是依據事物的某些屬性特性,將事物劃分成為不同類的過程,其目的是使得類間的相似性盡可能小,類內的相似性盡可能大。在許多應用當中,聚類分析是一種數據預處理的過程,同時也是進一步分析和處理數據的基礎。經過恰當的聚類算法,對事物的特征數據進行預處理,從而事物才便于研究,事物的內部規律才可能被人類所掌握。
聚類算法大致可以分為以下幾種:劃分、層次、基于密度、基于網格和基于模型的聚類。
基于層次的聚類是將既定數據對象集合進行層次的分解,雖然適用于任意形狀和任意屬性的數據集,但算法執行時間長,不能回溯處理;基于密度的聚類是基于發現所有形狀的聚類結果,能夠用來過濾“噪聲”孤立點數據,發現所有形狀的不同簇,但處理時間與每維空間所劃分的單元數相關,一定程度上降低了聚類的質量和準確性;基于網格的聚類能夠處理所有類型的數據,但這是以降低聚類的質量和準確度為代價的;基于模型的方法對每個簇假設了一個固定的模型,繼而找到對給定模型最佳擬合的數據。基于模型的算法能夠經過搭建反映數據點空間分布的密度函數來確定聚類。
基于劃分的算法首先構建一個初始的劃分,確定需要構建的劃分數目k。之后使用一種迭代的重定位技術,通過對象在劃分間變動來改進劃分,使在相同的類中對象之間盡可能接近或相近,相反不同類中的對象盡可能闊別或有差別。為了能夠達到全局的最優,基于劃分的聚類會需要列舉所有可能的劃分。實際上,大部分應用采用了K-均值算法(K-Means)和K-中心點算法這兩種較流行的啟發式算法。
這兩種啟發式聚類算法對在中小規模的數據庫中找到球狀簇非常適用。下面主要介紹本文所采用的K-均值算法。
2.1 K-均值算法
K-均值算法的過程:
1.隨機選取k個數據點作為初始的種子聚類中心。
2.計算每個數據點與各個中資聚類中心之間的距離,把每個數據點分配給距離它最近的聚類中心。聚類中心以及分配給它的數據點就代表一個聚類。
3.重復以上步驟,直至達到以下任一條件便會終止:
(1)沒有(或最小數目)數據點被重新分配給不同的聚類。
(2)沒有(或最小數目)聚類中心再發生變化。
3.2 特征提取實驗
紋理特征提取:從圖像庫中選取100幅花朵類圖像,用統計家族的灰度共生矩陣(GLCM)提取其8維紋理特征。
形狀特征提取:從圖像庫中選取100幅花朵類圖像,選擇Hu不變矩方法提取其形狀特征。
3.3 具體分析過程
第一步:從圖像庫中選取兩組不同圖像,使用灰度共生矩陣和Hu不變矩提取各自的紋理和形狀特征;
第二步:利用K均值算法將這兩組圖像分別基于紋理和形狀特征進行聚類,再從中分別選取60幅得到聚類中心的范圍,求出平均值;
第三步:分別從花朵類和美食類圖像中選取40幅圖像,將每幅圖像的紋理和形狀特征數值與平均值進行歐式距離計算,距離較小時可認為屬于該類,而后計算兩組數據的準確率。
1)紋理特征的聚類結果
測試集中40幅花朵類圖像的紋理特征數據與訓練集中花朵類圖像紋理特征數據平均值的歐式距離全都小于和訓練集中美食類圖像紋理特征數據平均值的歐式距離,故實驗準確率達到100.0%;測試集中40幅美食類圖像的紋理特征數據與訓練集中美食類圖像紋理特征數據平均值的歐式距離全都小于和訓練集中花朵類圖像紋理特征數據平均值的歐式距離,故實驗準確率達到100.0%。紋理特征的比較結果如表1所示:
2)形狀特征的聚類結果
測試集中40幅花朵類圖像的形狀特征數據與訓練集中花朵類圖像形狀特征數據平均值的歐式距離有28幅圖像的數值小于和訓練集中美食類圖像形狀特征數據平均值的歐式距離,故實驗準確率達到70.0%。測試集中40幅美食類圖像的形狀特征數據與訓練集中美食類圖像形狀特征數據平均值的歐式距離有30幅圖像的數值小于和訓練集中花朵類圖像形狀特征數據平均值的歐式距離,故實驗準確率達到75.0%。形狀特征的比較結果如表2所示:
綜上所述:
1)花朵類圖像和美食類圖像在紋理上的有很大的相似性,因為花朵類圖像的紋理較細致,其基元較小,因而空間頻率較高,而美食類圖像的紋理較粗糙,其基元較大,空間頻率較低。
2)花朵類圖像和美食類圖像在形狀上的^別比較小,由于某些花朵的形狀與某些美食的形狀有相似性,如帶有花邊圖案的盤子所盛的美食的圖像和擺盤呈花型的美食圖像與花朵類圖像有很大的相似度,如圖1中的(a)圖與圖2中的(c)圖,會有較低的準確率。而圖2中(a)圖的美食呈長方形,則會與花朵類圖像有很大的區別。
4 總結
基于視覺特征的圖像聚類研究中,花朵類圖像和美食類圖像在紋理和形狀上的聚類都有一定的準確率,特別是在紋理的聚類上本次研究有著100.0%的準確率。同時也有不足之處,本次研究并未融入顏色特征,針對特定的圖像也還需要進一步研究具有區分度的特征。本文所用的K-均值算法只能應用于那些均值能夠被定義的數據上。因此,它很難應用到范疇數據上,且對于異常值異常敏感。所以現在所用的聚類算法未來要繼續改進,比如聚類中心的計算能夠實現自適應等。
基于視覺特征的圖像聚類方法研究涉及圖像搜索引擎、數字照片的個性化管理、敏感圖像的識別與過濾、藝術圖像鑒別等等,具有十分重要的現實意義,相關研究領域的最新知識與研究成果都可以創新性地應用到解決各方面的問題中,以促進圖像聚類技術的快速發展。
參考文獻:
[1] 高進樂,康耀紅,伍小芹.基于顏色特征圖像檢索方法的研究[J] .信息技術,2008(11):4-7.
[2] 孫君頂,趙珊.圖像底層特征提取與檢索技術[M].北京:電子工業出版社,2009:49-85.
[3] 張篤振.基于顏色特征與LBP的圖像檢索算法研究[J] .微計算機應用,2009,30(6):35-38.
[4] 劉麗,匡綱要.圖像紋理特征提取方法綜述[J].中國圖象圖形學報,2009(4).
[5] 王志瑞,閆彩良.圖像特征提取方法的綜述[J].吉首大學學報:自然科學版,2011(6).
[6] 趙書蓮.形狀分類及其在圖像檢索系統中的應用研究[D].山東:山東師范大學,2006.
[7] 臧少杰.基于視覺的聚類算法研究及應用[D].山東.山東師范大學,2008:1-49.
[8] 路晶等.基于多例學習的WEB圖像聚類[J].計算機研究與發展,2009,46(9):1462-1470.
[9] 周俊祥.改進FCM的圖像聚類方法[J].計算機系統應用,2011,20(7).
[10] 劉康苗.基于視覺與語義融合特征的階段式圖像聚類[J].浙江大學學報:工學版,2008,42(12).
[11] 朱蓉.基于語義的WEB圖像分類研究[D].浙江大學,2011.
[12] 張建萍,劉希玉.基于聚類分析的K-means算法研究及應用[J].計算機應用,2007(5).
[13] 張講社,徐宗本.基于視覺系統的聚類:原理與算法[J].工程數學學報,2000(5).
關鍵詞:人機大戰;人工智能;發展前景
中圖分類號:TP391 文獻標識碼:A
0.引言
2016年3月15日,備受矚目的“人機大戰”終于落下帷幕,最終Google公司開發的“AlphaGo”以4∶1戰勝了韓國九段棋手李世h。毫無疑問,這是人工智能歷史上一個具有里程碑式的大事件。大家一致認為,人工智能已經上升到了一個新的高度。
這次勝利與1997年IBM公司的“深藍”戰勝國際象棋世界冠軍卡斯帕羅不同。主要表現在兩個方面:
(1)AlphaGo的勝利并非僅僅依賴強悍的計算能力和龐大的棋譜數據庫取勝,而是AlphaGo已經擁有了深度學習的能力,能夠學習已經對弈過的棋盤,并在練習和實戰中不斷學習和積累經驗。
(2)圍棋比國際象棋更加復雜,圍棋棋盤有361個點,其分支因子無窮無盡,19×19格圍棋的合法棋局數的所有可能性是冪為171的指數,這樣的計算量相當巨大。英國圍棋聯盟裁判托比表示:“圍棋是世界上最為復雜的智力游戲,它簡單的規則加深了棋局的復雜性”。因此,進入圍棋領域一直被認為是目前人工智能的最大挑戰。
簡而言之,AlphaGo取得勝利的一個很重要的方面就是它擁有強大的“學習”能力。深度學習是源于人工神經網絡的研究,得益于大數據和互聯網技術。本文就從人工智能的發展歷程與現狀入手,在此基礎上分析了人工智能的未來發展前景。
1.人工智能的發展歷程
AlphaGo的勝利表明,人工智能發展到今天,已經取得了很多卓越的成果。但是,其發展不是一帆風順的,人工智能是一個不斷進步,并且至今仍在取得不斷突破的學科。回顧人工智能的發展歷程,可大致分為孕育、形成、暗淡、知識應用和集成發展五大時期。
孕育期:1956年以前,數學、邏輯、計算機等理論和技術方面的研究為人工智能的出現奠定了基礎。德國數學家和哲學家萊布尼茨把形式邏輯符號化,奠定了數理邏輯的基礎。英國數學家圖靈在1936年創立了自動機理論(亦稱圖靈機),1950年在其著作《計算機與智能》中首次提出“機器也能思維”,被譽為“人工智能之父”。總之,這些人為人工智能的孕育和產生做出了巨大的貢獻。
形成期:1956年夏季,在美國達特茅斯大學舉辦了長達2個多月的研討會,熱烈地討論用機器模擬人類智能的問題。該次會議首次使用了“人工智能”這一術語。這是人類歷史上第一次人工智能研討會,標志著人工智能學科的誕生。其后的十幾年是人工智能的黃金時期。在接下來的幾年中,在眾多科學家的努力下,人工智能取得了矚目的突破,也在當時形成了廣泛的樂觀思潮。
暗淡期:20世紀70年代初,即使最杰出的AI程序也只能解決問題中最簡單的部分,發展遇到瓶頸也就是說所有的AI程序都只是“玩具”,無法解決更為復雜的問題。隨著AI遭遇批評,對AI提供資助的機構也逐漸停止了部分AI的資助。資金上的困難使得AI的研究方向縮窄,缺少了以往的自由探索。
知識應用期:在80年代,“專家系統”(Expect System)成為了人工智能中一個非常主流的分支。“專家系統”是一種程序,為計算機提供特定領域的專門知識和經驗,計算機就能夠依據一組從專門知識中推演出的邏輯規則在某一特定領域回答或解決問題。不同領域的專家系統基本都是由知識庫、數據庫、推理機、解釋機制、知識獲取等部分組成。
集成發展期:得益于互聯網的蓬勃發展、計算機性能的突飛猛進、分布式系統的廣泛應用以及人工智能多分支的協同發展,人工智能在這一階段飛速發展。尤其是隨著深度學習和人工神經網絡研究的不斷深入,人工智能在近幾十年中取得了長足的進步,取得了令人矚目的成就。
人工智能發展到今天,出現了很多令人矚目的研究成果。AlphaGo的勝利就是基于這些研究成果的一個里程碑。當前人工智能的研究熱點主要集中在自然語言處理、機器學習、人工神經網絡等領域。
2.人工智能l展現狀與前景
人工智能當前有很多重要的研究領域和分支。目前,越來越多的AI項目依賴于分布式系統,而當前研究的普遍熱點則集中于自然語言處理、機器學習和人工神經網絡等領域。
自然語言處理:自然語言處理(Natural Language Processing,簡稱NLP),是語言學與人工智能的交叉學科,其主要功能就是實現讓機器明白人類的語言,這需要將人類的自然語言轉化為計算機能夠處理的機器語言。
自然語言處理主要包括詞法分析、句法分析和語義分析三大部分。詞法分析的核心就是分詞處理,即單詞的邊界處理。句法分析就是對自然語言中句子的結構、語法進行分析如辨別疑問句和感嘆句等。而語義分析則注重情感分析和整個段落的上下文分析,辨別一些字詞在不同的上下文定的語義和情感態度。
當前自然語言的處理主要有兩大方向。一種是基于句法-語義規則的理性主義理論,該理論認為需要為計算機制定一系列的規則,計算機在規則下進行推理與判斷。因此其技術路線是一系列的人為的語料建設與規則制定。第二種是基于統計學習的經驗主義理論,這種理論在最近受到普遍推崇。該理論讓計算機自己通過學習并進行統計推斷的方式不停地從數據中“學習”語言,試圖刻畫真實世界的語言現象,從數據中統計語言的規律。
機器學習:機器學習(Machine Learning)是近20年來興起的人工智能一大重要領域。其主要是指通過讓計算機在數據中自動分析獲得規律,從而獲取“自我學習”的能力,并利用規律對未知數據進行判斷和預測的方法。
機器學致可以分為有監督的學習和無監督的學習。有監督的學習是從給定的訓練數據集中練出一個函數和目標,當有新的數據到來時,可以由訓練得到函數預測目標。有監督的學習要求訓練集同時有輸入和輸出,也就是所謂的特征和目標。而依據預測的結果是離散的還是連續的,將有監督的學習分為兩大問題,即統計分類問題和回歸分析問題。統計分類的預測結果是離散的,如腫瘤是良性還是惡性等;而回歸分析問題目標是連續的,如天氣、股價等的預測。
無監督學習的訓練集則沒有人為標注的結果,這就需要計算機去發現數據間的聯系并用來分類等。一種常見的無監督學習是聚類分析(Cluster Analysis),它是將相似的對象通過靜態分類的方法分成不同的組別或者是特定的子集,讓同一個子集中的數據對象都有一些相似的屬性,比較常用的聚類方法是簡潔并快速的“K-均值”聚類算法。它基于K個中心并對距離這些中心最近的數據對象進行分類。
機器學習還包括如半監督學習和增強學習等類別。總而言之,機器學習是研究如何使用機器來模擬人類學習活動的一門學科,而其應用隨著人工智能研究領域的深入也變得越來越廣泛,如模式識別、計算機視覺、語音識別、推薦算法等領域越來越廣泛地應用到了機器學習中。
人工神經網絡:在腦神經科學領域,人們認為人類的意識及智能行為,都是通過巨大的神經網絡傳遞的,每個神經細胞通過突出與其他神經細胞連接,當通過突觸的信號強度超過某個閾值時,神經細胞便會進入激活狀態,向所連接的神經細胞一層層傳遞信號。于1943年提出的基于生物神經元的M-P模型的主要思想就是將神經元抽象為一個多輸入單輸出的信息處理單元,并通過傳遞函數f對輸入x1,x2…,xn進行處理并模擬神經細胞的激活模式。主要的傳遞函數有階躍型、線性型和S型。
在此基礎上,對神經網絡算法的研究又有諸多進展。日本的福島教授于1983年基于視覺認知模型提出了卷積神經網絡計算模型。通過學習訓練獲取到卷積運算中所使用的卷積系數,并通過不同層次與自由度的變化,可以得到較為優化的計算結果。而AlphaGo也正是采用了這種深度卷積神經網絡(DCNN)模型,提高了AlphaGo的視覺分類能力,也就是所謂的“棋感”,增強了其對全盤決策和把握的能力。
3.人工智能的發展前景
總體來看,人工智能的應用經歷了博弈、感知、決策和反饋這幾個里程碑。在以上4個領域中,既是縱向發展的過程,也是橫向不斷改進的過程。
人工智能在博弈階段,主要是實現邏輯推理等功能,隨著計算機處理能力的進步以及深度學習等算法的改進,機器擁有了越來越強的邏輯與對弈能力。在感知領域,隨著自然語言處理的進步,機器已經基本能對人類的語音與語言進行感知,并且能夠已經對現實世界進行視覺上的感知。基于大數據的處理和機器學習的發展,機器已經能夠對周圍的環境進行認知,例如微軟的Kinect就能夠準確的對人的肢體動作進行判斷。該領域的主要實現還包括蘋果的Siri,谷歌大腦以及無人駕駛汽車中的各種傳感器等。在以上兩個階段的基礎上,機器擁有了一定的決策和反饋的能力。無人駕駛汽車的蓬勃發展就是這兩個里程碑很好的例證。Google的無人駕駛汽車通過各種傳感器對周圍的環境進行感知并處理人類的語言等指令,利用所收集的信息進行最后的決策,比如操作方向盤、剎車等。
人工智能已經滲透到生活中的各個領域。機器已經能識別語音、人臉以及視頻內容等,從而實現各種人際交互的場景。在醫學領域,人工智能可以實現自動讀片和輔助診斷以及個性化t療和基因排序等功能。在教育領域,機器也承擔了越來越多的輔助教育,智能交互的功能。在交通領域,一方面無人車的發展表明無人駕駛是一個可以期待的未來,另一方面人工智能能夠帶來更加通暢和智能的交通。另外人工智能在安防、金融等領域也有非常廣闊的發展前景。總之,人工智能在一些具有重復性的和具備簡單決策的領域已經是一種非常重要的工具,用來幫助人們解決問題,創造價值。
參考文獻
[1]阮曉東.從AlphaGo的勝利看人工智能的未來[J].新經濟導刊,2016 (6):69-74.
關鍵詞:PCB;圖像處理;視覺檢測
中圖分類號:TP277文獻標識碼:A文章編號:1009-3044(2012)07-1648-06
當今世界科技發展日新月異,電子產業的發展直接制約著國民經濟的騰飛與否,而PCB電路板制作工藝的提高對促進電子產業的發展至關重要,能否有效精確地檢測PCB電路板的缺陷一直都是電子行業的研究熱點。國外的印刷電路板自動檢測技術一直領先于國內,國內的很多廠家不得不采用昂貴的外國技術,雖然近年國內的印刷電路板自動檢測技術發展迅速,但大都沒有取得令人非常滿意的結果。加入研究這一領域的熱潮,趕超外國的先進技技水平,打斷外國壟斷技術,對于發展國民經濟具有十分重要的意義。
1 PCB檢測系統的硬件設計
1.1 PCB檢測系統的硬件組成框圖
雖然本文所做的工作主要是軟件方面,但對于硬件系統的設計也是至關重要的,它對于建立有效的計算機視覺識別檢測系統,起著決定性作用。因此,必須在綜合考慮系統性價比和系統性能的基礎上,設計出合理的硬件系統[9]。PCB檢測系統的硬件組成框圖如圖1所示:圖1 PCB檢測系統硬件組成框圖
1.2系統的硬件組成
系統的硬件組成[10]主要包括:計算機主機、CCD攝像機、圖像采集卡、照明系統及相關的設備。
2 PCB電路板缺陷檢測識別
PCB電路板在電子工業中的應用越來越廣泛,如何降低電路板的故障率、提高電路板的質量直接影響到整個產業的發展。因此,對于PCB電路板缺陷的識別技術的發展至關重要。PCB電路板的缺陷很多[16],主要有短路、斷路、劃痕、凸起、空洞、缺焊、過焊等等,由于實驗室設備限制和個人水平所限,本文主要研究的內容是PCB電路板短路與斷路的檢測識別
近年來出現了很多圖像檢測算法,這些算法大致可分為三大類:有參考算法、無參考算法以及混合型算法。有參考算法分為兩大類:圖像對比法和模型對比法。無參考算法是一種不需要標準圖像的檢測算法,它是基于一定的設計規則來進行檢測的。混合型方法是將有參考算法與無參考算法混合使用,從而發揮出各自的優點。比如,模板匹配法與數學形態學方法結合使用,或者連接表方法與數學形態學方法結合使用等。本文中短路與斷路的檢測識別采取了圖像對比法,即將經過一定處理后的圖像進行相減,從而分析相應的結果;而對焊點缺陷的識別主要采用模板匹配法與數學形態學方法結合使用。
2.1 PCB電路板缺陷檢測識別的主要流程圖
圖2為子程序流程圖;圖3為主程序流程圖。
2.2 PCB電路板短路與斷路的檢測識別
2.2.1邊緣檢測
在對圖像進行基本的處理過后可以將圖像與背景分割開來。邊緣檢測是圖像處理和計算機視覺中的基本問題,邊緣檢測的目的是標識數字圖像中亮度變化明顯的點。圖像屬性中的顯著變化通常反映了屬性的重要事件和變化。
這些包括:深度上的不連續;表面方向不連續;物質屬性變化;場景照明變化。邊緣檢測是圖像處理和計算機視覺中,尤其是特征提取中的一個研究領域。
圖像邊緣檢測大幅度地減少了數據量,并且剔除了可以認為不相關的信息,保留了圖像重要的結構屬性。有許多方法用于邊緣檢測,它們的絕大部分可以劃分為兩類[17]:基于查找一類和基于零穿越的一類。基于查找的方法通過尋找圖像一階導數中的最大和最小值來檢測邊界,通常是將邊界定位在梯度最大的方向。基于零穿越的方法通過尋找圖像二階導數零穿越來尋找邊界,通常是Laplacian過零點或者非線性差分表示的過零點。
1)Roberts算子
邊緣,是指周圍像素灰度有階躍變化或屋頂等變化的那些像素的集合。圖像的邊緣對應著圖像灰度的不連續性。顯然圖像的邊緣很少是從一個灰度跳到另一個灰度這樣的理想狀況。真實圖像的邊緣通常都具有有限的寬度呈現出陡峭的斜坡狀。邊緣的銳利程度由圖像灰度的梯度決定。梯度是一個向量,?f指出灰度變化的最快的方向和數量,如式2-1所示。
?f=(決定的。
因此最簡單的邊緣檢測算子是用圖像的垂直和水平差分來逼近梯度算子,式2-4所示。?f=(f(x,y)-f(x-1,y),f(x,y)-f(x,y-1))(式2-4)
因此當我們想尋找邊緣的時候,最簡單的方法是對每一個像素計算出(2,4)的向量,然后求出他的絕對值,然后進行閥值操作就可以了。利用這種思想就得到了Roberts算子,由式2-5所示。
R(i,j)=
(式2-5)
它是一個兩個2×2模板作用的結果。
2)Sobel算子
該算法通過2個3*3的模板,對選定的二維圖像中同樣大小窗口進行卷積,通常是一個模板對一個邊緣響應大,另一個模板對水平邊緣響應大,兩個卷積值對最大值作為該點對輸出。對于圖像上的任意點(i,j)進行卷積,可得其X方向上的差分由式2-6、式2-7所示。Δx=f(i-1,j+1)+2f(i,j+1)+f(i+1,j+1)-[f(i-1,j-1)+2f(i,j-1)+f(i+1,j-1)](式2-6)Δy=f(i-1,j-1)+2f(i-1,j)+f(i-1,j+1)-[f(i+1,j+1)+2f(i+1,j)+f(i+1,j+1)](式2-7)則輸出圖像公式如式2-8所示。
用sobel算子檢測階躍邊緣得到的邊緣寬度至少為兩個寬度。3)Laplacian邊緣檢測算子
Laplacian算子定義由式2-9所示。
Δ2f(x,y)=
(式2-9)它的差分形式由式2-10所示。
Δ2f(x,y)={[f(x+1,y)-f(x,y)]-[f(x,y)-f(x-1,y)]}+{[f(x,y+1)-f(x,y)]-[f(x,y)-f(x,y-1)]}
=f(x+1,y)+f(x-1,y)+f(x,y-1)+f(x,y+1)+f(x,y+1)+4f(x+1,y)(式2-10)
Laplacian算子是一種各向同性算子,在只關心邊緣的位置而不考慮其周圍的灰度象素差值時時比較合適,Laplacian算子對孤立象素的響應要比對邊緣或線的響應更要強烈,因此只適用于無噪聲圖像。
原圖像與用三種邊緣檢測算子處理后的圖像如下所示:圖6 Sobel邊緣檢測圖7 Laplacian邊緣檢測
從上面四幅圖分析比較可得出結論:用Roberts邊緣檢測得出的圖像較之其他方法更為清晰,噪點更少,圖像更為連續,所以本文中采用Roberts算子來進行邊緣檢測。
2.2.2閾值分割
閾值分割法是一種基于區域的圖像分割技術,其基本原理是:通過設定不同的特征閾值,把圖像象素點分為若干類。常用的特征包括:直接來自原始圖像的灰度或彩色特征;由原始灰度或彩色值變換得到的特征。設原始圖像為f(x,y),按照一定的準則f(x,y)中找到特征值T,將圖像分割為兩個部分,分割后的圖像為:
若取:b0=0(黑),b1=1(白),即為我們通常所說的圖像二值化。
在數字化的圖像數據中,無用的背景數據和對象物的數據經常放在一起,同時,圖像中還含有各種噪聲,因此可以根據圖像的統計性質,從概率的角度來選擇合適的閾值。
1)最大方差閾值法
把待處理圖像的直方圖在某一閾值處分割為兩組,當被分割成的兩組間的方差最大時,便可以決定閾值了。
設灰度圖像f(x,y)的灰度級為0-L,灰度級I的像素為Ni,則圖中:
總象素數N=∑j=0 i=LNi(式2-11)灰度級i出現的概率Pi= 1-ω(K)(式2-16)則兩組間的數學期望為ω0μ0ω1μ1=μ(式2-17)兩組間的方差為ρ2(k)
ρ2(k)是K的函數,計算k取從0,1,2…L時ρ2(k)的值,當多的值為最大時,K即為閾值。
2)雙峰法
根據圖像的直方圖具有背景和對象物的兩個峰,分割兩個區域的閾值由兩個峰值之間的谷所對應的灰度值決定。設灰度圖像f(x,y)的灰度級為0-L,灰度i的像素為Pi,分別計算
因為實際PCB電路板有著許多的劃痕、污點等,使用最大方差閾值法時,會在處理后的圖像上產生許多誤點,而影響實際結果的分析,而雙峰法能夠順利地濾除這些干擾,這個結論在分析對比以上圖像時也可得出。所以本文選用了雙峰法來進行閾值分割。
2.2.3粒子分析與圖像對比
經過邊緣檢測和閾值分割的圖像中會存在許多瑕點,這些點會影響到最后的圖像識別與分析,有可能會增加多余的殘留圖像。本文中利用NI VISION ASSISTANT中的REMOVE SMALL OBJECTS功能進行去除,如圖11和圖12所示。圖11原圖像圖12粒子分析
將標準PCB圖片減去缺陷缺陷PCB圖片,便可以得到缺陷板的斷路部分的圖像,再利用NI ASSISTANT中的PARTICLE ANALYSIS可以得到斷路部分的具體分析,如圖13示。
將缺陷PCB圖片減去標準PCB圖片,便可以得到缺陷板的短路部分的圖像,與上述相同的方法,便可以得到短路部分的具體分析,如圖14所示。
3結束語
利用LABVIEW來進行PCB電路板缺陷的識別與檢測是一項非常好的課題,它在近些年已經得到了一定的發展,并將得到更大的進步。限于本人能力和時間,本文的研究還未涉及很深的領域,可以在以下方面加以改進:
1)本文中只利用到NI公司的LABVIEW和IMAQ VISION,更好的設計可以再利用其他語言如VISUAL BASIC,C++等編程語言加以輔助設計,相信可以取得更加令人滿意的結果。
2)由于實驗設備等其他因素,本文中只重點研究了PCB電路板短路與斷路的檢測識別,PCB電路板的其他缺陷還有待于進一步的分析研究、分類和總結,并設計出更好的檢測方法,以真正滿足PCB電路板檢測的需求。
3)照明設備的限制在很大程度上影響到了圖像的檢測效果,為取得PCB缺陷檢測的進一步進展,在照明設備的選擇上必須重視,并且設計出更好的圖像采集系統。
4)在識別與檢測手段上,可以引入更新更好的方法,而不要局限于在傳統的方法中分析比較,例如基于BP神經網絡的識別檢測,圖像的模糊決策等將有待于進一步研究。
總之,基于LABVIEW的機器視覺檢測系統已經取得了不錯的進展,高速發展的PCB制造技術和計算機技術對于PCB缺陷的檢測提出了更高的要求,同時也大大地促進了PCB缺陷檢測技術的發展。利用機器視覺檢測在未來的較長的一段時間內將占據檢測行業的半壁江山,相信在未來會取得更大的發展。
參考文獻:
[1]程學慶,房曉溪.LabVIEW圖形化編程與實例應用[M].北京:中國鐵道出版社,2005.
[2]胡仲波.基于虛擬儀器技術的PCB視覺檢測系統[D].南京:南京理工大學碩士學位論文,2006.
[3]段峰,王耀南.機器視覺技術及其應用綜述[J].自動化博覽,2002,19(3).
[4]周長發.精通Visual C++圖像處理編程[M].北京:電子工業出版社,2004.
[5]陳錫輝,張銀鴻.LabVIEW 8.20程序設計從入門到精通[M].北京:清華大學出版社,2007.
[6]鄭偉.圖像法檢測印刷電路板缺陷[M].西安:西安理工大學,2002.
[7] National Instruments,IMAQ User Manual Concepts[Z].1999.
[8]李強.PCB板缺陷自動檢測技術的分析研究[D].合肥:合肥工業大學,2002.
[9]傅茂名.基于形態邊緣檢測算法的一種改進[J].電子科技大學學報,2005(2).
[10]王思華.計算機視覺新技術及其在IC標記質量檢驗系統設計中的應用[J].電子技術應用,2000(9).
[11]岳永哲.圖像處理技術在閱卷系統中的應用[D].北京:北京工業大學,2006.
[12] Bruce sehneier.Applied Cryptography protocols,Algorithms,and SourceCode[M].C Jolm Wiley & Sons,Inc,1994.
[13] William work Security Essentials:Applications and Standard[M].Prentice Hall/Pearson,2002.
[14]高育鵬,楊俊,何廣軍.基于圖像識別的自動閱卷系統研究[J].現代電子期刊,2006(22).
[15]楊青燕,彭延軍.基于灰度圖像的答題卡識別技術[J].山東科技大學學報:自然科學版,2009(3).
[16]周海濤,韓曉軍.基于數字圖像處理的答題卡識別方法研究[J].電腦知識與技術,2008(28).
[17]周萬珍,鄭廣,王建霞,等.數字圖像處理技術在客觀題閱卷中的應用[J].數學的實踐與認識,2006(8).
[18]王勝春.基于SVM的信息卡識別系統[D].長沙:湖南師范大學,2008.
[19]吳志明.SMT系統中焊點位置的檢測[D].哈爾濱:哈爾濱工業大學,2006.
[20]楊敏,王春青,鄒增大,等.表面組裝印刷電路板上焊點信息的自動獲取[J].焊接學報,2005,39(6).