&

前言：想要寫出一篇引人入勝的文章？我們特意為您整理了計算機視覺中深度學習的應用范文，希望能給你帶來靈感和參考，敬請閱讀。

計算機視覺中深度學習的應用

摘要：闡述計算機視覺借助攝影機與計算機取代人眼對事物進行識別、觀察和分析的一種機器視覺，深度學習技術(shù)在很大程度上促進計算機視覺的發(fā)展，探討計算機視覺領域中的深度學習技術(shù)的應用實例。

關鍵詞：計算機工程；視覺領域；深度學習技術(shù)

引言

計算機視覺簡言之即是依靠電子設備成像來代替生物視覺系統(tǒng)，隨后依靠提前寫好的程序?qū)Λ@取的圖像信息實施處理。該技術(shù)的短期應用目的在于完成相對簡單的智能視覺工作，而深度學習技術(shù)在計算機視覺領域的應用，在很大程度上豐富了其功能，提高了識別效率，讓其能夠在更多行業(yè)發(fā)揮出自身價值。

1計算機視覺領域的深度學習技術(shù)

1.1圖像分類中的深度學習技術(shù)

基于深度學習技術(shù)，卷積神經(jīng)網(wǎng)絡得到了進一步的發(fā)展，其應用范圍也更為寬泛，例如說在圖像分類中的運用。圖像分析需要對圖像實施掃描分析，隨后對其具體類別予以劃分，更加注重其整體語義。目前相對普遍進行圖像分類的數(shù)據(jù)集為ImageNet，其中囊括了非常豐富的內(nèi)容，存儲了近1500萬個圖像的URL并將圖像劃分為數(shù)萬余個類型。ImageNet每年組織開展的大規(guī)模視覺識別挑戰(zhàn)賽（ILSVRC）中，圖像分類算法與技術(shù)也不斷創(chuàng)新，圖像分類的準確性也持續(xù)提升。ImageNet數(shù)據(jù)集表現(xiàn)出規(guī)模大、類型多的突出特點，所以更加適用于遷移學習，即是把部分核心技術(shù)或結(jié)構(gòu)拓展應用到各個領域，對于視覺領域的深度模型來說，能夠把模型內(nèi)的網(wǎng)絡結(jié)構(gòu)和參數(shù)直接共享到其他數(shù)據(jù)集，從而對數(shù)據(jù)實施微調(diào)。圖像分類屬于計算機視覺領域最為基礎的環(huán)節(jié)，對于圖像分類模型創(chuàng)建和數(shù)據(jù)分析處理經(jīng)驗也能夠遷移應用到其他領域中。

1.2目標檢測中的深度學習技術(shù)

目標檢測相對于圖像分類而言表現(xiàn)出更多的復雜性，主要任務是在囊括多種不同類型物體的圖像內(nèi)精確定位和識別某一物體，恰恰是出于這一目的，深度學習技術(shù)在目標檢測中的應用更為復雜，要實現(xiàn)更加精準的效果也相對更難。近年來針對目標檢測的算法日益更新，如優(yōu)化后的R-CNN算法，是借助于卷積神經(jīng)網(wǎng)絡思想，對物體進行分類，提取物體特征。而SelectiveSearch算法的出現(xiàn)有了進一步的創(chuàng)新和突破，有效促進了檢測準確性的提高，這也給通過卷積神經(jīng)網(wǎng)絡進行目標檢測帶來了更多可能性，隨后的FastR-CNN算法極大地促進了目標檢測效率的提升，該算法對提取候選區(qū)的問題予以優(yōu)化，大大減少了候選區(qū)提取和目標檢測過程的時間。目標檢測網(wǎng)絡以FastR-CNN算法作為支撐，于輸出位置設置滑動窗同時和候選區(qū)域網(wǎng)絡實施連接，目標檢測的關鍵在于卷積神經(jīng)網(wǎng)絡，依靠它把各個點的特征進行提取，再借助回歸算法獲得對應范圍出現(xiàn)目標的概率[1]。

1.3人臉識別中的深度學習技術(shù)

人臉識別主要是借助相應算法對人臉特征實施提取，因為其建立的人臉模型表現(xiàn)出一定的不穩(wěn)定性，因此模型建立往往也表現(xiàn)出一定的難度，相對于建立剛體模型而言更為困難。人臉識別通常來說涉及人臉檢測定位以及特征提取兩個方面，人臉檢測定位是基于背景圖像中將人臉目標分割出來，實施歸一化處理，而人臉特征提取算法不變。前者存在的技術(shù)難點是人臉目標具有多樣性以及背景圖像具有復雜性，所以對背景情境實施合理假設并予以簡化是十分關鍵的。與此同時，高維空間人臉模型的建立較為復雜，精確度估算難度較大，人臉特征提取的技術(shù)難度是因為人臉屬于彈性模型，其難度超過剛體模型。一般來說，較為常見對人臉特征實施提取與識別的方法有幾何特征法、特征臉算法以及彈性模型法，CNN算法和過去的特征提取算法比起來表現(xiàn)出更高的穩(wěn)定性和適用性，同時能夠有效抵抗外部干擾，促進人臉識別技術(shù)的推廣應用。

2應用實例

2.1安防領域的應用

深度學習技術(shù)在計算機視覺領域中的應用可以為安防行業(yè)提供更佳的解決方案，比如說人臉識別技術(shù)的應用，很多大型企業(yè)如Facebook、騰訊、阿里巴巴等都將非常關注和重視。作為深度學習技術(shù)在計算機視覺領域應用的重要內(nèi)容，人臉識別在安檢以及反恐等領域中也能夠發(fā)揮出很好的效果。與此同時，對行人角度的REID技術(shù)實施研究，依托于深度學習強化目標檢測，對目標特征實施提取和刻畫，能夠為異常行為監(jiān)控和跟蹤帶來支持[2]。

2.2無人駕駛領域的應用

對于無人駕駛領域來說，選擇激光或雷達這類傳感器的成本更高，基于深度學習的計算機視覺技術(shù)也能夠提供新的解決方案。依靠攝像機對視頻畫面進行采集，對獲取到的圖像實施分析，提供類似于前車碰撞預警等功能。在這一過程中，計算機視覺技術(shù)可以實現(xiàn)對目標的檢測識別、對目標車輛的跟蹤分析、對車道線是否偏離進行檢測等?；谏疃葘W習技術(shù)的檢測識別表現(xiàn)出更加強大的優(yōu)勢，現(xiàn)階段深度學習芯片日益增多，對于無人駕駛技術(shù)的發(fā)展也帶來了更加有力的支持。

2.3智能家居領域的應用

過去的很多智能家居產(chǎn)品一般都是依靠智能手機藍牙或者WiFi等途徑來實現(xiàn)對家居產(chǎn)品的控制，這一方案即便能夠做到家居智能化，但其水平依舊有待提高?；谏疃葘W習技術(shù)，能夠有效促進智能家居行業(yè)的更新發(fā)展，除開語言、語音識別之外，還能夠利用計算機視覺技術(shù)實現(xiàn)人際交流與互動，比如說手勢識別控制。2.4教育領域和圖片搜索領域的應用基于深度學習的計算機視覺技術(shù)也能夠在智慧教育中得以普及應用，如近年來很多新的拍照解題App，使用者只需要利用手機相機拍照上傳即可獲得相關題目的分析解答，促進學習者學習效率的提升。此時視覺技術(shù)包括了對文字的檢測與識別，另外針對個人簡歷識別、文檔識別等方面也能夠進行拓展應用。同時計算機視覺技術(shù)還可以在圖片搜索領域中得以應用，使用者通過拍攝上傳相應的圖片，即可從數(shù)據(jù)庫中找出與原圖相似的圖片，深度學習屬于一種非常高效的技術(shù)手段，能夠提供更加快速高效的圖像檢測功能，結(jié)合圖像搜索引擎，為用戶帶來更加便捷的服務[3-5]。

2.5醫(yī)療影像數(shù)據(jù)中的應用

醫(yī)學影像直接關系到對患者疾病診斷的準確性，對于放射科的醫(yī)務人員來說，依靠醫(yī)學影像能夠促進診斷效率的提升?，F(xiàn)階段國內(nèi)外諸多醫(yī)學專家隊伍，在心血管、腫瘤、神經(jīng)內(nèi)科以及五官科等都建立了精準深度學習模型，極大地推動醫(yī)療水平的提升，為廣大患者帶來了更加便捷和高效的醫(yī)療服務。基于深度學習技術(shù)的計算機視覺在醫(yī)療影像數(shù)據(jù)中的應用主要集中在如下幾個方面：（1）能夠提供臨床診斷輔助等醫(yī)療服務；（2）依靠數(shù)據(jù)分析技術(shù)，能夠在很大程度上促進醫(yī)療機構(gòu)經(jīng)營管理水平的提升；（3）在醫(yī)學影像中的應用，能夠讓醫(yī)務工作者更加直觀便捷地獲取患者影像；（4）深度學習技術(shù)能夠為醫(yī)療大數(shù)據(jù)的可視化帶來便利；（5）在藥企研發(fā)工作中的應用，可以處理好過去一直以來藥物研發(fā)周期長和成本居高不下的問題；（6）在健康管理領域中的應用，借助于可穿戴設備來對個人健康數(shù)據(jù)實施監(jiān)測，進而對疾病風險予以提前預測。

3結(jié)語

深度學習技術(shù)在計算機視覺領域中應用的終極目標是為了讓機器可以和人類一樣，觀察并讀懂世界。近年來AI技術(shù)的不斷發(fā)展與普及應用，深度學習技術(shù)必然會在計算機視覺領域中發(fā)揮出更大的價值，為現(xiàn)代人的生活和工作帶來更多便利。

參考文獻

[1]尹黎明,魯屹華.基于深度學習的監(jiān)控視頻圖像增強方法[J].湖北科技學院學報,2019,39(05):123-125+130.

[2]林成創(chuàng),單純,趙淦森,楊志榮,彭璟,陳少潔,黃潤樺,李壯偉,易序晟,杜嘉華,李雙印,羅浩宇,樊小毛,陳冰川.機器視覺應用中的圖像數(shù)據(jù)增廣綜述[J].計算機科學與探索,2021,15(04):583-611.

[3]白翔,龐彥偉,章國鋒.計算機視覺中的深度學習專題(2020)簡介[J].中國科學:信息科學,2020,50(02):303-304.

[4]馬元元,李向偉,劉艷飛.海量監(jiān)控視頻分級摘要生成系統(tǒng)研究[J].現(xiàn)代電子技術(shù),2017,40(13):34-37.

[5]陳昭,趙蘇艷.盲環(huán)境下稀疏編碼監(jiān)控視頻圖像降噪仿真[J].計算機仿真,2020,37(03):368-371.

作者：徐衛(wèi)軍單位：河北大學

計算機視覺中深度學習的應用

相關熱門標簽

相關文章閱讀

相關期刊推薦

計算機

現(xiàn)代計算機

現(xiàn)代計算機 · 上半月版

現(xiàn)代計算機 · 下半月版

北京計算機

精選范文推薦