
本文主要是關于機器視覺的相關介紹,并著重對機器視覺的應用場景進行了詳盡的闡述。
機器視覺是人工智能正在快速發(fā)展的一個分支。簡單說來,機器視覺就是用機器代替人眼來做測量和判斷。機器視覺系統(tǒng)是通過機器視覺產(chǎn)品(即圖像攝取裝置,分CMOS和CCD兩種)將被攝取目標轉換成圖像信號,傳送給專用的圖像處理系統(tǒng),得到被攝目標的形態(tài)信息,根據(jù)像素分布和亮度、顏色等信息,轉變成數(shù)字化信號;圖像系統(tǒng)對這些信號進行各種運算來抽取目標的特征,進而根據(jù)判別的結果來控制現(xiàn)場的設備動作。
機器視覺是一項綜合技術,包括圖像處理、機械工程技術、控制、電光源照明、光學成像、傳感器、模擬與數(shù)字視頻技術、計算機軟硬件技術(圖像增強和分析算法、圖像卡、 I/O卡等)。一個典型的機器視覺應用系統(tǒng)包括圖像捕捉、光源系統(tǒng)、圖像數(shù)字化模塊、數(shù)字圖像處理模塊、智能判斷決策模塊和機械控制執(zhí)行模塊。 [2] 機器視覺系統(tǒng)最基本的特點就是提高生產(chǎn)的靈活性和自動化程度。在一些不適于人工作業(yè)的危險工作環(huán)境或者人工視覺難以滿足要求的場合,常用機器視覺來替代人工視覺。同時,在大批量重復性工業(yè)生產(chǎn)過程中,用機器視覺檢測方法可以大大提高生產(chǎn)的效率和自動化程度。
一個典型的工業(yè)機器視覺系統(tǒng)包括:光源、鏡頭(定焦鏡頭、變倍鏡頭、遠心鏡頭、顯微鏡頭)、 相機(包括CCD相機和COMS相機)、圖像處理單元(或圖像捕獲卡)、圖像處理軟件、監(jiān)視器、通訊 / 輸入輸出單元等。
系統(tǒng)可再分為
一、采集和分析分開的系統(tǒng)。
主端電腦(Host Computer)
影像擷取卡(Frame Grabber)與影像處理器
影像攝影機
定焦鏡頭鏡頭
顯微鏡頭
照明設備
Halogen光源LED光源
高周波螢光燈源
閃光燈源
其他特殊光源
影像顯示器
LCD
機構及控制系統(tǒng)
PLC、PC-Base控制器
精密桌臺
伺服運動機臺
二、采集和分析一體的系統(tǒng)
智能相機(圖像采集和分析一體)
其他配套外圍設備:光源、顯示、PLC控制系統(tǒng)等等。
工作原理
機器視覺檢測系統(tǒng)采用CCD照相機將被檢測的目標轉換成圖像信號,傳送給專用的圖像處理系統(tǒng),根據(jù)像素分布和亮度、顏色等信息,轉變成數(shù)字化信號,圖像處理系統(tǒng)對這些信號進行各種運算來抽取目標的特征,如面積、數(shù)量、位置、長度,再根據(jù)預設的允許度和其他條件輸出結果,包括尺寸、角度、個數(shù)、合格 / 不合格、有 / 無等,實現(xiàn)自動識別功能。
典型結構
一個典型的機器視覺系統(tǒng)包括以下五大塊:
照明
照明是影響機器視覺系統(tǒng)輸入的重要因素,它直接影響輸入數(shù)據(jù)的質量和應用效果。由于沒有通用的機器視覺照明設備,所以針對每個特定的應用實例,要選擇相應的照明裝置,以達到最佳效果。光源可分為可見光和不可見光。常用的幾種可見光源是白熾燈、日光燈、水銀燈和鈉光燈??梢姽獾娜秉c是光能不能保持穩(wěn)定。如何使光能在一定的程度上保持穩(wěn)定,是實用化過程中急需要解決的問題。另一方面,環(huán)境光有可能影響圖像的質量,所以可采用加防護屏的方法來減少環(huán)境光的影響。照明系統(tǒng)按其照射方法可分為:背向照明、前向照明、結構光和頻閃光照明等。其中,背向照明是被測物放在光源和攝像機之間,它的優(yōu)點是能獲得高對比度的圖像。前向照明是光源和攝像機位于被測物的同側,這種方式便于安裝。結構光照明是將光柵或線光源等投射到被測物上,根據(jù)它們產(chǎn)生的畸變,解調出被測物的三維信息。頻閃光照明是將高頻率的光脈沖照射到物體上,攝像機拍攝要求與光源同步。
鏡頭
FOV(Field of Vision)=所需分辨率*亞象素*相機尺寸/PRTM(零件測量公差比)
鏡頭選擇應注意:
1焦距2目標高度 3影像高度 4放大倍數(shù) 5影像至目標的距離 6中心點 /節(jié)點7畸變
視覺檢測中如何確定鏡頭的焦距
為特定的應用場合選擇合適的工業(yè)鏡頭時必須考慮以下因素:
· 視野 - 被成像區(qū)域的大小。
· 工作距離 (WD) - 攝像機鏡頭與被觀察物體或區(qū)域之間的距離。
· CCD - 攝像機成像傳感器裝置的尺寸。
· 這些因素必須采取一致的方式對待。如果在測量物體的寬度,則需要使用水平方向的 CCD 規(guī)格,等等。如果以英寸為單位進行測量,則以英尺進行計算,最后再轉換為毫米。
參考如下例子:有一臺 1/3” C 型安裝的 CCD 攝像機(水平方向為 4.8 毫米)。物體到鏡頭前部的距離為 12”(305 毫米)。視野或物體的尺寸為2.5”(64 毫米)。換算系數(shù)為 1” = 25.4 毫米(經(jīng)過圓整)。
FL = 4.8 毫米 x 305 毫米 / 64 毫米
FL = 1464 毫米 / 64 毫米
FL = 按 23 毫米鏡頭的要求
FL = 0.19” x 12” / 2.5”
FL = 2.28” / 2.5”
FL = 0.912” x 25.4 毫米/inch
FL = 按 23 毫米鏡頭的要求
注:勿將工作距離與物體到像的距離混淆。工作距離是從工業(yè)鏡頭前部到被觀察物體之間的距離。而物體到像的距離是 CCD 傳感器到物體之間的距離。計算要求的工業(yè)鏡頭焦距時,必須使用工作距離
高速相機
按照不同標準可分為:標準分辨率數(shù)字相機和模擬相機等
。要根據(jù)不同的實際應用場合選不同的相機和高分辨率相機:
按成像色彩劃分,可分為彩色相機和黑白相機;
按分辨率劃分,像素數(shù)在38萬以下的為普通型,像素數(shù)在38萬以上的高分辨率型;
按光敏面尺寸大小劃分,可分為1/4、1/3、1/2、1英寸相機;
按掃描方式劃分,可分為行掃描相機(線陣相機)和面掃描相機(面陣相機)兩種方式;(面掃描相機又可分為隔行掃描相機和逐行掃描相機);
按同步方式劃分,可分為普通相機(內同步)和具有外同步功能的相機等。
圖像采集卡
圖像采集卡只是完整的機器視覺系統(tǒng)的一個部件,但是
它扮演一個非常重要的角色。圖像采集卡直接決定了攝像頭的接口:黑白、彩色、模擬、數(shù)字等等。
比較典型的是PCI或AGP兼容的捕獲卡,可以將圖像迅速地傳送到計算機存儲器進行處理。有些采集卡有內置的多路開關。例如,可以連接8個不同的攝像機,然后告訴采集卡采用那一個相機抓拍到的信息。有些采集卡有內置的數(shù)字輸入以觸發(fā)采集卡進行捕捉,當采集卡抓拍圖像時數(shù)字輸出口就觸發(fā)閘門。
視覺處理器
視覺處理器集采集卡與處理器于一體。以往計算機速度較慢時,采用視覺處理器加快視覺處理任務。采集卡傳輸圖像到存儲器,進而計算分析。當前主流配置的PLC,且配置較高,視覺處理器已經(jīng)幾乎退出市場。
TOP 1:人臉識別
人臉識別是人工智能視覺與圖像領域中最熱門的應用, 今年 2 月,《麻省理工科技評論》發(fā)布「2017 全球十大突破性技術」榜單,來自中國的技術「刷臉支付」位列其中。這是該榜單創(chuàng)建 16 年來首個來自中國的技術突破。
人臉識別技術目前已經(jīng)廣泛應用于金融、司法、軍隊、公安、邊檢、政府、航天、電力、工廠、教育、醫(yī)療等行業(yè)。據(jù)業(yè)內人士分析,我國的人臉識別產(chǎn)業(yè)的需求旺盛,需求推動導致企業(yè)敢于投入資金。目前,該技術已具備大規(guī)模商用的條件,未來三到五年將高速增長。而今年,這一技術有望在金融與安防領域迎來大爆發(fā)。
TOP 2:視頻/監(jiān)控分析
視頻/監(jiān)控分析是人工智能視覺與圖像領域中第二大熱門應用。
人工智能技術可以對結構化的人、車、物等視頻內容信息進行快速檢索、查詢。這項應用使得讓公安系統(tǒng)在繁雜的監(jiān)控視頻中搜尋到罪犯的有了可能。在大量人群流動的交通樞紐,該技術也被廣泛用于人群分析、防控預警等。
視頻/監(jiān)控領域盈利空間廣闊,商業(yè)模式多種多樣,既可以提供行業(yè)整體解決方案,也可以銷售集成硬件設備。將技術應用于視頻及監(jiān)控領域在人工智能公司中正在形成一種趨勢,這項技術應用將率先在安防、交通甚至零售等行業(yè)掀起應用熱潮。
TOP 3:圖片識別分析
靜態(tài)圖片識別應用熱度在視覺與圖像領域中排名第三。將人工智能技術單純用于圖片識別分析的應用企業(yè)數(shù)量并不如預想的多,可能有一下幾個方面原因:
1、目前視頻監(jiān)控方向的盈利空間大,眾多企業(yè)的注意力都放在了視頻監(jiān)控領域;
2、人臉識別屬于圖片識別的一個應用場景,做人臉識別的大多數(shù)企業(yè)同時也在提供圖片識別服務,但是銷售效果不佳,主要贏利點還在于人臉識別;
3、圖片識別大多商用場景還屬于藍海,潛力有待開發(fā);
4、圖片數(shù)據(jù)大多被大型互聯(lián)網(wǎng)企業(yè)所掌握,創(chuàng)業(yè)公司數(shù)據(jù)資源稀少。
TOP 4:駕駛輔助/智能駕駛
隨著汽車的普及,汽車已經(jīng)成為人工智能技術非常大的應用投放方向,但就目前來說,想要完全實現(xiàn)自動駕駛/無人駕駛,距離技術成熟還有一段路要走。
不過利用人工智能技術,汽車的駕駛輔助的功能及應用越來越多,這些應用多半是基于計算機視覺和圖像處理技術來實現(xiàn)。
TOP 5:三維圖像視覺
三維圖像視覺主要是對于三維物體的識別,應用于三維視覺建模,三維測繪等領域。
TOP 6:工業(yè)視覺檢測
機器視覺可以快速獲取大量信息,并進行自動處理。在自動化生產(chǎn)過程中,人們將機器視覺系統(tǒng)廣泛地用于工況監(jiān)視、成品檢驗和質量控制等領域。
機器視覺系統(tǒng)的特點是提高生產(chǎn)的柔性和自動化程度。運用在一些危險工作環(huán)境或人工視覺難以滿足要求的場合;此外,在大批量工業(yè)生產(chǎn)過程中,機器視覺檢測可以大大提高生產(chǎn)效率和生產(chǎn)的自動化程度。
TOP 7:醫(yī)療影像診斷
醫(yī)療數(shù)據(jù)中有超過 90% 的數(shù)據(jù)來自醫(yī)療影像。醫(yī)療影像領域擁有孕育深度學習的海量數(shù)據(jù),醫(yī)療影像診斷可以輔助醫(yī)生,提升醫(yī)生的診斷的效率。
2015 年 4 月,IBM 成立了 Watson Health 部門,開始進軍醫(yī)療行業(yè)。2015 年 8 月 6 日,IBM 宣布以 10 億美元的價格收購醫(yī)療影像公司 MergeHealthcare,并將其與新成立的 WatsonHealth 合并。2016 年 2 月,IBM 又斥資 26 億美元收購醫(yī)療數(shù)據(jù)公司 TruvenHealthAnalytics。今年 2 月份,在 HIMSS17 大會上 Watson Health 公布了 IBM 的第
TOP 8:文字識別
計算機文字識別,俗稱光學字符識別,它是利用光學技術和計算機技術把印在或寫在紙上的文字讀取出來,并轉換成一種計算機能夠接受、人又可以理解的格式。這是實現(xiàn)文字高速錄入的一項關鍵技術。
TOP 9:圖像及視頻編輯
2016 年,Google 舉行了一場人工智能作家的畫展。通過一個名叫DeepDream的藝術生成器,谷歌可以將神經(jīng)網(wǎng)絡由內部傳送到外部。不是識別圖像,而是創(chuàng)作圖像。有人稱這些機器做的畫為機器之夢。
目前市場上也出現(xiàn)了很多運用及機器學習算法對圖像進行處理,可以實現(xiàn)對圖片的自動修復、美化、變換效果等操作。并且越來越受到用戶青睞。
機器視覺在應用場景上逐漸突破工業(yè)檢測,其應用邊界逐步向智能生活領域拓展。由于機器視覺在智能生活、智能制造兩個領域具有不同的技術特點和應用進展,所以機器視覺于這兩個領域的行業(yè)發(fā)展趨勢也不盡相同。
一、機器視覺軟件選型要點
1、定位器的準確性
目標或特征的準確定位是一個檢測體系或由視覺引導的運動體系的重要功用。傳統(tǒng)的物體定位選用的是灰度值有關來辨認物體。盡管這種技能得到了廣泛的運用,可是,它在圖象質量變差的狀況,就缺少穩(wěn)定性。圖象質量變差可能是因為雜亂、亮度不一樣和隱瞞等要素的影響。相反,幾何目標定位法是一種最新的辦法,它運用目標的概括來辨認目標及其特征。維視圖像自主研發(fā)的圖像處理軟件多數(shù)采用幾何目標定位法,且效率極高,可以有效的幫助用戶解決定位問題。
2、工具庫還是應用軟件
機器視覺軟件主要以兩種典型的方式出售:一種是包含多種處理算法的工具庫,另一種是專門實現(xiàn)某一類特殊工作的應用軟件。這兩種各有利弊,需要第一時間確認這一特性后再做選擇。維視圖像提供的圖像處理軟件包含這兩種,既可以提供專業(yè)應用又滿足客戶變化多樣的需求。
3、編程和操作方便
簡練、直觀的圖形界面是簡單運用和設置的要害。當今機器視覺商品之間的主要區(qū)別在于他們的圖形接口。接口大概從“設置”和“操作”這兩方面來評估。對一個工程師來講,它大概十分復雜,而關于一個操作者來說應十分簡單。
4、亞像素精度
視覺體系的分辯率是體系能分辯的最小特征。例如,1’’的視覺規(guī)模(FOV)運用一個640x480像素的計算機圖象將得到1/640的分辯率或0.00156’’。實際上,機器視覺算法具有亞像素的才能。也就是說,這些算法可以丈量或得出比一個像素更小的單位。
5、易于升級
機器視覺體系可運用在各種場合,他們的運用規(guī)??蓮臅r尚的攝像機到監(jiān)督體系。當挑選一個體系時應思考體系將來的升級。依據(jù)通用目的的視覺軟件體系十分好晉級。最終用戶大概依據(jù)附加的攝像機、照明的改變、視覺東西的改變等來思考將來對體系的需要。
6、圖象預處理算法
大部分的圖像處理軟件提供預處理算法,所以需要比較其提供的豐富程度,效率等。
7、體系集成
假如你對機器視覺技能不是很精通,那么針對你的項目就需要一個體系集成商,理想的視覺商品能被體系集成商廣泛承受。
二、常用機器視覺軟件介紹
1. OpenCV,開源免費的圖像處理庫
OpenCV是近年來推出的開源、免費的計算機視覺庫,利用其所包含的函數(shù)可以很方便地實現(xiàn)數(shù)字圖像和視頻處理。同時利用面向對象的VC++ 6.0編程工具,用C++語言進行程序編寫 OpenCV算法庫為VC++編程處理數(shù)字圖像提供了很大的方便,其必將成為圖像視頻處理領域的強有力的工具。
缺點:由于是開源軟件,因此其版本繁多,函數(shù)庫復雜,執(zhí)行效率收到應用,比較適用于科研和學習,不適合工業(yè)應用。
2. Halcon,強大的圖像處理庫
HALCON是德國MVtec公司開發(fā)的一套完善的標準的機器視覺算法包,擁有應用廣泛的機器視覺集成開發(fā)環(huán)境。它節(jié)約了產(chǎn)品成本,縮短了軟件開發(fā)周期——HALCON靈活的架構便于機器視覺,醫(yī)學圖像和圖像分析應用的快速開發(fā)。在歐洲以及日本的工業(yè)界已經(jīng)是公認具有最佳效能的Machine Vision軟件
缺點:價格比較貴,每次分發(fā)需要重新購買授權。
3. NI Vision,快速驗證的圖像處理庫(含視覺助手、VBAI)
關于機器視覺的相關介紹就到這了,如有不足之處歡迎指正。
相關閱讀推薦:什么是機器視覺,有何實際意義
相關閱讀推薦:關于機器視覺的一些事