前言
智能交通系統(ITS)是當今世界交通管理體系發展的必然趨勢,而作為智能交通系統中的重要組成部分之一的車牌自動識別技術,目前已被廣泛應用于城市道路監控、高速公路收費與監控、小區與停車場出入口管理、公安治安卡口等場合,成為研究的熱點。
車牌識別技術是利用計算機等輔助設備進行的自動汽車牌照自動識別就是在裝備了數字攝像設備和計算機信息管理系統等軟硬件平臺的基礎之上,通過對車輛圖像的采集,采用先進的圖像處理、模式識別和人工智能技術,在圖像中找到車牌的位置,提取出組成車牌號碼的全部字符圖像,再識別出車牌中的文字、字母和數字,最后給出車牌的真實號碼。
車牌識別系統主要解決的問題
車牌識別技術可以實現自動登記車輛“身份”,已經被廣泛應用于各種交通場合,對“平安城市”的建設有著至關重要的作。具體概括如下:
電子警察系統
電子警察系統作為一種抓拍車輛違章違規行為的智能系統,大大降低了交通管理壓力。隨著計算機技術和CCD技術的發展,目前電子警察系統已經是一種純視頻觸發的高清抓拍系統,可以完成多項違章抓拍功能,其中包括違章闖紅燈抓拍功能、違章不按車道行駛抓拍功能、違章壓線變道抓拍功能、違章壓雙黃線抓拍功能和違章逆行抓拍功能等內容。電子警察自動抓拍違章車輛以及識別車牌號碼,將違法行為記錄在案。電子警察系統大大節省警力,規范城市交通秩序,緩解交通擁堵,減少交通事故。
卡口系統
卡口系統對監控路段的機動車輛進行全天候的圖像抓拍,自動識別車牌號碼,通過公安專網與卡口系統控制中心的黑名單數據庫進行比對,當發現結果相符合時,系統自動向相關人員發出警報信號。卡口系統記錄的圖像還可以清楚地分辨司乘人員(前排)的面部特征。
高速公路收費系統
高速公路收費系統已經基本實現自動化,當車輛在高速公路收費入口站時,系統進行車牌識別,保存車牌信息,當車輛在高速公路收費出口站時,系統再次進行車牌識別,與進入車輛的車牌信息進行比對,只有進站和出站的車牌一致方可讓車輛通行,自動收費系統可以有效地提高車輛的通行效率,并且可以有效地檢測出逃費車輛。
高速公路超速抓拍系統
系統抓拍超速的車輛和識別車牌號碼,并通過公安專網將超速車輛的車牌號碼傳達到各出口處罰點,各出口處罰點用車牌識別設備對出口車輛進行車牌識別,與己經收到的超速車輛的號碼對比,一旦號碼相同立即報警。
停車場收費系統
當車輛進入停車場時,收費系統抓拍車輛圖片進行車牌識別,保存車輛信息和進入時間,并語音播報空閑車位,當車輛離 停車場時,收費系統自動識別出該車的車牌號碼和保存車輛離 的時間,并在數據庫中查找該車的進入時間,計算出該車的停車費周,車主交完費用后,收費系統自動放行。停車場收費系統不但實現自動化管理,節約人力,而且還保證了車輛停放的安全性。
公交車報站系統
當公交車進入和離開公交站臺時,報站系統對其進行車牌識別,然后與數據庫中的車牌進行比對,語音報讀車牌結果和公交線路。綜上所述,車牌識別技術的廣泛應用使道路安全、交通通暢、車輛安全、環境保護得到了全面的保障。
車牌識別系統的基本工作原理及流程
車牌識別就是依次實現汽車圖像的車牌定位、車牌字符分割、車牌字符識別算法的過程。車牌定位就是把車牌圖像從含有汽車和背景的圖像中提取出來,其輸入的是原始的汽車圖像,輸出是車牌圖像。車牌的字符分割就是通過對車牌圖像的預處理、幾何校正等把字符從車牌圖像中分割出來,分成一個個獨立的字符,其輸入是車牌定位后得到的車牌圖像,輸出是經過預處理、幾何校正等后得到的一組單個的字符圖像,并得到各個字符的點陣數據。字符識別是依次從單個字符點陣數據中提取字符特征數據,并給出識別結果。
車牌識別系統采用高度模塊化的設計,將車牌識別過程的各個環節各自作為一個獨立的模塊。
1、車輛檢測跟蹤模塊
車輛檢測跟蹤模塊主要對視頻流進行分析,判斷其中車輛的位置,對圖像中的車輛進行跟蹤,并在車輛位置最佳時刻,記錄該車輛的特寫圖片,由于加入了跟蹤模塊,系統能夠很好地克服各種外界的干擾,使得到更加合理的識別結果,可以檢測無牌車輛并輸出結果。
2、車牌定位模塊
車牌定位模塊是一個十分重要的環節,是后續環節的基礎,其準確性對整體系統性能的影響巨大。車牌系統完全摒棄了以往的算法思路,實現了一種完全基于學習的多種特征融合的車牌定位新算法,適用于各種復雜的背景環境和不同的攝像角度。
3、車牌矯正及精定位模塊
由于受拍攝條件的限制,圖像中的車牌總不可避免存在一定的傾斜,需要一個矯正和精定位環節來進一步提高車牌圖像的質量,為切分和識別模塊做準備。使用精心設計的快速圖像處理濾波器,不僅計算快速,而且利用的是車牌的整體信息,避免了局部噪聲帶來的影響。使用該算法的另一個優點就是通過對多個中間結果的分析還可以對車牌進行精定位,進一步減少非車牌區域的影響。
4、車牌切分模塊
車牌系統的車牌切分模塊利用了車牌文字的灰度、顏色、邊緣分布等各種特征,能較好地抑制車牌周圍其他噪聲的影響,并能容忍一定傾斜角度的車牌。這一算法有利于類似移動式稽查這種車牌圖像噪聲較大的應用。
5、車牌識別模塊
在車牌識別系統中,通常采用多種識別模型相結合的方法來進行車牌識別,構建一種層次化的字符識別流程,可有效地提高字符識別的正確率。另一方面,在字符識別之前,使用計算機智能算法對字符圖像進行前期處理,不僅可盡可能保留圖像信息,而且可提高圖像質量,提高相似字符的可區分性,保證字符識別的可靠性。
6、車牌識別結果決策模塊
識別結果決策模塊,具體地說,決策模塊利用一個車牌經過視野的過程留下的歷史記錄,對識別結果進行智能化的決策。其通過計算觀測幀數、識別結果穩定性、軌跡穩定性、速度穩定性、平均可信度和相似度等度量值得到該車牌的綜合可信度評價,從而決定是繼續跟蹤該車牌,還是輸出識別結果,或是拒絕該結果。這種方法綜合利用了所有幀的信息,減少了以往基于單幅圖像的識別算法所帶來的偶然性錯誤,大大提高了系統的識別率和識別結果的正確性和可靠性。
7、車牌跟蹤模塊
車牌跟蹤模塊記錄下車輛行駛過程中每一幀中該車車牌的位置以及外觀、識別結果、可信度等各種歷史信息。由于車牌跟蹤模塊采用了具有一定容錯能力的運動模型和更新模型,使得那些被短時間遮擋或瞬間模糊的車牌仍能被正確地跟蹤和預測,最終只輸出一個識別結果。
車牌識別系統的關鍵技術及算法
車牌定位
車牌定位是車牌識別系統的基礎,其定位的準確與否直接影響到車牌的字符分割和識別效果,是影響整個車牌識別系統識別率的主要因素。車牌定位,即運用數字圖像處理、模式識別、人工智能等技術對采集到的汽車圖像進行處理,從而準確地獲得圖像中的車牌區域,其輸入是原始的汽車圖像,輸出是車牌圖像。在現實車牌識別系統中,由于光照不均勻、背景的復雜性等原因,造成準確定位出車牌的難度較大。目前,根據車牌的特征,常見的車牌定位方法有基于車牌顏色特征信息的定位法、基于車牌區域頻譜特征的定位法、基于分類器的車牌定位法、基于車牌邊緣特征的車牌定位法等,這些方法各有所長。值得注意的是,車牌定位算法的分類并不是唯一的,區別算法類別的標準并不十分明確。車牌定位算法的方法多種多樣、各有所長,但存在著計算量大或者定位準確率不高等問題。
車牌定位是車牌識別的關鍵步驟,為了能在復雜背景和不均勻光照條件下快速準確定位車牌位置,基于改進Isotropic Sobel邊緣檢測算子的車牌定位算法,由此來解決其存在的問題,該算法通過改進Isotropic Sobel邊緣檢測算子,實現了車牌圖像在水平、垂直以及對角線方向上的紋理特征提取,然后采用Otsu算法閾值化,再對閾值化后的二值圖像做數學形態學運算得到車牌的候選區域,最后利用車牌特征去除偽車牌。
算法流程圖:
對輸入的彩色圖像進行灰度化處理:
彩色圖像包含更多的信息,但是直接對彩色圖像進行處理的話,系統的執行速度將會降低,儲存空間也會變大。彩色圖像的灰度化是圖像處理的一種基本的方法,在模式識別領域得到廣泛的運用,合理的灰度化將對圖像信息的提取和后續處理有很大的幫助,能夠節省儲存空間,加快處理速度。
邊緣檢測的方法是考察圖像的像素在某個領域內灰度的變化情況,標識數字圖像中亮度變化明顯的點。圖像的邊緣檢測能夠大幅度地減少數據量,并且剔除不相關的信息,保存圖像重要的結構屬性。在實際的圖像分割中,往往只用到一階和二階導數進行邊緣檢測,雖然,在原理上,可以用更高階的導數,但是,因為噪聲的影響,在純粹二階導數操作中就會出現對噪聲敏感的現象,三階以上的導數信息往往失去了應用價值。此外,二階導數還可以說明灰度突變的類型,在有些情況下,如灰度變化均勻的圖像,只利用一階導數可能找不到邊界,此時二階導數就能提供很有用的信息。為了減少二階導數對噪聲敏感,解決的辦法是先對圖像進行平滑濾波,消除部分噪聲,再進行邊緣檢測。
Sobel邊緣檢測算子
Sobel算子是根據鄰域像素與當前像素的距離有不同的權值,強調中心像素的對邊鄰域像素對其的影響,而消弱4個對角近鄰像素的作用。圖像中每一個像素點都用這兩個核做卷積,一個卷積核對圖像垂直邊緣響應最大,而另一個則對水平邊緣響應最大,取兩個卷積之中的最大值作為該像素點的輸出值。這樣使得Sobel算子對噪聲有抑制作用,因此不會出現很多孤立的邊緣像素點,不過Sobel算子對邊緣的定位不是很精確,圖像的邊界寬度往往不止一個像素,不適合對邊緣定位準確性要求很高的應用。與Prewitt相似,Sobel算子也是通過像素平均來實現的,也有一定的抗噪能力。值得注意的是它們都不是各向同性的,所以它們檢測出來的邊緣并不是完全連通的,會有一定程度的斷開。
Sobel邊緣檢測還有另外一種形式,稱為Isotropic Sobel算子,該算子具有各向同性的特征,利用加權平均算子,權值反比于鄰點與中心點的距離,當沿著不同方向檢測邊緣時梯度幅度一致,因此它的位置加權系數更準確,在檢測不同方向上的邊緣時梯度的幅度一致,但速度較一般Sobel算子要慢一些。 用于邊緣檢測的算子很多,常用的還有Laplacian邊緣檢測算子、Canny邊緣檢測算子等。
對邊緣檢測后的灰度圖進行二值化處理
車牌圖像經過邊緣檢測之后,車牌上的字符及邊緣信息會突出出來,同時,其他非字符和非車牌邊框的邊緣紋理特征也突出了出來,為了減少噪聲的影響,需要對車牌圖像進行二值化處理,二值化是對圖像進行閾值化的一種類型。根據閾值的選取情況,二值化的方法可分為全局閾值法、動態閾值法和局部閾值法,我們用最大類間方差法(也稱Otsu算法)進行閾值化,來剔除一些梯度值較小的像素,減少需要查找的車牌范圍,二值化處理后車牌圖像的像素值為0或者255。
對車牌圖像進行圖像形態學操作
由于成像系統、傳輸介質、記錄設備等的不完善,以及天氣情況的變化等,車牌圖像往往受到多種噪聲的污染。在經過二值化處理的車牌圖像上,會出現一些與要研究的對象(即車牌區域)不相關的孤立點或者像素塊,擾亂圖像的研究對象,影響對車牌區域的提取、分割等操作。于是要構造一種有效抑制噪聲的濾波器來有效的去除目標和背景中的噪聲,同時,能夠很好地保護車牌區域的形狀、大小及特定的車牌紋理特征。圖像濾波,即在盡量保留圖像細節特征的條件下對目標圖像的噪聲進行抑制,是圖像處理中消除噪聲的不可或缺的操作,其處理的結果的好壞將直接影響到對后續圖像進行處理和分析的有效性和可靠性。常用的濾波操作方法有很多種,如中值濾波、形態學濾波、高斯濾波、雙邊濾波等。我們在這里介紹一下中值濾波和本文所研究系統采用的形態學濾波。
車牌識別系統也是基于形態學操作的重要性質,對經過二值化后的車牌圖像首先進行閉運算操作,使得車牌的字符區域連接起來,然后對車牌圖像進行開運算操作,來消除車牌上的噪聲,得到明亮的車牌區域從候選區域中去除偽車牌并定位出車牌區域通過對車牌圖像的數學形態學運算,圖像中剩下少部分的連通區域,即為車牌的候選區域,這些區域包括車牌區域和偽車牌區域,為此,需要從圖像中去除偽車牌并定位出車牌。
首先,經過對白色連通區域的輪廓進行處理得到矩形邊界框,再根據我國車牌長寬比的特征,即44:14,考慮到在車牌定位過程中,由于對車牌的數學形態學操作會減少車牌信息以及拍攝所得到的車牌圖像中車牌的傾斜等原因,取長寬閾值為2.0-6.0,這樣就剔除了長寬比不符合條件的候選區域。 然后,由于對車牌圖像的數學形態學操作會減少車牌信息,所以定位出的車牌區域會有可能小于車牌的實際區域,這時,我們就需要對定位出的車牌區域進行放大,在這里,我們對車牌區域進行放大的比例是120%,即對已經定位出的車牌候選區域的邊界進行擴大。車牌由七個字符組成,在對候選區域對應的灰度化圖像進行邊緣檢測二值化之后,正常情況下,車牌水平投影區域內每行的邊緣點數要大于14,根據經驗值,我們取15。在車牌水平投影區域內會出現較大的波峰,該波峰認為是車牌的上下邊界,根據實驗結果,要求波峰的始點和終點之差大于20小于120,從而得到車牌的上下邊界。最后,根據二值化車牌圖像中車牌的紋理特征信息,即在車牌區域范圍內會出現明顯的梯度變化特征,來確定車牌區域,最終定位出車牌。在二值化圖像中,255代表車牌圖像中的邊緣信息,0代表非邊緣信息。為了更加精確的定位出車牌和剔除偽車牌,需要對定位出的車牌區域進行篩選,有兩個篩選條件,一個是在二值化圖像中灰度值為255和灰度值為0的像素比大于0.25,另一個是二值化圖像中灰度的跳變次數范圍是[5,30]。
通過對車牌圖像的灰度處理、邊緣檢測、二值化、圖像形態學操作定位出車牌的候選區域,接著利用車牌的特征,如長寬比、像素比等,從候選區域中定位出車牌
車牌字符分割
車牌字符分割算法的研究
車牌字符分割就是對已經定位出的車牌區域內的車牌字符進行分割,從而獲取車牌上的字符,是車牌字符識別的前提和準備。車牌字符分割的好壞,直接影響到識別效果的好壞。在車牌識別系統中,由于車牌污染、背景復雜、光照不均勻、車牌發生傾斜、邊框影響以及間隔符等因素影響,很難找到一種普遍使用的分割方法。
車牌區域定位完成之后,由于提取出來的車牌區域內的車牌圖像可能存在傾斜現象,因此,在車牌字符分割之前,需要判斷車牌圖像是否傾斜。在車牌傾斜的情況下,需要準確的求得車牌的傾斜角度,然后把發生傾斜的車牌校正過來,為接下來的字符分割創造條件,這就是車牌的傾斜校正。常用的傾斜校正算法包括Radon變換、Hough變換。在車牌的傾斜校正完成之后,需要去除車牌的上下、左右邊界,然后才能把車牌上的字符一個個的分割出來,得到一個單獨的車牌字符圖像,為后續的車牌字符識別做好準備,即車牌的字符分割。
在車牌的字符分割中,有許多因素會對車牌的字符分割造成影響,例如圖像的噪聲、車牌的定位不精確、字符的粘連、漢字的不連通等。本文介紹一種改進的水平投影算法,該算法能夠克服這些因素造成的不良影響,并且能夠準確的分割出車牌,為后續的精確識別做好準備。為了分割出相互獨立的字符,對經過Otsu算法閾值化的灰度圖進行分割。
以下以改進的水平投影算法為例進行介紹:
1、去除車牌字符的上下邊界以外的區域。對灰度化的車牌圖像從下向上逐行掃描,并統計出每行的像素值為255的像素的個數,當像素值為255的像素個數大于7時(車牌有7個字符),認為尋找到車牌字符的下邊界。同理,從上向下逐行掃描,能夠尋找到車牌字符的上邊界。去除車牌字符上下邊界以外的區域。去除車牌字符上下邊界之后,設車牌的高度為height,寬度為width。
2、對車牌圖像從左向右逐列掃描,并記錄統計出每列的像素值為255的像素的個數,并將結果保存在一位數組count[ width+ 1]中,其中count[ i ]用于存儲第i列像素值為255的像素的個數。
3、我國車牌的第一個字符是漢字,根據漢字的特征,設置兩個閾值去分割車牌的第一個漢字字符,兩個閾值分別為threshold 1,threshold 2。從左向右掃描灰度化的車牌圖像,第一個大于閾值threshold 1的列,即為漢字的開始位置,記為S然后,繼續掃描車牌圖像,直到尋找到小于閾值threshold 1的列,記為H,比較這兩列的寬度H-S與threshold 2的大小,如果H-S < threshold2,則繼續掃描圖像直到找到與S列相差的寬度大于?threshold 2且滿足像素值為255的像素的個數小于閾值的列。所尋找到的列就是車牌的漢字字符的結束列。在分割不連通的漢字的時候,這種改進的方法起到作用是顯著的。
4、剩下的字符都是英文字母和阿拉伯數字,這些字符不存在不連通性的問題,于是,僅僅利用第一個閾值threshold 1就可以分割出車牌剩下的字符。
5、當車牌的第一個漢字字符被分割出來之后,繼續掃描車牌區域圖像,當某一列的像素值為255的像素個數開始大于閾值threshold 1時,這一列就是車牌字符開始的位置,當某一列的像素值為255的像素的個數開始小于閾值threshold 1時,這一列就是車牌字符的結束位置。如此重復的下去,直到把車牌剩下的字符也分割出來為止。
對提取的車牌字符特征進行歸一化操作
從輸入的車牌圖像中提取的車牌的尺寸不一樣,這就造成了分割出來的車牌字符的尺寸不一樣,為了更好的識別車牌字符,在本文中,對車牌字符進行歸一化處理,使得經過不同圖像獲得車牌車牌在字符分割后,所獲取的車牌單個字符圖像大小都為5×10像素。
車牌字符識別算法的研究
車牌的字符識別是車牌識別系統能夠最終實現的關鍵因素,是對經過車牌定位和車牌字符分割后的一個個車牌字符進行識別。車牌識別系統中的字符識別與其它的字符識別相比,有其自身的特點,主要由以下方面的不同:車牌識別系統中字符的字量少,包括漢字、英文字母、數字,并且字型統一,相對于普通的漢字識別難度相對較低;從系統的實用性角度來看,作為一個實時的系統,它要求有較高的識別速度,這就決定了字符識別算法計算必須足夠高效;同時,它還要求有很高的識別率,并且最低限度減少錯誤識別率。
基于模板匹配的字符識別算法
匹配就是將不同傳感器或同一傳感器在不同時間、不同成像條件下對同一景象獲取的兩幅或者多幅圖像在空間上對準,或者根據已有模式在另一幅圖像中尋找相應的模式。在遙感圖像的處理時需要把不同波段傳感器對同一事物的多光譜圖像按照像點對應套準,然后根據像點的性質進行分類。如果在不同時間內對同一地面拍攝的兩幅圖像,經套準后找到其中特征有了變化的像點,就可以用來分析圖中那些部分發生了變化,而利用放在一定間距處的兩只傳感器對同一物體拍攝得到兩幅圖片,找出對應點后可計算出物體離開攝像機的距離,即深度信息。一般的圖像匹配技術是利用已知的模板和某種算法對識別圖像進行匹配計算,從而判斷圖像中是否含有該模板的信息和獲取坐標,車牌的字符匹配就是這種匹配技術。即車牌字符匹配的實現方式是計算輸入模式的車牌字符與樣本之間的相似性,取相似性最大的樣本為輸入樣本所屬的類別。該算法的步驟是,首先建立模板庫,將待識別的字符進行二值化并將其歸一化操作,然后作為輸入模式的字符與所有的模板進行匹配,最后選擇最佳匹配作為結果。算法的優點是,在預處理后的圖片質量較高、車牌的傾斜程度較低、車牌的紋理特征清晰的情況下,這種算法識別的準確率較高,但是對字符細節信息的忽略導致了在識別相似字符時容易出錯。在實際的車牌識別系統中獲取的車牌,往往由于拍攝角度的不同、車牌污損、光照不均等原因造成了二值化后的字符會出現形變、粘連、斷裂、細節模糊等情況,這些原因導致了模板匹配在車牌字符識別上的局限性,尤其是停車場車牌識別系統。停車場環境下,車牌圖像受到光照的影響較大,為了提高字符識別的準確率,通常在停車場車牌識別系統中很少采用這種算法。
基于特征統計匹配算法
基于特征統計匹配算法主要原理是先提取輸入模式的車牌字符統計特征,再按照一定的規則與所確定的決策函數進行分類判斷。字符的統計特征包括像素塊數、字符的輪廓數、輪廓的形狀等。像素塊是指二值化圖像中上、下、左、右四個方向上相互連通的所有白素區域所組成的一個連通區域的像素塊,由此可知,漢字字符的像素塊大于1,英文字母和數字的像素塊數是1。漢字的識別是將字符點矩陣看作是一個整體,根據每個字符的筆畫特征點不同,將字符分解為橫、豎、撇、捺等一種或幾種的組合,經過統計從而得到相應的特征,接著再與字符庫中的特征集進行匹配,獲取輸入字符的識別結果。在實際的應用中,由于外部原因造成了字符常常會出現模糊、傾斜等情況,導致了部分字符無法正確識別。
基于分類器的字符識別
基于分類器的字符識別,是目前應用較廣的一種車牌識別方式。其主要的思路是通過對樣本數據的學習,達到自動將數據分類到已知類型。分類器其實是一種數學模型,目前有很多類型的分類器,包括Bayes分類器、決策樹模型、BP神經網絡分類器等。 貝葉斯分類器的分類原理是通過某對象的先驗概率,利用貝葉斯公式計算出其后驗概率,即該對象屬于某一類的概率,選擇具有最大后驗概率的類作為該對象所屬的類。也就是說,貝葉斯分類器是最小錯誤率意義上的優化。應用貝葉斯網絡分類器進行分類主要分成兩階段。第一階段是貝葉斯網絡分類器的學習,即從樣本數據中構造分類器,包括結構學習和CPT學習;第二階段是貝葉斯網絡分類器的推理,即計算類結點的條件概率,對分類數據進行分類。這兩個階段的時間復雜性均取決于特征值間的依賴程度,因而在實際應用中,往往需要對貝葉斯網絡分類器進行簡化。根據對特征值間不同關聯程度的假設,可以得出各種貝葉斯分類器,Naive Bayes、TAN、BAN、GBN就是其中較典型、研究較深入的貝葉斯分類器。
貝葉斯分類器的特點是:
1) 貝葉斯分類并不把一個對象絕對地指派給某一類,而是通過計算得出屬于某一類的概率,具有最大概率的類便是該對象所屬的類;
2) 一般情況下在貝葉斯分類中所有的屬性都潛在地起作用,即并不是一個或幾個屬性決定分類,而是所有的屬性都參與分類;
3) 貝葉斯分類對象的屬性可以是離散的、連續的,也可以是混合的。 貝葉斯定理給出了最小化誤差的最優解決方法,可用于分類和預測。但在實際中,它并不能直接利用,它需要知道證據的確切分布概率,而實際上我們并不能確切的給出證據的分布概率。因此我們在很多分類方法中都會作出某種假設以逼近貝葉斯定理的要求。 決策樹(decision tree)一般都是自上而下的來生成的。每個決策或事件(即自然狀態)都可能引出兩個或多個事件,導致不同的結果,把這種決策分支畫成圖形很像一棵樹的枝干,故稱決策樹。 決策樹就是將決策過程各個階段之間的結構繪制成一張箭線圖,我們可以用下圖來表示。
決策樹模型
決策樹模型的特點:
1) 與其他分類算法相比,決策樹模型有以下優點:可理解性強、速度快。
2) 一般決策樹模型缺點是:缺乏伸縮性:由于進行深度優先搜索,所以算法受內存大小限制,難于處理大訓練集。為了處理大數據集或連續量的種種改進算法(離散化、取樣) 不僅增加了分類算法的額外開銷,而且降低了分類的準確性,對連續性的字段比較難預測,當類別太多時,錯誤可能就會增加的比較快,對有時間順序的數據,需要很多預處理的工作。在有噪聲的情況下,完全擬合將導致過分擬合(overfitting),即對訓練數據的完全擬合反而不具有很好的預測性能。剪枝是一種克服噪聲的技術,同時它也能使樹得到簡化而變得更容易理解。另外,決策樹技術也可能產生子樹復制和碎片問題。 當然,不同分類器對于一些分類有著不同的分類精度,因此我們在處理一些實際問題時,可以根據實際問題的分類屬性和各種分類器的特點來選擇相應的分類器,從而得到較高的分類精度。
-
智能交通系統
+關注
關注
0文章
41瀏覽量
12178 -
車牌識別技術
+關注
關注
0文章
3瀏覽量
8447
原文標題:解析車牌識別技術的工作流程與原理
文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
評論