實(shí)時(shí)的基于機(jī)器學(xué)習(xí)的檢測圖像的車的快速訓(xùn)練米洛斯 Stojmenovic收到:2005 / 23十一月接受: 2006日28 / 發(fā)表于:30 2006 施普林格出版社2006[摘要]我們的主要興趣是建立快速基于小圖像可靠的目標(biāo)識(shí)別 ING 集需要構(gòu)建大多是手動(dòng)的,如我們研究的本田雅閣,識(shí)別2004從后方的看法。我們描述了一種新的變種基于 AdaBoost 的學(xué)習(xí)算法,建立了一個(gè)強(qiáng)分類器的弱分類增量—sifiers(WCS) ,最小的組合誤差已選定的廁所。每個(gè) WC 訓(xùn)練只有一次,例子并不改變它們的權(quán)重。我們描述一組為考慮適當(dāng)類型的特征識(shí)別問題,包括發(fā)紅措施和占主導(dǎo)地位的邊緣取向?,F(xiàn)有的邊緣定位—水平(垂直,分別)邊緣屬于同一倉。我們提出了預(yù)先消除功能的最佳的閾值附近的迷你瑣碎的位置—所有的媽媽或最大值。這是一個(gè)新的的方法,減少了訓(xùn)練集 WC 的數(shù)量不到原來的10% ,大大加快—建立培訓(xùn)時(shí)間,并沒有負(fù)面影響最終的分類器的質(zhì)量。我們還修改了實(shí)驗(yàn)。表明,Viola 和瓊斯使用的功能集人臉識(shí)別是低效的和別人對(duì)我們的的問題,準(zhǔn)確和實(shí)時(shí)識(shí)別的汽車快速訓(xùn)練。我們的培訓(xùn)方法,找到一個(gè)非常準(zhǔn)確的分類只含有30廁所后1h 訓(xùn)練。與現(xiàn)有的文獻(xiàn)相比,我們的整體實(shí)現(xiàn)一個(gè)真正的設(shè)計(jì)用最少的時(shí)間目標(biāo)檢測機(jī)的例子,廁所數(shù)量最少的,最快的訓(xùn)練時(shí)間,具有競爭力的檢測和假陽性率。1引言本文的目的是分析能力—在當(dāng)前的機(jī)器學(xué)習(xí)技術(shù),解決“能力” ,我們的意思是實(shí)時(shí)性,較高的檢測率,假陽性率低,快速的訓(xùn)練和學(xué)習(xí)用在訓(xùn)練集是不容易的,和最它需要手動(dòng)創(chuàng)建。我們將應(yīng)用機(jī)器學(xué)習(xí)的檢測具體地說,能夠認(rèn)識(shí)到某種類型的如本田汽車協(xié)議,2004。因此,應(yīng)該是一個(gè)任意的輸入圖像,和的結(jié)果應(yīng)該是相同的圖像一個(gè)矩形的發(fā)生在我們的車尋找。此外,檢測精度,其第二個(gè)主要的目的是實(shí)時(shí)性能。Pro—克應(yīng)迅速找到給定類型的所有汽車位置在圖像中,在相同的方式和瓊斯認(rèn)為所有的頭。定義房我們想得到一個(gè)回答測試圖像在第二個(gè)左右的響應(yīng)時(shí)間取決于。的測試圖像的大小,因此似乎是真實(shí)的對(duì)于較小的圖像的時(shí)間可能不那么大的。最后,我們的目標(biāo)是設(shè)計(jì)對(duì)象檢測—基于一個(gè)小數(shù)量的培訓(xùn)考試系統(tǒng)樣品。我們設(shè)想在訓(xùn)練的例子是不容易獲得的情況下的應(yīng)用。例如,在的情況下,我們的研究,我們必須采取的照片幾百個(gè)本田協(xié)定和其他汽車的看法創(chuàng)建訓(xùn)練集,因?yàn)閹缀鯖]有正面的形象在網(wǎng)上找到的。在這種情況下,它是很難的希望能有數(shù)萬成千上萬的圖像現(xiàn)成的,這是人臉檢測的情況—問題。一個(gè)小的額外訓(xùn)練集,訓(xùn)練時(shí)間減少。這使我們進(jìn)行了大量的嘗試訓(xùn)練,調(diào)整設(shè)置例子,調(diào)整設(shè)置的功能,不同的測試集弱分類器(WCS) ,否則分析通過觀察生成的類的行為過程。由于與一個(gè)小數(shù)量的訓(xùn)練的成功的例子是不清楚的,我們還必須設(shè)置快速列車—進(jìn)行了一些調(diào)整和改進(jìn)系統(tǒng)。本文的兩個(gè)主要的貢獻(xiàn),預(yù)—為滿足所有目標(biāo)。我們將在一個(gè)機(jī)器學(xué)習(xí)的方法試圖解決的問題檢測出來特殊的車型自他們似乎是適當(dāng)?shù)蔫b于問題的設(shè)置。機(jī)器學(xué)習(xí)相似圖像檢索已被證明是可靠的坐—評(píng)估的目標(biāo)對(duì)象不改變方向,一個(gè)經(jīng)典的應(yīng)用已成為檢測直立向前頭所提出的中提琴瓊斯。汽車通常是在相同的發(fā)現(xiàn)相對(duì)于道路的方向。他們可以照片—(正面,側(cè)面……)但其實(shí)很少發(fā)現(xiàn)了邊。我們是國際形勢莎莉在車輛的后部。這也是目標(biāo)對(duì)警察的交通監(jiān)控設(shè)備的選擇,因?yàn)樗麄兊南鄼C(jī)的位置通常是電影的許可證用于車輛識(shí)別的目的板。那里—前,硬件已經(jīng)到位,各種軟件在車輛檢測中的應(yīng)用。積極的圖像采取的,所有本田有相同的一般正交方相對(duì)于相機(jī)。一些偏差的發(fā)生在球場上,這些圖像,偏航和滾動(dòng),這可能可為什么產(chǎn)生的檢測器具有如此廣泛的有效性。這是建立機(jī)器是有效的在角以下偏差:?15?,偏航?30?30?,卷15至18。這意味著圖片本田從角度是由規(guī)定的的數(shù)量依然由程序檢測。算法用于目標(biāo)檢測問題。實(shí)驗(yàn)結(jié)果給出了。4。結(jié)論會(huì)議,只討論版在我們的汽車檢測系統(tǒng)的功能設(shè)置。 任何特定類型的車后視圖。因此我們回顧了解決更一般的問題。存在—ING 的車輛檢測系統(tǒng),如那些嘗試自動(dòng)駕駛汽車沿公路實(shí)際上不檢測道路上的汽車。他們只是認(rèn)為任何—事情正在高速公路上的車輛。在科學(xué)文獻(xiàn),一些汽車識(shí)別方案的存在是基于形狀的探測器?,F(xiàn)有的基于形狀的方法報(bào)道已匹配 A60–85%提高?;谧罱徠ヅ涞姆椒▽?duì)視角變化過于敏感,而方法基于 PCA(主成分分析)不一個(gè)實(shí)時(shí)系統(tǒng)。目標(biāo)檢測的最普遍的例子是人臉檢測。基本應(yīng)用為中提琴和瓊斯的實(shí)時(shí)人臉識(shí)別系統(tǒng)。是具體的機(jī)器學(xué)習(xí)方法由 Viola 和瓊斯用來實(shí)現(xiàn)他們的系統(tǒng)。在這種方法中,正和負(fù)的訓(xùn)練集通過級(jí)聯(lián)分類器分開,每個(gè)構(gòu)造采用 AdaBoost。實(shí)時(shí)性能的實(shí)現(xiàn)(一個(gè)預(yù)處理步驟后) 。的訓(xùn)練時(shí)間人臉檢測器,似乎是緩慢的,甚至用了幾個(gè)月根據(jù)一些報(bào)道。Viola 和 Joss 的臉,發(fā)現(xiàn)系統(tǒng)已經(jīng)證實(shí)在文獻(xiàn)中的一些文章。修正—陽離子包括新功能的添加。特別的,和那些基于一個(gè)特定部分的顏色圖像。機(jī)器本身的修改在幾個(gè)方面的文獻(xiàn)。我們已經(jīng)考慮到了所有的在文獻(xiàn)提出的修改,并通過思想被認(rèn)為是有助于實(shí)現(xiàn)我們的目標(biāo)。我們再次強(qiáng)調(diào),最成功的應(yīng)用:使用一個(gè)大的訓(xùn)練集。在中提琴瓊斯的原始的人臉檢測器,圖像用于訓(xùn)練集。已知的最小的訓(xùn)練他們開始在90%只貓實(shí)現(xiàn)的檢出率—類型時(shí)正例數(shù) reached250。負(fù)的實(shí)例數(shù)是未指定在這個(gè)階段,但作者說,他們隨機(jī)10000圖像從互聯(lián)網(wǎng)下載包含100000000子窗口。他們只是適度增加了檢測的陽性率的大小將大幅增長的對(duì)象。的大小等于或大于24×24像素(用于面搜索) , (我們有車限100×150搜索)作為輸入,并宣布是否這個(gè)地區(qū)包含搜索的對(duì)象。我們用這樣的機(jī)器整個(gè)圖像分析。我們通過每個(gè)子窗口包含的面孔。一個(gè)滑動(dòng)窗口技術(shù)有—前使用。在窗口被移動(dòng)后1pixel 的一個(gè)子窗口分析(我們使用的2pixel 移為了加快速度,沒有顯著的負(fù)面影響) 。子窗口的尺寸增加的長度和寬度10%每次的所有子窗口以前的大小進(jìn)行了詳盡地搜索。3中使用的特征識(shí)別一個(gè)特征是一個(gè)函數(shù)的圖像映射到一個(gè)真正的數(shù)。這里的訓(xùn)練程序。兩種類型的基本特征使用。他們是發(fā)紅的特點(diǎn)和優(yōu)勢邊緣方向特征。占主導(dǎo)地位的邊緣定位—、紅腫特征證明自己是多比 Viola 和 Joss 在原來的設(shè)置,為我們研究的問題,本田雅閣的檢測2004從后面進(jìn)行。3.1紅斑的特點(diǎn)我們指的是紅的特點(diǎn)是不可測的。他們致力于尋找圓形紅色在圖像中的區(qū)域。他們的目標(biāo)是發(fā)現(xiàn)和解決的紅眼睛在以人的照片。他們的大部分工作集中在紅色區(qū)域的形狀,而不是參與找到紅色技術(shù)。我們借他們的發(fā)現(xiàn)是紅色的區(qū)域觀念。我們的不同的工作事實(shí)上我們尋找紅色區(qū)域意味著本田雅閣的剎車燈,而不是人類的眼睛。因此,我們的紅色區(qū)域的方—奇異的,和更大的比他們的。圖1顯示了一個(gè)通過訓(xùn)練確定發(fā)紅特征的例子過程。一個(gè)特殊的發(fā)紅的色彩空間的過程中形成的協(xié)助在紅色區(qū)域的檢測預(yù)處理。這個(gè)色彩空間是從,和一一維度將 RGB 顏色空間的二維線性組合。所有的在訓(xùn)練集的正、負(fù)輸入 RGB 彩色圖像,這意味著他們的照片—ELS 是由三個(gè)8位數(shù)字,代表紅色的數(shù)量,在一個(gè)像素的綠色和藍(lán)色,分別—地。紅色的顏色空間的每個(gè)像素的定義如下:紅色= 4R?3G + B。積分圖像計(jì)算(該技術(shù)是在[ 13 ]提出的)應(yīng)用于紅色圖像產(chǎn)生的一個(gè)在訓(xùn)練過程中輸入。紅色的區(qū)域—確定在固定的時(shí)間進(jìn)行性培訓(xùn)的特點(diǎn)利用紅圖像的整體形象。3.2邊緣方向特征使用幾個(gè)占主導(dǎo)地位的邊緣方向特征在訓(xùn)練算法。一個(gè)眾所周知的灰階梯度掩模(三× 三像素)用在圖像中的邊緣位置的確定。的掩模被施加在兩個(gè)坐標(biāo)方向,和基礎(chǔ)執(zhí)行是放在門檻上的拉普拉斯值強(qiáng)度。我們用一個(gè)閾值80消除不暈邊有用。一個(gè)類似的閾值進(jìn)行。定位—每個(gè)像素” 是從它的強(qiáng)度計(jì)算在兩個(gè)方向。方向分為六整個(gè)圓分成六箱。重要的是要注意,0?,方位90?,和180?垃圾箱在識(shí)別本田是至關(guān)重要的。他們是重要的—經(jīng)常因?yàn)楸咎镏饕兴胶痛怪边吘墶5睦涞牡胤剑?或90??處兩箱構(gòu)成問題,因?yàn)樗械拇怪边吔绾退竭吘壙梢苑譃閮上?。我們將所有的垃圾箱。沒有提到任何本移動(dòng),所以我們相信他們用非移箱。不過他們真的,不同的箱從4到8的數(shù)字。有效數(shù)字—BER 箱不多的沖擊性能,但避免這些邊界。將所有的方向—全文為0–180?范圍,我們增加了180? 如果角小于0?,減去180如果角度大超過180?。這些變革的影響可以在圖2中看到的。在圖3中,我們看到一個(gè)本田雅閣和其在第一站相應(yīng)的邊緣方向的圖像?15? ,+ 15?,+ 165,+ 195?。檢測系統(tǒng)。從74.3提高到89.1%,而一些假陽性率從168下降到26。圖像的邊緣方向看。每個(gè)值 B(I,J)的每個(gè)方向的bin 圖像對(duì)應(yīng)—ING 拉普拉斯強(qiáng)度的方向是否屬于這本,3和4,在圖像中的特定區(qū)域,通常有一個(gè)方向—這是占主導(dǎo)地位的。我們利用這一事實(shí),我們使用占主導(dǎo)地位的邊緣取向。這個(gè)主意首先發(fā)展—利用[。占主導(dǎo)地位的邊緣取向的計(jì)算同一區(qū)域。占主導(dǎo)地位的邊緣方向特征進(jìn)行訓(xùn)練。我們看到一些不區(qū)分,但盡管如此明顯的邊緣在一些其他的垃圾箱圖。一個(gè)最成功的邊緣取向是一個(gè)水平如圖3所示。所有的 POS—可能占主導(dǎo)地位的邊緣箱提供培訓(xùn)程序除了因?yàn)樗曈X上沒有什么區(qū)分了。