【摘要】3D視覺定位指的是根據(jù)事先構(gòu)建的3D模型及相關(guān)信息,計(jì)算取得某張圖像在拍攝時(shí)相機(jī)的位置和姿態(tài)。這是3D視覺的一項(xiàng)十分重要的技術(shù),可以用來幫助實(shí)現(xiàn)人員定位與導(dǎo)航。本博文將基于2019年CVPR論文From Coarse to Fine: Robust Hierarchical Localization at Large Scale所采用的分級定位方案對該技術(shù)進(jìn)行簡要的介紹。基本原理3D.。.
引言
所謂3D視覺定位指的是根據(jù)事先構(gòu)建的3D模型及相關(guān)信息,計(jì)算取得某張圖像在拍攝時(shí)相機(jī)的位置和姿態(tài)。這是3D視覺的一項(xiàng)十分重要的技術(shù),可以用來幫助實(shí)現(xiàn)人員定位與導(dǎo)航。本博文將基于2019年CVPR論文From Coarse to Fine: Robust Hierarchical Localization at Large Scale所采用的分級定位方案對該技術(shù)進(jìn)行簡要的介紹。
基本原理
3D視覺定位的直接目標(biāo)是計(jì)算當(dāng)前圖像的照相機(jī)位姿,解決該問題的直接方案是建立3D點(diǎn)與2D點(diǎn)之間的匹配關(guān)系,通過二者的匹配關(guān)系估計(jì)相機(jī)位姿,這一問題被稱作PnP(Pespective-n-Point)問題。求解PnP問題的方法有很多,常見的有P3P、EPnP、UPnP等,具體的如何實(shí)現(xiàn)本文不做介紹,讀者可以自行搜索PnP問題的相關(guān)理論。而視覺定位需要解決的一大關(guān)鍵問題是如何建立3D點(diǎn)與2D點(diǎn)之間的匹配關(guān)系。對于這一點(diǎn),論文作者Sarlin提出過一種分級定位的方案,以下將詳細(xì)介紹該方案。
分級定位
分級定位的框架大約可以分成三步:預(yù)檢索、共視聚類、局部匹配與定位。
預(yù)檢索
預(yù)檢索的意義在于獲取前k張與當(dāng)前圖像最相似的圖像,判斷相似的依據(jù)通常是通過匹配圖像的全局特征。一般而言,產(chǎn)生全局特征的方法可以依賴于局部特征所組成的詞袋,不過近些年,一些深度學(xué)習(xí)方案也被引入了進(jìn)來,例如NetVLAD或更加輕量級的MobileNetVLAD。最終通過獲取當(dāng)前圖像的全局特征的k個(gè)最近鄰來獲取預(yù)檢索得到的相近圖集。
共視聚類
然而由于可能產(chǎn)生的錯(cuò)誤匹配,所獲取到的預(yù)檢索圖集并不一定全部都面向同一場景,這時(shí)就需要先將面向不同場景的圖像區(qū)分開來,這項(xiàng)技術(shù)就被稱作共視聚類,簡而言之就是將具有共視關(guān)系的圖像聚成一類。
這一過程實(shí)際十分簡單,它是通過匹配同名點(diǎn)來獲取的,這些同名點(diǎn)在早先進(jìn)行的3D建模過程中通過特征的提取與匹配已經(jīng)建立了對應(yīng)的關(guān)系。若兩個(gè)圖像中存在穩(wěn)定的同名點(diǎn),則認(rèn)為二者共視,分成一類,否則分成兩類。
局部匹配與定位
一般認(rèn)為圖像數(shù)量較多的類所對應(yīng)的場景是正確場景的可能性較大。因此從這一場景開始,嘗試獲取相機(jī)位姿。獲取的方式主要依賴求解PnP問題,因此需要首先構(gòu)建當(dāng)前圖像的2D關(guān)鍵點(diǎn)在3D模型中的坐標(biāo)位置。在尚不知道相機(jī)姿態(tài)前,這一信息的獲取需要首先匹配當(dāng)前圖像和場景內(nèi)的圖像,特別要匹配那些能夠?qū)?yīng)到3D位置的2D特征點(diǎn),若能夠匹配上則確定了當(dāng)前圖像中的2D點(diǎn)和3D點(diǎn)的對應(yīng)關(guān)系,繼而即可通過對PnP問題的求解獲取相機(jī)位姿。
總結(jié)
本博文基于當(dāng)前被廣泛采用的分級視覺定位方法對在3D視覺領(lǐng)域廣泛使用的視覺定位方法進(jìn)行了簡要介紹,其主要可以被分為三個(gè)步驟,即預(yù)檢索、共視聚類、局部匹配與定位,最終通過求解PnP問題來獲取當(dāng)前圖像的位姿,從而確定拍攝者的位置。筆者后續(xù)將繼續(xù)保持對3D視覺領(lǐng)域的研究和關(guān)注,并繼續(xù)輸出相關(guān)博文。
編輯:lyn
-
定位
+關(guān)注
關(guān)注
5文章
1347瀏覽量
35499 -
3D模型
+關(guān)注
關(guān)注
1文章
72瀏覽量
15849 -
3D視覺
+關(guān)注
關(guān)注
4文章
435瀏覽量
27624
發(fā)布評論請先 登錄
相關(guān)推薦
評論