上海交通大學盧策吾團隊MVIG實驗室最新上線了他們此前開源的實時人體姿態估計系統AlphaPose的升級版。新系統采用 PyTorch 框架,在姿態估計標準測試集COCO上達到當前最高精度71mAP,同時平均速度20FPS,比Mask-RCNN速度快3倍。
AlphaPose是一個實時多人姿態估計系統。
今年2月,上海交通大學盧策吾團隊MVIG實驗室AlphaPose 系統上線,是首個在 COCO 數據集上可達到 70+ mAP 的開源姿態估計系統。本次更新,在精度不下降情況下,實時性是一大提升亮點。
新系統采用 PyTorch 框架,在姿態估計(Pose Estimation)標準測試集COCO validation set上,達到 71mAP的精度(比 OpenPose 相對提升17%,Mask-RCNN相對提升8%),同時,速度達到了20FPS(比 OpenPose 相對提高66%,Mask-RCNN相對提高300%)。
再次感受一下升級后AlphaPose的速度
檢測精度不變,平均速度比Mask-RCNN快3倍
人體關鍵點檢測對于描述人體姿態,預測人體行為至關重要。因此,人體關鍵點檢測是諸多計算機視覺任務的基礎。其在動作分類,異常行為檢測,以及人機交互等領域有著很廣闊的應用前景,是計算機視覺領域中一個既具有研究價值、同時又極具挑戰性的熱門課題。
AlphaPose系統,是基于上海交大MVIG組提出的 RMPE 二步法框架(ICCV 2017論文)構建的,相比其他開源系統在準確率有很大提高,比OpenPose相對提高17%,Mask-RCNN相對提高8.2%。
升級后,各個開源框架在COCO-Validation上性能,時間在單卡1080ti GPU測出指標如下:
基于PyTorch框架,在人體姿態估計模型中引入Attention模塊
新版 AlphaPose 系統,架設在 PyTorch 框架上,得益于Python的靈活性,新系統對用戶更加友好,安裝使用過程更加簡易,同時支持Linux與Windows系統使用,方便進行二次開發。此外,系統支持圖片、視頻、攝像頭輸入,實時在線計算出多人的姿態結果。
為了在兼顧速度的同時保持精度,新版AlphaPose提出了一個新的姿態估計模型。模型的骨架網絡使用 ResNet101,同時在其下采樣部分添加 SE-block 作為 attention 模塊——已經有很多實驗證明,在 Pose Estimation 模型中引入 attention 模塊能提升模型的性能,而僅在下采樣部分添加 SE-block 能使 attention 以更少的計算量發揮更好的效果。
除此之外,使用PixelShuffle + Conv進行3次上采樣,輸出關鍵點的熱度圖。傳統的上采樣方法會使用反卷積或雙線性插值。而使用 PixelShuffle 的好處在于,在提高分辨率的同時,保持特征信息不丟失。對比雙線性插值,運算量低;對比反卷積,則不會出現網格效應。
在系統架構方面,新版 AlphaPose 采用多級流水的工作方式,使用多線程協作,將速度發揮到極致。
AlphaPose 系統目前在COCO的 Validation 集上的運行速度是 20FPS(平均每張圖片4.6人),精度達到71mAP。 在擁擠場景下(平均每張圖片15人),AlphaPose系統速度仍能保持 10FPS 以上。
-
人機交互
+關注
關注
12文章
1217瀏覽量
55532 -
pytorch
+關注
關注
2文章
808瀏覽量
13361
原文標題:最高比Mask-RCNN快3倍!上交大實時姿態估計AlphaPose升級
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。
發布評論請先 登錄
相關推薦
基于PoseDiffusion相機姿態估計方法
![基于PoseDiffusion相機<b class='flag-5'>姿態</b><b class='flag-5'>估計</b>方法](https://file1.elecfans.com/web2/M00/8D/89/wKgZomS81TmAUf_jAAA9AvnurpY588.png)
【愛芯派 Pro 開發板試用體驗】人體姿態估計模型部署前期準備
針對姿態傳感器的姿態估計方法的詳細資料說明免費下載
基于深度學習的二維人體姿態估計方法
![基于深度學習的二維人體<b class='flag-5'>姿態</b><b class='flag-5'>估計</b>方法](https://file.elecfans.com/web1/M00/E6/A0/pIYBAGBYThWAZUC5AAGRF8R3RJc699.png)
基于深度學習的二維人體姿態估計算法
![基于深度學習的二維人體<b class='flag-5'>姿態</b><b class='flag-5'>估計</b>算法](https://file.elecfans.com/web1/M00/ED/31/pIYBAGCHyMeAcSI4AAI8gK8_JoA502.png)
基于OnePose的無CAD模型的物體姿態估計
一種基于去遮擋和移除的3D交互手姿態估計框架
AI技術:一種聯合迭代匹配和姿態估計框架
![AI技術:<b class='flag-5'>一</b>種聯合迭代匹配和<b class='flag-5'>姿態</b><b class='flag-5'>估計</b>框架](https://file1.elecfans.com/web2/M00/8D/02/wKgZomS2HHiAZlmjAAAydPLDTSE273.png)
評論