那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為什么mAP已成為目標檢測的首選指標?

新機器視覺 ? 來源:小白學視覺 ? 2023-04-10 09:50 ? 次閱讀

計算機視覺界已經集中在度量 mAP 上,來比較目標檢測系統的性能。在這篇文章中,我們將深入了解平均精度均值 (mAP) 是如何計算的,以及為什么 mAP 已成為目標檢測的首選指標。

目標檢測的快速概述

在我們考慮如何計算平均精度均值之前,我們將首先定義它正在測量的任務。目標檢測模型試圖識別圖像中相關對象的存在,并將這些對象劃分為相關類別。例如,在醫學圖像中,我們可能希望能夠計算出血流中的紅細胞 (RBC)、白細胞 (WBC) 和血小板的數量,為了自動執行此操作,我們需要訓練一個對象檢測模型來識別這些對象并對其進行正確分類。

f6de048e-d6e0-11ed-bfe3-dac502259ad0.gif

EfficientDet(綠色)與 YOLOv3(黃色)的示例輸出

這兩個模型都預測了圖片中細胞周圍的邊界框,然后他們為每個邊界框分配一個類。對于每個任務,網絡都會對其預測的置信度進行建模,可以在此處看到我們共有三個類別(RBC、WBC 和Platelets)。

我們應該如何決定哪個模型更好?查看圖像,看起來 EfficientDet(綠色)繪制了過多的 RBC 框,并且在圖像邊緣漏掉了一些細胞。這當然是從事物表面來看——但是我們可以相信圖像和直覺嗎?

如果我們能夠直接量化每個模型在測試集中的圖像、類和不同置信閾值下的表現,那就太好了。要理解平均精度均值,我們必須花一些時間來研究精度-召回曲線。

精確-召回曲線

精確是“模型猜測它正確猜測的次數?” 的一個衡量標準,召回是一種衡量“模型每次應該猜到的時候都猜到了嗎?” 。假設一個具有有 10 個紅細胞的圖像,模型只找到這 10 個中正確標記的一個,因為“RBC”具有完美的精度(因為它做出的每一個猜測都是正確的),但并不同時具有完美的召回(僅發現十個 RBC 細胞中的一個)。

包含置信元素的模型可以通過調整進行預測所需的置信水平來權衡召回的精確度。也就是,如果模型處于避免假陽性(當細胞是白細胞時說明存在紅細胞)比避免假陰性更重要的情況下,它可以將其置信閾值設置得更高,以鼓勵模型只產生以降低其覆蓋率(召回)為代價的高精度預測。

精度-召回曲線是繪制模型精度和以召回率作為模型置信閾值函數的過程。它是向下傾斜的,因為隨著置信度的降低,會做出更多的預測,進而預測的準確性會降低(影像精確度)。

f7408046-d6e0-11ed-bfe3-dac502259ad0.png

一個 NLP 項目中不同模型的精度、召回率和置信度

隨著模型越來越不穩定,曲線向下傾斜,如果模型具有向上傾斜的精度和召回曲線,則該模型的置信度估計可能存在問題。

人工智能研究人員偏向于指標,并且可以在單個指標中捕獲整個精確召回曲線。第一個也是最常見的是 F1,它結合了精度和召回措施,以找到最佳置信度閾值,其中精度和召回率產生最高的 F1 值。接下來是 AUC(曲線下面積),它集成了精確性和召回曲線下的繪圖量。

f761ce40-d6e0-11ed-bfe3-dac502259ad0.png

精確召回匯總指標圖

最終的精確-召回曲線指標是平均精度 (AP),它被計算為在每個閾值處實現的精度的加權平均值,并將前一個閾值的召回率增加用作權重。

AUC 和 AP 都捕獲了精確-召回曲線的整個形狀,選擇一個或另一個進行目標檢測是一個選擇問題,研究界已經將注意力集中在AP 的可解釋性上。

通過并集上的交點測量正確性

目標檢測系統根據邊界框和類標簽進行預測。

f77863e4-d6e0-11ed-bfe3-dac502259ad0.png

真正的目標檢測圖

在實踐中,X1、X2、Y1、Y2 坐標中預測的邊界框肯定會偏離地面真實標簽(即使稍微偏離)。我們知道如果邊界框預測是錯誤的類,我們應該將其視為不正確的,但是我們應該在哪里繪制邊界框重疊的線?

Intersection over Union (IoU) 提供了一個度量來設置這個邊界,與地面真實邊界框重疊的預測邊界框的數量除以兩個邊界框的總面積。

f78bab34-d6e0-11ed-bfe3-dac502259ad0.png?

真正對 IoU 指標的圖形描述。

為 IoU 指標選擇正確的單個閾值似乎是任意的,一位研究人員可能會證明 60% 的重疊是合理的,而另一位則認為 75% 似乎更合理,那么為什么不在一個指標中考慮所有閾值呢?

繪制mAP精度-召回曲線

為了計算 mAP,我們繪制了一系列具有不同難度級別的 IoU 閾值的精確-召回曲線。

f79ab746-d6e0-11ed-bfe3-dac502259ad0.png

我們真正繪制的 mAP 精確召回曲線圖

在上圖中,紅色繪制的是對 IoU 的最高要求(可能是 90%),橙色線繪制的是對 IoU 的最低要求(可能是 10%),要繪制的線數通常由挑戰設置。例如,COCO 挑戰設置了十個不同的 IoU 閾值,從 0.5 開始,以 0.05 的步長增加到 0.95。

最后,我們為按類型劃分的數據集繪制這些精度-召回曲線。

f7b243e8-d6e0-11ed-bfe3-dac502259ad0.png

由我們真正按對象類別劃分的 mAP 圖

該指標在所有 IoU 閾值上單獨計算每個類的平均精度 (AP),然后該指標對所有類別的 mAP 進行平均以得出最終估計值。

在實驗中使用平均精度均值(mAP)

我最近在一篇文章中使用了mAP,比較了最先進的EfficientDet和YOLOv3檢測模型,我想看看哪個模型在識別血液中的細胞表現更好。

在對測試集中的每個圖像進行推理后,我導入了一個 python 包來計算Colab筆記本中的mAP,結果如下!

EfficientDet 對細胞物體檢測的評價:

78.59% = Platelets AP 
77.87% = RBC AP 
96.47% = WBC AP 
mAP = 84.31%

YOLOv3對細胞物體檢測的評價:

72.15% = Platelets AP 
74.41% = RBC AP 
95.54% = WBC AP 
mAP = 80.70%

因此,與本文開頭的單一推斷圖片相反,事實證明EfficientDet在建模細胞目標檢測方面做得更好!我們還將注意該指標是按對象類劃分的,這告訴我們,白細胞比血小板和紅細胞更容易檢測,這是有道理的,因為它們比其他細胞大得多,并且不同。

地圖也經常被分成小、中、大對象,這有助于識別模型(和/或數據集)可能出現錯誤的地方。





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • MAP
    MAP
    +關注

    關注

    0

    文章

    49

    瀏覽量

    15179
  • 計算機視覺
    +關注

    關注

    8

    文章

    1700

    瀏覽量

    46127
  • AUC
    AUC
    +關注

    關注

    0

    文章

    9

    瀏覽量

    6677
  • nlp
    nlp
    +關注

    關注

    1

    文章

    489

    瀏覽量

    22107

原文標題:什么是目標檢測中的平均精度均值(mAP)?

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    電子信息產業已成為我國的國民經濟支柱產業

      電子信息產業已成為我國的國民經濟支柱產業,如今電子制造業的六大亮點:總體規模逐步擴大,企業實力增強;產業集中度不斷提升;區域集中效應日益顯現;結構調整取得較大的進展,高端產品在
    發表于 07-02 16:40

    公眾WiFi服務已成為商家的“標配”

    已成為普通市民日常生活中,必不可少的一部分。商家紛紛提供免費wifi服務,應對顧客對無線上網的需求。既能夠向顧客提供高質量的wifi免費服務,還能同時提升商家的品牌形象,通過短信關懷和營銷、微信微博營銷
    發表于 04-10 10:44

    雷達回波發生器的主要技術指標有什么?

    難以在完全真實的環境中進行。因此,通過數字模擬的方法真實地模擬雷達回波信號很有意義。雷達回波發生器是數字仿真技術和雷達技術相結合的產物,它通過仿真模擬的方法產生目標和環境信息的回波信號。利用這種回波信號對雷達信號處理機進行調試、分析和*估,已成為現代雷達信號處理機研制和生
    發表于 08-21 06:33

    目標檢測和圖像語義分割領域性能評價指標

    目標檢測和圖像語義分割領域的性能評價指標
    發表于 05-13 09:57

    一種基于Kalman濾波器的運動目標檢測和跟蹤算法

    視頻或圖像序列中的運動目標檢測與跟蹤已成為計算機視覺領域研究的重要方向之一。本文實現了視頻序列中的運動目標檢測,使用了背景差法和幀間差分法
    發表于 10-09 16:01 ?78次下載

    Alignment已成為Inphi公司在中國的授權廠家代表

    Alignment已成為Inphi公司在中國的授權廠家代表 Alignment (緣隆)宣布,Alignment已成為Inphi公司在中國的授權廠家代表。 Inphi公司是一家美國高速模擬半導體公司。
    發表于 09-07 07:04 ?1283次閱讀

    區塊鏈技術已成為電商的新風口

    區塊鏈技術儼然已成為電商的新風口,其先進性也毋庸置疑,但也因為落地場景不多而顯得不夠“接地氣”。而跨境電商與區塊鏈技術能否有效進行結合、成功落地,業內認為還尚待觀察。
    發表于 01-14 14:13 ?654次閱讀

    FLIR紅外熱像儀已成為火山研究者檢測和分析火山熱活動不可或缺的工具

    通過FLIR紅外熱像儀獲得火山熱成像圖,進行觀察分析。FLIR紅外熱像技術已成為火山研究者可視化火山熱的重要方法。
    的頭像 發表于 08-14 11:14 ?3524次閱讀

    無線電技術已成為信息通信技術中的創新活力和發展潛力

    張峰指出,無線電技術已成為信息通信技術中發展最迅速、應用最廣泛的領域,展現出巨大的創新活力和發展潛力。
    的頭像 發表于 11-07 08:41 ?4261次閱讀

    中國移動已成為全球5G發展的核心力量

    “中國移動已成為全球5G發展的核心力量”水波表示,中國移動是5G需求目標的“定義者”、技術標準的“引領者”、端到端產業的“構建者”和5G賦能各行業的“開拓者”。
    發表于 11-07 08:54 ?1339次閱讀

    海信75L9S激光電視成銷冠 激光電視已成為消費者的大屏首選

    消費者正在“用腳投票”證明:激光電視已成為消費者的大屏首選。中怡康第49周(12月2-8日)監測數據顯示,剛上市一周的海信75L9S全色激光電視,就登頂暢銷榜首。而海信80L5也持續熱銷,穩坐年度第一位置。
    發表于 12-12 10:30 ?1831次閱讀

    VPN已成為了攻擊入口,安全訪問該何去何從

    在過去十多年,SSL VPN已成為眾多企業的IT基礎設施。近期利用SSL VPN設備發起的APT攻擊事件并非孤案。
    發表于 04-13 17:37 ?2204次閱讀

    日經亞洲:中國已成為新興技術制定國際規則的核心參與者

    日經亞洲評論稱,中國已成為新興技術制定國際規則的核心參與者,特別是5G。
    發表于 07-26 11:35 ?820次閱讀

    WSL中運行Linux GUI應用已成為現實

    在 WSL 中運行 Linux GUI 應用已成為現實,微軟 WSL 團隊產品經理 Craig Loewen 在推特展示了其團隊為 WSL 添加對 Linux GUI 應用的支持,并表示越來越接近初始預覽階段,將會在未來幾個月內發布的 Windows Insiders 預覽版本中引入。
    的頭像 發表于 10-10 14:40 ?3659次閱讀

    天翼云領跑政務云駛入快車道,獨特優勢成為政府上云首選

    當前,上云已成為普遍共識。在眾多的云服務商中,天翼云何以脫穎而出,成為政務上云的首選
    的頭像 發表于 12-09 14:09 ?2510次閱讀
    威尼斯人娱乐城网| 都兰县| 黄金城百家乐官网下载| 沈阳棋牌网| 百家乐官网用品| 大发888下载专区| 24山向| 百家乐官网d博彩论坛| 励骏会百家乐的玩法技巧和规则| 永利百家乐官网娱乐场| 利来娱乐网| 澳门百家乐棋牌游戏| 关于百家乐官网概率的书| 水果机教程| 最好的百家乐论坛| 百家乐官网概率下注法| 百家乐统计工具| 巴西百家乐官网的玩法技巧和规则| 平博国际| 济州岛百家乐的玩法技巧和规则 | 百家乐麻将筹码币| 24山分金吉凶断| 金宝博备用网址| 大丰收百家乐的玩法技巧和规则 | 龙虎机| 神话百家乐的玩法技巧和规则| 在线百家乐官网作| 百家乐官网娱乐城注册| 竞咪百家乐官网的玩法技巧和规则| 清水河县| 大发888赌场网址| 真人百家乐开户优惠| 百家乐官网切入法| 百家乐官网注册开户| 六合彩印刷图库| 百家乐博娱乐场开户注册| 百家乐官网法则| 太阳城百家乐官网试玩优惠| 利记| 赌球网站排名| 百家乐网站制作|