那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

什么是圖像分割?圖像分割的體系結構和方法

INDEMIND ? 來源:INDEMIND ? 2023-08-18 10:34 ? 次閱讀

圖像分割(Image Segmentation)是計算機視覺領域中的一項重要基礎技術,是圖像理解中的重要一環。前端時間,數據科學家Derrick Mwiti在一篇文章中,就什么是圖像分割、圖像分割架構、圖像分割損失函數以及圖像分割工具和框架等問題進行了討論,讓我們一探究竟吧。

01 什么是圖像分割?

顧名思義,這是將一個圖像分割成多個片段的過程。在這個過程中,圖像中的每個像素都與一個對象類型相關聯。圖像分割主要有兩種類型:語義分割和實例分割。

在語義分割中,同一類型的所有對象都使用一個類標簽進行標記,而在實例分割中,相似的對象使用各自獨立的標簽。

02 圖像分割的體系結構

圖像分割的基本結構包括編碼器和解碼器。

編碼器通過過濾器從圖像中提取特征。解碼器負責生成最終的輸出,通常是一個包含對象輪廓的分割掩碼。大多數體系結構都有這種結構或其變體,看幾個例子:

U-Net

U-Net是最初用于分割生物醫學圖像的卷積神經網絡。可視化時,其架構看起來像字母U,因此名稱為U-Net。

它的體系結構由兩部分組成,左邊部分是收縮路徑,右邊部分是擴展路徑。收縮路徑的目的是捕獲上下文,而擴展路徑的作用是幫助精確定位。

7abfd2a6-3cde-11ee-ac96-dac502259ad0.jpg

U-Net由右邊的擴展路徑和左邊的收縮路徑組成。收縮路徑由兩個3×3的卷積組成,卷積之后是一個整流的線性單元和一個用于降采樣的兩乘二最大池計算。

FastFCN —Fast Fully-connected network

在這種結構中,聯合金字塔上采樣(JPU)模塊被用來代替擴展卷積,因為它們消耗大量的內存和時間。它的核心是一個全連接網絡,同時使用JPU進行上采樣。JPU將低分辨率特征圖提升為高分辨率特征圖。

Gated-SCNN

該架構由雙流CNN架構組成。在此模型中,一個單獨的分支用于處理圖像形狀信息。形狀流用于處理邊界信息。

你可以通過檢查這里的代碼來實現

DeepLab

在這種結構中,卷積與上采樣濾波器用于涉及密集預測的任務。多個對象的分割是通過空間金字塔池來完成的。最后,用DCNNs改進對象邊界的定位。通過插入零點或對輸入特征圖進行稀疏采樣來對濾波器進行上采樣,從而實現空洞卷積。

可以在PyTorch或TensorFlow上嘗試其實現。

Mask R-CNN

在這種體系結構中,使用bounding box和語義分割對對象進行分類和定位,并將每個像素分類為一組類別。每個感興趣的區域都有一個分割掩碼,最終的輸出是一個類標簽和一個bounding box。該體系結構是Faster R-CNN的擴展,Faster R-CNN由提出區域的深度卷積網絡和利用區域的檢測器組成。

這是在COCO測試集上得到的結果的圖像

03 圖像分割損失函數

語義分割模型在訓練過程中通常使用一個簡單的交叉熵損失函數。但是,如果對獲取圖像的粒度信息感興趣,則必須恢復到稍微高級一些的損失函數,來看幾個例子:

Focal Loss

這種損失是對標準交叉熵準則的改進。這是通過改變其形狀來實現的,使得分配給分類良好的示例的損失權重降低了。最終,確保不存在類不平衡。

在這個損失函數中,交叉熵損失是會隨著縮放系數衰減為零而縮,訓練時,比例因數自動降低了簡單示例的權重,并將重點放在困難示例上。

7b7bfdc8-3cde-11ee-ac96-dac502259ad0.png

Dice loss

該損失是通過計算平滑dice coefficient函數獲得的。這種損失是最常用的損失,是分割

問題。

7b98513a-3cde-11ee-ac96-dac502259ad0.png

Intersection over Union (IoU)-balanced Loss

IoU平衡分類損失的目的是增加高IoU樣本的梯度,降低低IoU樣本的梯度。從而提高了機器學習模型的定位精度。

7bb0f37a-3cde-11ee-ac96-dac502259ad0.png

Boundary loss

Boundary loss的一種變體應用于具有高度不平衡分段的任務。

這種損失的形式是空間輪廓而非區域上的距離度量。通過這種方式,它解決了高度不平衡的分割任務的區域損失所帶來的問題。

7bd48fce-3cde-11ee-ac96-dac502259ad0.png

Weighted cross-entropy

在交叉熵的一個變體中,所有正例均按一定系數加權。它用于涉及類不平衡的方案。

7bea244c-3cde-11ee-ac96-dac502259ad0.png

Lovász-Softmaxloss

該損失基于子模塊損失的convex Lovasz擴展,對神經網絡中的intersection-over-union loss進行了直接優化。

7c05f906-3cde-11ee-ac96-dac502259ad0.png

其他值得一提的損失有:

TopK loss:其目標是確保網絡在訓練過程中專注于困難樣本。

Distance penalized CE loss:它將網絡引向難以分割的邊界區域。

Sensitivity-Specificity (SS) loss:計算特異性和敏感性的均方差的加權和。

Hausdorff distance(HD) loss:可從卷積神經網絡估計Hausdorff距離。

這些是在圖像分割中使用的一些損失函數。了解更多,請查看

04 圖像分割的數據集

Common Objects in COntext—Coco Dataset

COCO是一個大型的對象檢測、分割和字幕數據集。數據集包含91個類。它有25萬人,都有自己的關鍵點。它的下載大小是37.57 GiB。它包含80個對象類別。它在Apache 2.0的許可下可用,可以從這里下載。

PASCAL Visual Object Classes (PASCAL VOC)

PASCAL有20個不同的類,9963張圖片。訓練/驗證集是一個2GB的tar文件。數據集可以從官方網站下載。

The Cityscapes Dataset

這個數據集包含城市場景的圖像。該方法可用于評價視覺算法在城市場景中的性能。數據集可以從這里下載。

The Cambridge-driving Labeled Video Database?—?CamVid

這是一個基于動作的分割和識別數據集。它包含32個語義類。以下鏈接包含數據集的進一步說明和下載鏈接。

05 圖像分割框架

如果準備好了數據集,那么來談談一些可用于入門的工具/框架。

FastAI庫:給定一個圖像,該庫能夠為圖像中的對象創建掩碼。

Sefexa圖像分割工具:可用于半自動圖像分割,圖像分析和創建地面實況。

Deepmask:Facebook Research的Deepmask是DeepMask和SharpMask的Torch實現。

MultiPath:這是一個Torch實現,從“用于目標檢測的多路徑網絡”中提取目標檢測網絡。

OpenCV :這是一個開放源代碼的計算機視覺庫,具有2500多種優化算法。

MIScnn:醫學圖像分割開源庫。它允許在幾行代碼中使用最新的卷積神經網絡和深度學習模型建立管道。

Fritz:提供了多種計算機視覺工具,包括用于移動設備的圖像分割工具。

審核編輯:湯梓紅
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 解碼器
    +關注

    關注

    9

    文章

    1147

    瀏覽量

    40930
  • 編碼器
    +關注

    關注

    45

    文章

    3667

    瀏覽量

    135226
  • 計算機
    +關注

    關注

    19

    文章

    7534

    瀏覽量

    88634
  • 圖像分割
    +關注

    關注

    4

    文章

    182

    瀏覽量

    18046
  • 函數
    +關注

    關注

    3

    文章

    4346

    瀏覽量

    62967

原文標題:干貨丨沒有想的那么難,10分鐘了解圖像分割方法及原理

文章出處:【微信號:gh_c87a2bc99401,微信公眾號:INDEMIND】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    基于改進遺傳算法的圖像分割方法

    基于改進遺傳算法的圖像分割方法提出一種應用于圖像分割的改進遺傳算法,算法中引入了優生算子、改進的變異算子和新個體,避免了局部早熟,提高了收斂
    發表于 09-19 09:36

    基于區域的區域生長圖像分割方法

    基于區域的區域生長圖像分割方法,提供給從事圖像分割的朋友們 -based on the growth of the regional ima
    發表于 02-10 10:19 ?112次下載

    PCB缺陷檢測中圖像分割算法

    圖像分割圖像處理中占有重要的地位,分割結果的好壞直接影響圖像的后續處理。本文介紹了4種常用的圖像
    發表于 06-16 15:31 ?0次下載
    PCB缺陷檢測中<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>算法

    圖像分割—基于圖的圖像分割

    圖像分割—基于圖的圖像分割圖像分割—基于圖的圖像
    發表于 11-19 16:17 ?0次下載

    基于Matlab圖像分割的研究

    圖像分割圖像處理過渡到圖像分析這個過程中起著非常重要的作用,它是圖像工程的核心,圖像
    發表于 01-04 15:10 ?0次下載

    圖像分割方法的研究現狀與展望

    立體視覺的應用越來越廣泛,立體視覺需要用到圖像分割方法,這個論文是有關圖像分割的研究現狀與展望
    發表于 05-20 16:50 ?0次下載

    基于紋理幾何結構的紋理描述圖像分割

    。利用一種基于紋理幾何結構的紋理描述符描述圖像中不同的紋理區域,使得不同紋理區域對比更加明顯,相同紋理區域更加平滑,通過抑制紋理信息使后續的圖像分割在紋理部分的錯分大大減少。實驗結果表
    發表于 11-22 17:29 ?0次下載
    基于紋理幾何<b class='flag-5'>結構</b>的紋理描述<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>

    圖像分割基礎算法及實現實例

    圖像分割就是把圖像分成若干個特定的、具有獨特性質的區域并提出感興趣目標的技術和過程。它是由圖像處理到圖像分析的關鍵步驟。現有的
    發表于 12-18 18:19 ?9430次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>分割</b>基礎算法及實現實例

    圖像分割評價方法研究

     閥值分割法是一種傳統的圖像分割方法,因其實現簡單、計算量小、性能較穩定而成為圖像分割中最基本和
    發表于 12-19 09:13 ?3.1w次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>分割</b>評價<b class='flag-5'>方法</b>研究

    圖像分割圖像邊緣檢測

     圖像分割的研究多年來一直受到人們的高度重視,至今提出了各種類型的分割算法。Pal把圖像分割算法分成了6類:閾值
    發表于 12-19 09:29 ?1.1w次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>分割</b>和<b class='flag-5'>圖像</b>邊緣檢測

    圖像分割技術的原理及應用

    圖像分割至今尚無通用的自身理論。隨著各學科許多新理論和新方法的提出,出現了許多與一些特定理論、方法相結合的圖像
    發表于 12-19 15:00 ?4.1w次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>分割</b>技術的原理及應用

    圖像分割的基本方法解析

    本文詳細介紹了圖像分割的基本方法有:基于邊緣的圖像分割方法、閾值
    發表于 12-20 11:06 ?11w次閱讀
    <b class='flag-5'>圖像</b><b class='flag-5'>分割</b>的基本<b class='flag-5'>方法</b>解析

    基于內容的圖像分割方法綜述

    方法、基于像素聚類的方法和語義分割方法這3種類型并分別加以介紹對每類方法所包含的典型算法,尤其是最近幾年利用深度網絡技術的語義
    發表于 01-02 16:52 ?2次下載
    基于內容的<b class='flag-5'>圖像</b><b class='flag-5'>分割</b><b class='flag-5'>方法</b>綜述

    機器視覺圖像分割方法有哪些?

    現有的圖像分割方法主要分以下幾類:基于閾值(threshold)的分割方法、基于區域的分割
    發表于 11-02 10:26 ?1415次閱讀
    機器視覺<b class='flag-5'>圖像</b><b class='flag-5'>分割</b>的<b class='flag-5'>方法</b>有哪些?

    圖像分割和語義分割的區別與聯系

    圖像分割和語義分割是計算機視覺領域中兩個重要的概念,它們在圖像處理和分析中發揮著關鍵作用。 1. 圖像
    的頭像 發表于 07-17 09:55 ?1161次閱讀
    大杀器百家乐学院| 澳门百家乐必赢看| 百家乐官网最好投注| 巴西百家乐的玩法技巧和规则| 百家乐官网技巧-澳门百家乐官网官方网址 | 百家乐官网软件骗人吗| 大发888娱乐场下载 df888ylc3403| 百家乐娱乐城代理| 澳门百家乐官网牌规| 亲朋棋牌刷金币| 视频百家乐信誉| 百家乐官网推荐| 澳门百家乐官网职业赌客| 3u娱乐城| 大发888真钱游戏娱乐城下载| 百家乐彩金| 做生意风水门面要求| 百家乐官网赌场合作| 百家乐官网里面的奥妙| 香港六合彩特码资料| LV百家乐娱乐城| 怎样打百家乐官网的玩法技巧和规则 | 百家乐投注软件有用吗| 保时捷百家乐娱乐城| 红树林百家乐官网的玩法技巧和规则 | 百家乐娱乐平台网| 百家乐赌钱| 真人百家乐软件博彩吧| 百家乐官网桌布无纺布| 百家乐官网大赌城| 百家乐官网游戏机技| 百家乐官网筹码币方形| 百家乐官网群柏拉图软件| 百家乐官网天下第一缆| 百家乐官网能战胜吗| 网上百家乐官网新利| 子洲县| 百家乐官网注册| 阿合奇县| 百家乐官网U盘下载| 百家乐官网在发牌技巧|