那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Seam Carving一種很強的圖像縮放算法

新機器視覺 ? 來源:NetPioneer ? 作者:NetPioneer ? 2022-11-11 15:33 ? 次閱讀

Seam Carving一種很強的圖像縮放算法

0

簡介

我們在排版的時候可能會遇到一些尷尬的情況。一張圖片原本是豎著的,而你希望把它當作一張寬屏圖片,于是你只好對它進行拉伸:

547e9e7a-6105-11ed-8abf-dac502259ad0.png

撫子的形狀瞬間變得不可描述起來。有沒有什么辦法,能不改變前景撫子的形象,只是拉伸背景的天空呢?也許你會想到萬能的神經網絡。但早在神經網絡火遍大江南北之前,就有一種方法流行于世間:Seam Carving。它可以做到這樣:

549f8d9c-6105-11ed-8abf-dac502259ad0.png

完美符合我們的要求!那么這個仿佛魔法一樣的Seam Carving是如何工作的呢?

01

什么是圖像

我們這里將所談論到的圖像限定為二維的像素圖象,而不是矢量圖象或者三維的體素組成的“圖像”之類的東西。對于一幅圖像,它的每個像素擁有一個整數坐標,同時擁有一個顏色,后者以 RGB 的形式表現。

當人看到圖像的時候,主要是通過識別圖像當中的邊緣來分辨圖像中的物體的,這提示我們邊緣的信息對于尋找圖像中的主要物體有著重要的作用。如果我們在圖像縮放的時候能夠盡量不影響到這些像素,那么就有可能做到在保證圖像中主要物體的比例不變的情況下拉伸背景。就像這樣

| 原圖像

5679c27c-6105-11ed-8abf-dac502259ad0.png

| 縮放后

56a78248-6105-11ed-8abf-dac502259ad0.png

由此我們可以得出結論:通過依次刪除圖像中若干條自上而下和自左而右的像素通路,就可以達到“縮放”的目的。就自上而下的像素通路來說,這樣的通路寬度為 1,從圖像的第一行連接到圖像的最后一行,在每一行中只占據一個像素,相鄰行的像素的水平坐標相差在 -1 到 1 之間。刪除這樣的自上而下的像素保證了圖像的寬度減一的同時不會出現寬度不同的行;自左而右的像素通路也是同理。

56bee424-6105-11ed-8abf-dac502259ad0.png

圖中的紅線分別是一條垂直通路和水平通路。如何找到這樣的像素通路,穿過盡可能少的重要物體?為此,我們引入了一個概念:“能量”。

02

能量,又是能量

能量在這里起到的作用是表征像素的重要程度。先從圖像的基本元素的能量——像素的能量說起。對于單個像素,我們可以定義其能量形式為:

56d7f414-6105-11ed-8abf-dac502259ad0.png

其中,字母I表示像素灰度值,第一個偏導項就表示了色彩在這個像素變化的劇烈程度。如果我們將 RGB 顏色的像素的顏色看作一個三維向量,那么其能量形式也會是一個三維向量,這對于算法的后續實現是不利的。在實現中,我們可以用灰度標量代替 RGB 三維向量參與運算,因為人眼對灰度的敏感度遠高于色彩。公式看起來不太直觀,來看一個例子:

56eb75b6-6105-11ed-8abf-dac502259ad0.png

與人物有關的部分,細節比較多,對應的顏色變化也更明顯,能量也就越高。相比之下,背景部分比如天空的顏色變化不太明顯,能量普遍比較低。對應到上圖中,可能找到的垂直能量通路就是左側的天空,刪除之后并不會影響魚和人物的部分。

對于任意的一條自上而下的像素通路,該通路的能量就是該通路中所有像素的能量的和。

03

利用能量進行分割

前文說到,像素的能量表征了像素的重要程度,那么像素通路的能量就表征了像素通路中所有像素的總體重要程度,也就表征了該通路穿過的重要物體的多寡,也就表征了刪除這條像素通路對圖像中重要物體的影響程度的大小。刪除一條能量最小的像素通路對圖像中重要物體的影響是最小的。

5738a980-6105-11ed-8abf-dac502259ad0.png

對于這樣一張圖像,如果對其進行縮放,我們希望保留不同顏色間的分界線,使其形狀和比例盡可能地不改變。即這幾條分界線的重要性應該盡可能地高。根據我們關于能量的定義,分界線附近的像素的能量顯著地高于色塊中的像素。如果要被刪去的像素通路主要通過色塊區域,那么分界線的形狀就可以得到保留了。

那么現在的問題就變成了如何尋找一條能量最小的像素通路,這里以自上而下的像素通路說明尋找這樣的像素通路的方式。這就轉換為了一個經典的動態規劃問題,形式化的轉移方程如下:

我們記 dpi 為從圖像的第一行到第 i 行的第 j 個像素的通路中能量最小的通路的能量 e 以及該像素在該通路上的前驅 p。第 i 行的第 j 個像素的能量為 e(i,j)。那么

574b1da4-6105-11ed-8abf-dac502259ad0.png

這個公式可能還是有點太過抽象了。由于通路一定是連通的,也就是某一個像素只可能與三個像素位于同一條通路內,分別是它的左上、正上和右上。

576507be-6105-11ed-8abf-dac502259ad0.png

如果我們分別知道它左上、正上和右上的三個像素所在的通路的最低能量,只需要選出能量最低的一條并加上自己的能量,就構成了當前像素的最短能量通路。換言之,這其實是一種歸納法:

·第一行每個像素的累積能量是自己的能量值

·除此之外每一行每個像素的累計能量是上一行的三個相鄰像素中最低的累積能量加上自己的能量值

·最后一行的累計能量最低的就代表了一條能量最短的通路

當然,這里還有一個小小的擴展:現在有一個希望縮減的圖像,其寬高分別需要縮減 dw 和 dh 個像素。這就意味著這張圖象需要刪去 dw 和 dh 條能量最小的自上而下的通路和自左而右的通路。我們可以選擇先刪除自左而右的通路,再刪除自上而下的通路,反之亦可。但是為了追求刪除通路的總能量和最小——這樣全部刪除掉的像素對重要物體的影響最小,我們還可以優化這個刪除順序。

這個問題也可以用動態規劃的方法解決。不妨記 dq[i] [j] 為原圖像在水平縮減 i 個像素長度、垂直縮減 j 個像素長度的過程中所有刪去的像素通路的能量值和的最小值,由于寬高分別為 x 和 y 的圖像在這種縮放方式下只有可能通過 寬高為 (x+1,y) 或 (x,y+1) 的圖像縮減而來,所以有

577986bc-6105-11ed-8abf-dac502259ad0.png

有了上面的經驗,讀者能否自己理解這個轉移方程的含義呢?

最后再來看一個利用Seam Carving方法處理的例子:

| 原圖像

578911ea-6105-11ed-8abf-dac502259ad0.png

| 縮減后

58153648-6105-11ed-8abf-dac502259ad0.png

很多細節得到了保留,比起直接拉伸來說要好太多了。

04

結語

本文介紹的這種Seam Carving方法由Avidan等人發明,并發表在2007年的Siggraph中,目前已經有非常廣泛的應用,在Photoshop等軟件中都可以找到它的身影。比起目前主流的神經網絡方法來說,它要簡單的多,并且有很大的改良余地,最終效果也不遑多讓。有興趣的同學也可以進一步的研究或者和我討論。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4779

    瀏覽量

    101171
  • 算法
    +關注

    關注

    23

    文章

    4630

    瀏覽量

    93355
  • 圖像
    +關注

    關注

    2

    文章

    1089

    瀏覽量

    40573

原文標題:Seam Carving - 一種很強的圖像縮放算法

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    百問FB顯示開發圖像處理 - 圖像調整

    \"。 原理淺析 ?要理解這個圖像縮放算法的原理,最重要的是需要理解:對于圖像上的每個像素點,它縮放
    發表于 12-02 09:34

    EPS格式圖像的最佳使用場景

    EPS(Encapsulated PostScript)是一種廣泛使用的矢量圖形文件格式,最初由Adobe公司開發。它以其高兼容性、可縮放性和高質量的圖像輸出而受到設計師和出版業的青睞。 1. 專業
    的頭像 發表于 11-19 10:33 ?613次閱讀

    一種基于深度學習的二維拉曼光譜算法

    近日,天津大學精密儀器與光電子工程學院的光子芯片實驗室提出了一種基于深度學習的二維拉曼光譜算法,成果以“Rapid and accurate bacteria identification
    的頭像 發表于 11-07 09:08 ?300次閱讀
    <b class='flag-5'>一種</b>基于深度學習的二維拉曼光譜<b class='flag-5'>算法</b>

    使用功率縮放

    電子發燒友網站提供《使用功率縮放庫.pdf》資料免費下載
    發表于 10-18 10:24 ?0次下載
    使用功率<b class='flag-5'>縮放</b>庫

    tft屏幕屬于lcd屏幕的一種

    TFT屏幕確實屬于LCD(液晶顯示器)屏幕的一種。LCD屏幕是一種廣泛使用的顯示技術,它通過液晶分子的排列變化來控制光線的通過,從而實現圖像的顯示。TFT(Thin Film Transistor
    的頭像 發表于 10-12 10:31 ?1151次閱讀

    晶振封裝秘籍:滾邊焊(SEAM)技術大揭秘!

    晶振滾邊焊(SEAM)是一種焊接技術,主要用于晶體振蕩器的封裝過程中。它涉及到在氮氣環境中使用高溫將晶振的蓋板與基座焊接在起完成封裝。使得外殼邊緣熔化并形成牢固的焊縫。這樣的焊接方式可以提高封裝
    的頭像 發表于 07-22 09:29 ?1326次閱讀
    晶振封裝秘籍:滾邊焊(<b class='flag-5'>SEAM</b>)技術大揭秘!

    圖像識別算法有哪幾種

    圖像識別算法是計算機視覺領域的核心技術之,它通過分析和處理圖像數據,實現對圖像中的目標、場景和物體的識別和分類。
    的頭像 發表于 07-16 11:22 ?1364次閱讀

    圖像識別算法都有哪些方法

    圖像識別算法是計算機視覺領域的核心任務之,它涉及到從圖像中提取特征并進行分類、識別和分析的過程。隨著深度學習技術的不斷發展,圖像識別
    的頭像 發表于 07-16 11:14 ?6063次閱讀

    圖像識別算法的提升有哪些

    方法。 數據增強 數據增強是提高圖像識別算法性能的一種有效方法。通過對訓練數據進行變換和擴展,可以增加數據的多樣性,提高模型的泛化能力。常見的數據增強方法包括: 2.1 旋轉、縮放、平
    的頭像 發表于 07-16 11:12 ?746次閱讀

    圖像識別算法的優缺點有哪些

    圖像識別算法一種利用計算機視覺技術對圖像進行分析和理解的方法,它在許多領域都有廣泛的應用,如自動駕駛、醫療診斷、安全監控等。然而,圖像識別
    的頭像 發表于 07-16 11:09 ?1898次閱讀

    圖像識別算法的核心技術是什么

    圖像識別算法是計算機視覺領域的個重要研究方向,其目標是使計算機能夠像人類樣理解和識別圖像中的內容。
    的頭像 發表于 07-16 11:02 ?740次閱讀

    opencv圖像識別有什么算法

    OpenCV(Open Source Computer Vision Library)是個開源的計算機視覺和機器學習軟件庫,提供了大量的圖像處理和計算機視覺相關的算法。以下是些常見
    的頭像 發表于 07-16 10:40 ?1211次閱讀

    rup是一種什么模型

    RUP(Rational Unified Process,統建模語言)是一種軟件開發過程模型,它是一種迭代和增量的軟件開發方法。RUP是由Rational Software公司(現為IBM的
    的頭像 發表于 07-09 10:13 ?1396次閱讀

    DSP C6000教學實驗箱操作教程_數字圖像處理:5-3 圖像縮放

    、實驗目的 學習圖像縮放的原理,掌握圖像的讀取方法,并實現圖像縮放。 二、實驗原理
    發表于 06-20 11:28

    基于FPGA的常見的圖像算法模塊總結

    意在給大家補充下基于FPGA的圖像算法基礎,于是講解了下常見的圖像算法模塊,經過個人的總結,
    的頭像 發表于 04-28 11:45 ?660次閱讀
    基于FPGA的常見的<b class='flag-5'>圖像</b><b class='flag-5'>算法</b>模塊總結
    大发888真人网址| 大家旺百家乐官网娱乐城| 保单百家乐游戏机| tt娱乐城官网| 风水学坐向24山| kk娱乐城开户| 正品百家乐官网的玩法技巧和规则| 顶级赌场dj| 做生意门口怎么摆放| 皇冠网最新网址| 真人百家乐攻略| 百家乐官网视频游戏账号| 百家乐套利| 试玩百家乐官网代理| 516棋牌游戏补丁| 盐津县| 百家乐透视牌靴| 网络百家乐官网软件真假| 大发888全部的网站地址| 百家乐官网平注法到656| 海立方娱乐城| 电玩百家乐游戏机路单| 百家乐官网平注法是什么| 大发888娱乐城优惠码lm0| 长赢百家乐官网赌徒| 盛世国际娱乐博彩| 玩百家乐犯法| 百家乐官网蓝盾有赢钱的吗| 桐庐棋牌世界| 百家乐代理在线游戏可信吗网上哪家平台信誉好安全 | 百家乐代理网址| 来博百家乐官网现金网| 水果机游戏在线玩| 百家乐捡揽方法| 真人百家乐官网免费开户送钱| 大发888游戏是真的吗| 三合四局24向黄泉| 无为县| 太阳城申博娱乐| 澳门百家乐打法精华| 兴宁市|