那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌教你用"注意力"提升產(chǎn)品體驗

CVer ? 來源:新智元 ? 2023-06-27 14:37 ? 次閱讀

【導讀】讓用戶在體驗過程中關(guān)注主要部分,得先抓住用戶的眼球。

人每時每刻都在接收海量的信息,例如每秒進入視網(wǎng)膜的數(shù)據(jù)量就達到了10的10次方比特,但人類會選擇性地關(guān)注一些任務相關(guān)或感興趣的區(qū)域以進一步處理,比如記憶、理解和采取行動等。

如何將人類的注意力進行建模,即顯著性模型(saliency model)在神經(jīng)科學、心理學、人機交互(HCI)和計算機視覺等領(lǐng)域開始得到廣泛關(guān)注。

預測「哪些區(qū)域可能吸引注意力」的能力在圖形、攝影、圖像壓縮和處理以及視覺質(zhì)量測量等領(lǐng)域具有許多重要應用。

不過,使用機器學習和基于智能手機的凝視估計來加速眼動研究需要專門的硬件,每臺成本高達三萬美元,并不具備廣泛推廣的條件。

最近,谷歌的研究人員介紹了兩篇相關(guān)領(lǐng)域的研究論文,分別發(fā)表在CVPR 2022和CVPR 2023上,主要研究了如何利用「人類注意力的預測模型」來實現(xiàn)更好的用戶體驗,例如用圖像編輯操作以最大限度地減少視覺混亂、分心或偽影等問題,使用圖像壓縮來更快地加載網(wǎng)頁或應用程序,并引導機器學習模型實現(xiàn)更直觀的類人解釋和模型性能。

這兩篇論文主要關(guān)注圖像編輯和圖像壓縮,并討論了在具體應用場景下,對注意力建模的相關(guān)最新進展。

注意力引導的圖像編輯

對人體注意力進行建模,通常需要把眼睛看到的圖像作為輸入,如自然圖像或網(wǎng)頁的屏幕截圖等,并將預測的熱力圖作為輸出。

預測得到的熱力圖會根據(jù)「眼球跟蹤器」或「鼠標懸停/點擊」等收集到的實時注意力近似值進行評估。

之前的模型大多利用手工制作的視覺線索特征,如顏色/亮度對比度、邊緣和形狀等,最近也有一些方法轉(zhuǎn)向基于深度神經(jīng)網(wǎng)絡來自動學習判別特征,使用的模型包括卷積、遞歸神經(jīng)網(wǎng)絡以及視覺Transformer網(wǎng)絡等。

谷歌在CVPR2022上發(fā)表的一篇論文中,利用深度顯著性模型(deep saliency models)進行視覺逼真的編輯(visually realistic edits),可以顯著改變觀察者對不同圖像區(qū)域的注意力。

c4709a24-14a8-11ee-962d-dac502259ad0.png

論文鏈接:https://openaccess.thecvf.com/content/CVPR2022/papers/Aberman_Deep_Saliency_Prior_for_Reducing_Visual_Distraction_CVPR_2022_paper.pdf

比如移除背景中分散注意力的物體可以降低照片中的雜亂程度,從而提高用戶滿意度;同樣,在視頻會議中,減少背景中的混亂度也可以增加對主要發(fā)言者的關(guān)注度。

為了探索哪些類型的編輯效果是可實現(xiàn)的,以及這些效果如何影響觀眾的注意力,研究人員開發(fā)了一個優(yōu)化框架,以用于使用可區(qū)分的預測顯著性模型來引導圖像中的視覺注意力。

c49b203c-14a8-11ee-962d-dac502259ad0.png

給定輸入圖像和表示干擾物區(qū)域的二元遮罩,使用顯著性預測模型對遮罩內(nèi)的像素提供指導并編輯圖像,降低遮罩區(qū)域內(nèi)的顯著性。

為了確保編輯后的圖像自然且逼真,研究人員精心選擇了四種圖像編輯操作符,其中包括兩個標準圖像編輯操作(即重新著色和圖像扭曲);以及及兩個可學習的操作符,即多層卷積濾波器和生成模型(GAN)。

利用這些操作符,該框架可以產(chǎn)生各種強大的效果,包括重新著色、修復、偽裝、對象編輯、插入以及面部屬性編輯,并且所有這些效果都是由單個預訓練的顯著性模型驅(qū)動的,沒有任何額外的監(jiān)督或訓練。

c4a70bf4-14a8-11ee-962d-dac502259ad0.png

減少視覺干擾的例子,由顯著性模型與幾個操作符引導,干擾物區(qū)域被標記在顯著性圖(紅色邊框)的頂部

需要注意的是,研究人員的目標不是與產(chǎn)生每種效果的專用方法競爭,只是演示如何通過嵌入在深度顯著性模型中的知識來指導多個編輯操作。

個性化的顯著性建模

之前的研究假定單個顯著性模型即可完成對全部人群的預測任務,不過人類的注意力在個體之間是不同的:雖然對顯著線索的檢測是一致的,但具體的順序、解釋和注視分布可以有很大的區(qū)別,這一問題也提供了為個人或團體創(chuàng)建個性化用戶體驗的機會。

在CVPR2023的一篇論文中,谷歌的研究人員引入了一個用戶感知的顯著性模型,也是首個僅用單模型就可以完成預測某個用戶、一組用戶和通用人群注意力的框架。

c4bc6b5c-14a8-11ee-962d-dac502259ad0.png

論文鏈接:https://openaccess.thecvf.com/content/CVPR2023/papers/Chen_Learning_From_Unique_Perspectives_User-Aware_Saliency_Modeling_CVPR_2023_paper.pdf

該框架的核心是將每個參與者的視覺偏好與每個用戶的注意力熱力圖和自適應用戶遮罩進行組合,需要每個用戶的注意力標注在訓練過程中都是可用的,可用的數(shù)據(jù)集包括用于自然圖像的OSIE移動的凝視數(shù)據(jù)集、網(wǎng)頁的FiWI和WebSaliency數(shù)據(jù)集。

c4e4ee1a-14a8-11ee-962d-dac502259ad0.png

該模型并沒有預測表示所有用戶的注意力的單個顯著性熱力圖,而是預測每個用戶的注意力圖以編碼個體的注意力模式。

此外,該模型采用用戶掩碼(大小等于參與者數(shù)量的二進制向量)來指示當前樣本中參與者的存在,使得模型可以選擇一組參與者,并將偏好組合成單個熱力圖。

c517e1ee-14a8-11ee-962d-dac502259ad0.png

預測注意力與GT值,EML-Net是最先進模型的預測,對于兩個參與者/組具有相同的預測;Ours提出的用戶感知顯著性模型的預測,可以正確預測每個參與者/組的獨特偏好。第一個圖像來自OSIE圖像集,第二個圖像來自FiWI。

以顯著特征為中心的漸進式圖像解碼

除了圖像編輯,人類注意力模型也可以改善用戶的瀏覽體驗。

在上網(wǎng)時,最讓人感到不舒服的用戶體驗之一就是等待加載帶有圖像的網(wǎng)頁,特別是在網(wǎng)速很慢的情況下,一種改善用戶體驗的方式是圖像的漸進式解碼,可以隨著數(shù)據(jù)逐漸下載再解碼,并顯示越來越高分辨率的圖像,直到全分辨率圖像準備就緒。

漸進式解碼通常按順序進行(例如,從左到右、從上到下),使用預測注意力模型,就可以基于顯著性對圖像進行解碼,從而可以首先發(fā)送顯示最顯著區(qū)域的細節(jié)所需的數(shù)據(jù)。

例如,在肖像中,用于面部的字節(jié)可以優(yōu)先于用于失焦背景的字節(jié),因此用戶更早地感知到更好的圖像質(zhì)量,并體驗到顯著減少的等待時間。

基于這個想法,預測注意力模型可以幫助圖像壓縮和更快地加載具有圖像的網(wǎng)頁,改善大型圖像和流媒體/VR應用的渲染。

結(jié)論

上面兩篇論文展示了人類注意力的預測模型如何通過具體的應用場景實現(xiàn)令人愉快的用戶體驗,例如圖像編輯操作,可以減少用戶圖像或照片中的混亂、分心或偽影,以及漸進式圖像解碼,可以大大減少用戶在圖像完全渲染時的感知等待時間。

文中提出的用戶感知顯著性模型可以進一步為個人用戶或群體個性化上述應用程序,從而實現(xiàn)更豐富、更獨特的體驗。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6196

    瀏覽量

    106017
  • 神經(jīng)網(wǎng)絡

    關(guān)注

    42

    文章

    4781

    瀏覽量

    101175
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1089

    瀏覽量

    40574

原文標題:CVPR 2023 | 谷歌教你用"注意力"提升產(chǎn)品體驗

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    江西薩瑞微榮獲"2024全國第三代半導體制造最佳新銳企業(yè)"稱號

    快速發(fā)展與創(chuàng)新實力在2024全國第三代半導體產(chǎn)業(yè)發(fā)展大會上,江西薩瑞微電子科技有限公司榮獲"2024全國第三代半導體制造最佳新銳企業(yè)"稱號。這一榮譽不僅是對公司技術(shù)創(chuàng)新和產(chǎn)業(yè)化
    的頭像 發(fā)表于 10-31 08:09 ?452次閱讀
    江西薩瑞微榮獲&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;2024全國第三代半導體制造最佳新銳企業(yè)&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;稱號

    onsemi LV/MV MOSFET 產(chǎn)品介紹 &amp;amp;amp; 行業(yè)應用

    01直播介紹直播時間2024/10/281430直播內(nèi)容1.onsemiLV/MVMOSFET產(chǎn)品優(yōu)勢&amp;市場地位。2.onsemiLV/MVMOSFETRoadmap。3.onsemiT10
    的頭像 發(fā)表于 10-13 08:06 ?549次閱讀
    onsemi LV/MV MOSFET <b class='flag-5'>產(chǎn)品</b>介紹 &<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>; 行業(yè)應用

    OCTC發(fā)布&amp;quot;算工廠&amp;quot;!力促智算中心高效規(guī)劃建設投運

    創(chuàng)新提出面向未來數(shù)據(jù)中心的&quot;算工廠&quot;模式,核心是以規(guī)(劃)、建(設)、運(營)一體化的交鑰匙工程,實現(xiàn)智算中心快速投運、綠色低碳,在當前AIGC算供需挑戰(zhàn)下,開
    的頭像 發(fā)表于 10-11 09:10 ?559次閱讀
    OCTC發(fā)布&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;算<b class='flag-5'>力</b>工廠&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;!力促智算中心高效規(guī)劃建設投運

    軟通動力攜手華為啟動&amp;quot;智鏈險界&amp;quot;計劃,強化生態(tài)鏈接共啟保險AI新時代

    軟通動力攜子品牌軟通金科受邀參加此次大會,發(fā)表&quot;智馭未來 ? 探索保險AI新業(yè)態(tài)&quot;主旨演講,并攜手華為正式啟動&quot;智鏈險界——保險生態(tài)場景鏈接計劃&quot
    的頭像 發(fā)表于 09-23 19:22 ?426次閱讀
    軟通動力攜手華為啟動&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;智鏈險界&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;計劃,強化生態(tài)鏈接共啟保險AI新時代

    全方位精準測量技術(shù)助力:中國經(jīng)濟加力發(fā)展向前&amp;amp;quot;進&amp;amp;quot;

    全方位精準測量技術(shù)助力:中國經(jīng)濟加力發(fā)展向前&quot;進&quot;
    的頭像 發(fā)表于 07-15 09:53 ?410次閱讀
    全方位精準測量技術(shù)助力:中國經(jīng)濟加力發(fā)展向前&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;進&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    晶科能源榮獲EUPD Research授予的六項&amp;quot;頂級光伏品牌&amp;quot;稱號

    近日,由權(quán)威調(diào)研機構(gòu)EUPD Research頒發(fā),晶科能源在巴西、哥倫比亞、墨西哥、智利等拉美主要國家六個地區(qū)榮獲 &quot;頂級光伏品牌 &quot;稱號。憑借先進的技術(shù)、完善的流程和對卓越的不懈追求,晶科能源將繼續(xù)提升
    的頭像 發(fā)表于 05-10 09:17 ?540次閱讀
    晶科能源榮獲EUPD Research授予的六項&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;頂級光伏品牌&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;稱號

    谷歌整合安卓系統(tǒng)與Pixel硬件團隊,奧斯特羅引領(lǐng)新&amp;quot;Platfo&amp;quot;

    Osterloh曾主管谷歌硬件部門,涵蓋Pixel、Fitbit以及Nest等各種產(chǎn)品的研發(fā)和戰(zhàn)略規(guī)劃。他對The Verge表示:“唯有結(jié)合硬件、軟件和AI團隊,方能為用戶提供突破性AI體驗。
    的頭像 發(fā)表于 04-19 10:16 ?516次閱讀

    谷歌將在Pixel Tablet平板上引入&amp;quot;Look and Sign&amp;quot;功能,提升用戶體驗

    現(xiàn)階段,谷歌已在Nest Hub Max采用“Look and Talk”(看并說話)功能,用戶可在特定區(qū)域直視該設備,無需喚醒詞“OK Google”,便能實現(xiàn)語音指令。
    的頭像 發(fā)表于 04-18 15:36 ?398次閱讀

    九聯(lián)科技推出一款&amp;quot;射手座&amp;quot;UMA502-T7物聯(lián)網(wǎng)模組

    在物聯(lián)網(wǎng)技術(shù)飛速發(fā)展的時代背景下,九聯(lián)科技憑借深厚的研發(fā)底蘊與創(chuàng)新精神,精心打造出象征著自由探索與勇敢進取精神的&quot;射手座&quot;UMA502-T7模組,以昂揚之姿挺進海外市場,宣告了九聯(lián)科技物聯(lián)網(wǎng)模組國際化進程的盛大起航。
    的頭像 發(fā)表于 04-14 09:38 ?954次閱讀

    2024CCLTA | &amp;quot;智&amp;quot;領(lǐng)檢驗,&amp;quot;慧&amp;quot;聚山城

    上海2024年4月2日?/美通社/ --?2024年3月28日-31日,以"融合發(fā)展,引領(lǐng)未來"為主題的第十屆全國檢驗醫(yī)學技術(shù)與應用學術(shù)會議暨協(xié)同創(chuàng)新、融合發(fā)展國際論壇,第十屆全國臨床檢驗裝備展覽會(CCLTA2024)在重慶拉開帷幕。展會上,貝克曼庫爾特分享了"智慧檢驗"、"疾病管理"、"創(chuàng)升中國"下的重要力作,包括全自動化學發(fā)光免疫分析DxI800、全自動生化分析儀AU5800、微生物鑒定藥敏分析儀DxM1096、智研平臺、DxAI智控平臺LabBox Innovation等。 展會現(xiàn)場照片 作為體外
    的頭像 發(fā)表于 04-07 18:19 ?1099次閱讀
    2024CCLTA | &<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;智&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;領(lǐng)檢驗,&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;慧&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;聚山城

    科沃斯掃地機器人通過TüV萊茵&amp;quot;防纏繞&amp;quot;和&amp;quot;高效邊角清潔&amp;quot;認證

    3月15日,在2024中國家電及消費電子博覽會(AWE)上,國際獨立第三方檢測、檢驗和認證機構(gòu)德國萊茵TüV大中華區(qū)(簡稱&quot;TüV萊茵&quot;)為科沃斯兩款掃地機器人(型號:DDX14、DDX11)
    的頭像 發(fā)表于 03-17 10:49 ?926次閱讀

    Quanterix宣布Tau217血液檢測被美國FDA授予 &amp;quot;突破性器械 &amp;quot;認證

    3月4日,Quanterix宣布其Simoa磷酸化Tau217(p-Tau 217)血液檢測已被美國FDA授予 &quot;突破性器械 &quot;認證,可用于阿爾茨海默病 (AD) 的輔助診斷評估。
    的頭像 發(fā)表于 03-12 17:23 ?2406次閱讀

    電池&amp;quot;無&amp;quot;隔膜?SEI新&amp;quot;膜&amp;quot;法!

    枝晶是阻礙鋅基水系電池發(fā)展的一個亟待解決的問題。電沉積過程主要包含離子遷移、電還原和電結(jié)晶三個步驟。
    的頭像 發(fā)表于 03-11 10:03 ?1081次閱讀
    電池&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;無&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;隔膜?SEI新&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;膜&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;法!

    中創(chuàng)新航榮獲逸動科技2023年度&amp;quot;優(yōu)秀戰(zhàn)略合作伙伴獎&amp;quot;

    近日,中創(chuàng)新航憑借電動船舶領(lǐng)域領(lǐng)先的技術(shù)實力、卓越的產(chǎn)品質(zhì)量、持續(xù)穩(wěn)定的交付能力以及優(yōu)質(zhì)高效的服務,榮獲逸動科技2023年度&quot;優(yōu)秀戰(zhàn)略合作伙伴獎&quot;。
    的頭像 發(fā)表于 02-29 13:51 ?545次閱讀

    愛立信推出&amp;quot;業(yè)務編排與保障&amp;quot;產(chǎn)品助力運營商不斷創(chuàng)新

    近日,愛立信推出新的服務編排與保障產(chǎn)品、解決方案與服務功能,旨在幫助全球運營商大規(guī)模利用5G與5G獨立組網(wǎng)(SA)帶來的日益多樣化與大量高影響例機會。
    的頭像 發(fā)表于 02-27 14:59 ?6755次閱讀
    大发888官方sscptdf88yb| 大发888如何下载| 百家乐官网西园二手房| 大发888倾家荡产| 百家乐娱乐城提款| 百家乐官网游戏软件出售| 大发888官方我的爱好| 百家乐赌博平台| 澳门赌百家乐官网的玩法技巧和规则 | 红树林百家乐官网的玩法技巧和规则 | 百家乐官网下注技巧| 百家乐官网娱乐皇冠世界杯| bet365娱乐平台| 百家乐平客户端| 百家乐筹码桌布| 百家乐金币游戏| 澳门百家乐官网网上赌博| 百家乐官网视频世界| 万山特区| 网上百家乐哪里好| 百家乐官网游戏介绍与分析| 体球网比分| 大发888怎么玩能赢| 百家乐电子路单谁| 百家乐斗地主在哪玩| 百家乐官网龙虎台布| 宜良县| 万豪国际娱乐| 六合彩开奖结果| 免费百家乐的玩法技巧和规则| 百家乐使用技法| 百家乐官网真人游戏娱乐| 百家乐官网讯特| 超级百家乐官网2龙虎斗| 百家乐官网有方式赢钱吗| 百家乐官网技巧在那里| 百家乐官网实时路单| 百家乐官网免费体验金| 一筒百家乐官网的玩法技巧和规则 | 威尼斯人娱乐城003| 博彩百家乐的玩法技巧和规则|