那曲檬骨新材料有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Stability AI開源圖像生成模型Stable Diffusion

倩倩 ? 來源:AI前線 ? 作者:Anthony Alford ? 2022-09-21 15:37 ? 次閱讀

Stability AI 對外發布了 Stable Diffusion 的預訓練模型權重,這是一個文本至圖像的 AI 模型。根據文本提示,Stable Diffusion 能夠生成逼真的 512x512 像素的圖像以描述提示中的場景。

在模型權重公開發布之前,它的代碼已經發布,模型權重也有限發布給了研究社區。在最新的版本中,任何用戶都可以在消費者級別的硬件中下載并運行 Stable Diffusion。除了文本至圖像的生成,該模型還支持圖像至圖像的風格轉換以及圖像質量提升。在發布該版本的同時,Stable AI 還發布了 beta 版本的 API 以及模型的 Web UI,名為 DreamStudio。Stable AI 這樣說到:

Stable Diffusion 是一個文本至圖像的模型,它能讓數十億人在幾秒鐘內創建出令人贊嘆的藝術品。在速度和質量方面,它都有所突破,這意味著它能在消費者級別的 GPU 上運行……這能夠讓研究人員和……公眾在各種條件下運行,使圖像生成技術走向大眾。我們期待圍繞該模型和其他模型出現一個開放的生態系統,以探索潛在空間的邊界。

Stable Diffusion 基于名為潛在擴散模型(latent diffusion models,LDMs)的圖像生成技術。與其他的流行的圖像合成方法不同,如生成對抗網絡(generative adversarial networks,GANs)和 DALL-E 使用的自動回歸技術,LDMs 通過在一個潛在表示空間中迭代“去噪”數據來生成圖像,然后將表示結果解碼為完整的圖像。LDM 是由 Ludwig Maximilian University of Munich 的機器視覺與學習(Machine Vision and Learning)研究組開發的,并在最近的 IEEE / CVF 計算機視覺和模式識別會議(Computer Vision and Pattern Recognition Conference)上發表的一篇論文中進行了闡述。在今年早些時候,InfoQ 曾經報道過谷歌的 Imagen 模型,它是另一個基于擴散的圖像生成 AI。

Stable Diffusion 模型支持多種操作。與 DALL-E 類似,它能夠根據所需圖像的文本描述,生成符合匹配該描述的高質量圖像。它還可以根據一個簡單的草圖再加上所需圖像的文本描述,生成一個看起來更逼真的圖像。Meta AI 最近發布了名為 Make-A-Scene 的模型,具有類似的圖像至圖像的功能。

Stable Diffusion 的很多用戶已經公開發布了生成圖像的樣例,Stability AI 的首席開發者 Katherine Crowson 在推特上分享了許多圖像。基于 AI 的圖像合成可能會對藝術家和藝術領域帶來一定的影響,有些評論者對此感到不安。就在 Stable Diffusion 發布的同一周,一幅由 AI 生成的藝術品在科羅拉多州博覽會的藝術比賽中獲得了一等獎。Django 框架的共同創建者 Simon Williamson 認為:

我見過一種說法,認為 AI 藝術沒有資格獲得版權保護,因為“它必須歸功于全人類”——如果基于文本生成的設計尚不足以說服公眾的話,那 [圖像至圖像] 技術可能會打破這種平衡。

Stable AI 的創始人 Emad Mostaque 在推特上回答了一些關于該模型的問題。在回答一位試圖估算訓練模型所需的計算資源和成本的用戶時,Mostaque 說到:

實際上,我們為這個模型使用了 256 個 A100 顯卡,總共 15 萬小時,所以按市場價格計算為 60 萬美元。

Mostaque 給出了 Reddit 上一篇文章的鏈接,其中給出了如何最好地使用該模型來生成圖像的技巧。

Stable Diffusion 的代碼可以在 GitHub 上找到。模型的權重以及 Colab notebook 和示例 Web UI 都可以在 HuggingFace 上找到。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31513

    瀏覽量

    270330
  • 模型
    +關注

    關注

    1

    文章

    3305

    瀏覽量

    49220
  • 圖像生成
    +關注

    關注

    0

    文章

    22

    瀏覽量

    6903

原文標題:Stability AI 開源圖像生成模型 Stable Diffusion

文章出處:【微信號:AI前線,微信公眾號:AI前線】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    借助谷歌Gemini和Imagen模型生成高質量圖像

    在快速發展的生成AI 領域,結合不同模型的優勢可以帶來顯著的成果。通過利用谷歌的 Gemini 模型來制作詳細且富有創意的提示,然后使用 Imagen 3
    的頭像 發表于 01-03 10:38 ?403次閱讀
    借助谷歌Gemini和Imagen<b class='flag-5'>模型</b><b class='flag-5'>生成</b>高質量<b class='flag-5'>圖像</b>

    Google兩款先進生成AI模型登陸Vertex AI平臺

    新的 AI 模型,包括最先進的視頻生成模型Veo以及最高品質的圖像生成
    的頭像 發表于 12-30 09:56 ?143次閱讀

    開源AI模型庫是干嘛的

    開源AI模型庫是指那些公開源代碼、允許自由訪問和使用的AI模型集合。這些
    的頭像 發表于 12-14 10:33 ?294次閱讀

    如何開啟Stable Diffusion WebUI模型推理部署

    如何開啟Stable Diffusion WebUI模型推理部署
    的頭像 發表于 12-11 20:13 ?168次閱讀
    如何開啟<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b> WebUI<b class='flag-5'>模型</b>推理部署

    Freepik攜手Magnific AI推出AI圖像生成

    近日,設計資源巨頭Freepik攜手Magnific AI,共同推出了革命性的AI圖像生成器——Freepik Mystic,這一里程碑式的發布標志著
    的頭像 發表于 08-30 16:23 ?1208次閱讀

    Meta發布Imagine Yourself AI模型,重塑個性化圖像生成未來

    Meta公司近日在人工智能領域邁出了重要一步,隆重推出了其創新之作——“Imagine Yourself”AI模型,這一突破性技術為個性化圖像生成領域帶來了前所未有的變革。在社交媒體與
    的頭像 發表于 08-26 10:59 ?636次閱讀

    實操: 如何在AirBox上跑Stable Diffusion 3

    使用StableDiffusion3Medium開源模型,通過SOPHONSDK移植到SG2300X處理器系列產品上進行本地TPU硬件加速推理,實現在radxaAirbox上離線快速生成
    的頭像 發表于 07-23 08:34 ?320次閱讀
    實操: 如何在AirBox上跑<b class='flag-5'>Stable</b> <b class='flag-5'>Diffusion</b> 3

    如何用C++創建簡單的生成AI模型

    生成AI(Generative AI)是一種人工智能技術,它通過機器學習模型和深度學習技術,從大量歷史數據中學習對象的特征和規律,從而能夠生成
    的頭像 發表于 07-05 17:53 ?1044次閱讀

    [技術干貨]?AI 助手全套開源解決方案,自帶運營管理后臺,開箱即用

    ,自帶運營管理后臺,開箱即用。集成了 OpenAI, Azure, ChatGLM,訊飛星火,文心一言等多個平臺的大語言模型。集成了 MidJourney 和 Stable Diffusion
    的頭像 發表于 04-05 23:23 ?1337次閱讀
    [技術干貨]?<b class='flag-5'>AI</b> 助手全套<b class='flag-5'>開源</b>解決方案,自帶運營管理后臺,開箱即用

    Stability AI發布Stable Code Instruct 3B大語言模型,可編譯多種編程語言

    據報道,Stability AI公司近期推出了適配程序員使用的Stable Code Instruct 3B大語言模型,此款模型的顯著特點是
    的頭像 發表于 03-27 10:04 ?580次閱讀

    UL Procyon AI 發布圖像生成基準測試,基于Stable Diffusion

    UL去年發布的首個Windows版Procyon AI推理基準測試,以計算機視覺工作負載評估AI推理性能。新推出的圖像生成測試將提供統一、精確且易于理解的工作負載,用以保證各支持硬件間
    的頭像 發表于 03-25 16:16 ?959次閱讀

    Stability AI推出全新Stable Video 3D模型

    近日,Stability AI 推出了全新的 Stable Video 3D 模型,該模型以其獨特的功能吸引了眾多關注。此
    的頭像 發表于 03-22 10:30 ?936次閱讀

    韓國科研團隊發布新型AI圖像生成模型KOALA,大幅優化硬件需求

    由此模型的核心在于其運用了“知識蒸餾”(knowledge distillation)技術,這使得開源圖像生成工具Stable
    的頭像 發表于 03-01 14:10 ?696次閱讀

    OpenAI視頻模型Sora的架構及應用場景

    LDM 就是 Stable Diffusion 使用的模型架構。擴散模型的一大問題是計算需求大,難以擬合高分辨率圖像。為了解決這一問題,實現
    發表于 02-20 15:13 ?699次閱讀
    OpenAI視頻<b class='flag-5'>模型</b>Sora的架構及應用場景

    Stability AI試圖通過新的圖像生成人工智能模型保持領先地位

    Stability AI的最新圖像生成模型Stable Cascade承諾比其業界領先的前身
    的頭像 發表于 02-19 16:03 ?995次閱讀
    <b class='flag-5'>Stability</b> <b class='flag-5'>AI</b>試圖通過新的<b class='flag-5'>圖像</b><b class='flag-5'>生成</b>人工智能<b class='flag-5'>模型</b>保持領先地位
    百家乐官网连锁| 新彩百家乐的玩法技巧和规则 | 百家乐牌桌订做| 鄯善县| 24山风水水口| 娱乐城开户彩金| 逍遥坊百家乐官网的玩法技巧和规则| 大发888英皇国际| 玩百家乐官网犯法| 太阳城现金| 天峨县| 皇室百家乐官网的玩法技巧和规则 | 喜来登百家乐官网的玩法技巧和规则| 大发888赢钱| 澳门赌百家乐官网的玩法技巧和规则| 大发888游戏 平台| 玩百家乐官网掉房| 千亿娱乐城注册| 择日自学24| 永利高足球博彩网| 百家乐开户优惠多的平台是哪家 | 乐百家乐彩娱乐城| 百家乐官网怎打能赢| 百家乐职业赌徒的解密| 百家乐官网真人投注网站| 百家乐赌博平台| 太阳城百家乐官网杀猪吗| 全讯网开奖直播| 网上百家乐官网赌| 绵竹市| 百家乐骰盅规则| 百家乐官网游戏网上投注 | 美女百家乐官网的玩法技巧和规则 | 百家乐招商用语| 百家乐官网赢得秘诀| 汇丰百家乐娱乐城| 好望角百家乐官网的玩法技巧和规则 | 百家乐哪条路准| 线上百家乐官网信誉| 威尼斯人娱乐场cqsscgw88| 百家乐官网筹码方形筹码|