最新亚洲人成无码网站,夜夜操夜夜操夜夜爽,中文字日产幕乱五区,在线成人看片黄a免费看,亚洲自偷自拍另类11p

首頁 >> 今日更新 >

NVIDIA 自動引導技術(shù):改善擴散模型中的圖像質(zhì)量和變化

2024-06-07 15:00:25 來源: 用戶: 

相信很多大家對NVIDIA 自動引導技術(shù):改善擴散模型中的圖像質(zhì)量和變化還不知道吧,今天菲菲就帶你們一起去了解一下~.~!

站長之家(ChinaZ.com)6月7日 消息:NVIDIA 近期提出了一種名為自動引導的新方法,旨在改善擴散模型中圖像的質(zhì)量和變化,而不影響其與給定條件(如類標簽或文本提示)的一致性。當前的方法通常會以犧牲多樣性為代價來提高圖像質(zhì)量,從而限制了它們在醫(yī)學診斷和自動駕駛等各種現(xiàn)實場景中的適用性。然而,克服這一挑戰(zhàn)可以提升人工智能系統(tǒng)在生成逼真且多樣化圖像方面的性能,推動當前人工智能能力的邊界。

目前解決這一挑戰(zhàn)的方法主要是使用無分類器引導(CFG),它使用無條件模型來引導有條件模型。雖然 CFG 改善了提示對齊和圖像質(zhì)量,但降低了圖像變化。這種權(quán)衡發(fā)生在圖像質(zhì)量和變化的影響在本質(zhì)上是糾纏在一起的,難以獨立控制它們。此外,CFG 局限于有條件生成,并存在任務(wù)差異問題,導致圖像構(gòu)成的偏斜和過于簡化的圖像。這些限制影響了方法的性能,并限制了它在生成多樣化和高質(zhì)量圖像方面的應(yīng)用。

NVIDIA 的研究人員提出了一種名為自動引導的新方法,它涉及使用主模型的規(guī)模較小、訓練時間較短的版本來引導生成過程,而不是使用無條件模型。這種方法通過將圖像質(zhì)量與變化解耦,從而更好地控制這些方面,同時保持與主模型相同的條件,確保生成圖像的一致性。這種創(chuàng)新方法顯著提高了圖像生成的質(zhì)量和變化,在 ImageNet-512和 ImageNet-64等基準測試中刷新了記錄,可以應(yīng)用于有條件和無條件模型。

該方法的核心是訓練主模型的規(guī)模較小、訓練時間較短的引導模型。論文詳細介紹了去噪擴散過程,通過反轉(zhuǎn)隨機損壞過程生成合成圖像。研究人員使用 Fréchet Inception Distance(FID)和 FDDINOv2等指標對模型進行評估,結(jié)果顯示圖像生成質(zhì)量有了顯著提高。例如,在 ImageNet-512中使用小模型(EDM2-S),自動引導將 FID 從2.56提高到1.34,超越了現(xiàn)有方法。

廣泛的定量結(jié)果證明了自動引導的有效性。該方法在公開可用的網(wǎng)絡(luò)上實現(xiàn)了64×64和512×512圖像分辨率的 FID 記錄,表明圖像質(zhì)量有了顯著提升,而沒有犧牲多樣性。評估包括比較不同方法的表格,展示了自動引導在 CFG 和其他基線方法上的優(yōu)越性能。例如,該方法在 ImageNet 數(shù)據(jù)集上實現(xiàn)了87.5% 的準確率,超過了先前的最先進水平。

這種改進擴散模型中圖像質(zhì)量的新方法涉及使用模型的規(guī)模較小、訓練時間較短的引導模型。所提出的自動引導方法克服了像 CFG 這樣的現(xiàn)有方法的局限性。這種創(chuàng)新方法在基準測試中取得了最先進的成績,顯著推進了人工智能研究領(lǐng)域,為生成高質(zhì)量和多樣化圖像提供了更高效、更有效的解決方案。

以上就是關(guān)于【NVIDIA 自動引導技術(shù):改善擴散模型中的圖像質(zhì)量和變化】的相關(guān)內(nèi)容,希望對大家有幫助!

  免責聲明:本文由用戶上傳,與本網(wǎng)站立場無關(guān)。財經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風險自擔。 如有侵權(quán)請聯(lián)系刪除!

 
分享:
最新文章
  • 【空谷幽蘭是什么意思】“空谷幽蘭”是一個富有詩意的成語,常用來形容在偏僻、冷清的地方生長的蘭花。它不僅...瀏覽全文>>
  • 【空格怎么打出來】在日常使用電腦或手機輸入文字時,經(jīng)常會遇到需要輸入“空格”的情況。雖然看似簡單,但很...瀏覽全文>>
  • 【空格怎么打】在日常使用電腦或手機時,很多人會遇到“空格怎么打”的問題。其實,“空格”是一個非?;A(chǔ)的...瀏覽全文>>
  • 【空格名字怎么打】在日常使用電腦或手機時,很多人會遇到“空格名字怎么打”的問題。尤其是在輸入法設(shè)置、文...瀏覽全文>>
  • 【空格鍵是指的哪一個】在日常使用電腦或手機的過程中,我們經(jīng)常接觸到各種按鍵,其中“空格鍵”是一個非?;?..瀏覽全文>>
  • 【空擋是什么意思】“空擋”是一個在多個領(lǐng)域中常見的術(shù)語,尤其在汽車駕駛、機械操作以及一些比喻性表達中使...瀏覽全文>>
  • 【空城舊夢是情侶網(wǎng)名嗎】“空城舊夢”這個詞語,聽起來充滿了詩意和情感色彩。它常被用于表達一種孤獨、懷念...瀏覽全文>>
  • 【可吸收線是什么顏色】在醫(yī)學領(lǐng)域,尤其是外科手術(shù)中,可吸收線是一種常見的縫合材料。它主要用于縫合傷口,...瀏覽全文>>
  • 【可為是什么意思】“可為”一詞源自中文,常用于表達“可以做”、“值得做”或“有作為”的含義。在不同語境...瀏覽全文>>
  • 【可微與可導之間有什么聯(lián)系】在微積分的學習過程中,“可導”和“可微”是兩個經(jīng)常被提到的概念,它們看似相...瀏覽全文>>