快訊 >

        GAN卷土重來(lái):10億參數(shù)的GigaGAN效果堪比擴(kuò)散模型

        時(shí)間:2023-06-19 10:43:04       來(lái)源:程序員客棧


        (資料圖片僅供參考)

        點(diǎn)藍(lán)色字關(guān)注“機(jī)器學(xué)習(xí)算法工程師”

        設(shè)為星標(biāo),干貨直達(dá)!

        自從 DALL·E 2 之后,在圖像生成方面擴(kuò)散模型替代GAN成了主流方向,比如開(kāi)源的文生圖模型stable diffusion也是基于diffusion架構(gòu)的。近日, Adobe研究者在論文Scaling up GANs for Text-to-Image Synthesis提出了參數(shù)量為10億(1B)的GAN模型:GigaGAN,其在文生圖效果上接近擴(kuò)散模型效果,而且推理速度更快,生成512x512大小圖像只需要0.13s,生成16M像素圖像只需要 3.66s。同時(shí)GigaGAN也支持latent空間的編輯功能,比如latent插值,風(fēng)格混合,以及向量運(yùn)算等。

        GigaGAN改進(jìn)了StyleGAN架構(gòu),采用兩階段訓(xùn)練策略:一個(gè)是64x64的圖像生成器和一個(gè)512x512的圖像超分2器,其圖像生成器架構(gòu)如下所示(這里也是采用CLIP text encoder來(lái)引入text condition):GigaGAN在 LAION2B-en和 COYO-700M數(shù)據(jù)集上訓(xùn)練,其在COCO數(shù)據(jù)集上的FID達(dá)到9.09,超過(guò)stable diffusion 1.5,推理速度比stable diffusion快20倍多(2.9s vs 0.13s):GigaGAN除了文生圖能力,還可以實(shí)現(xiàn)可控的合成,比如風(fēng)格混合,如下圖所示:更多效果圖和技術(shù)細(xì)節(jié)見(jiàn)論文https://arxiv.org/abs/2303.05511和網(wǎng)站https://mingukkang.github.io/GigaGAN/

        關(guān)鍵詞:

        首頁(yè)
        頻道
        底部
        頂部
        亚洲爆乳成av人在线视菜奈实| 亚洲成熟xxxxx电影| 亚洲午夜在线电影| 亚洲美女在线观看播放| 亚洲AV综合色区无码一区爱AV| 亚洲国产中文v高清在线观看| 亚洲国产精品13p| 精品韩国亚洲av无码不卡区| 色噜噜综合亚洲av中文无码| 国产亚洲无线码一区二区 | 亚洲白色白色永久观看| 亚洲一区二区三区日本久久九| 亚洲av日韩av不卡在线观看| 亚洲AV无码一区二区乱子伦| 亚洲AV日韩AV永久无码绿巨人 | 亚洲精品456人成在线| 国产精品亚洲四区在线观看| 亚洲综合伊人制服丝袜美腿| 99久久婷婷国产综合亚洲| 香蕉大伊亚洲人在线观看| 亚洲私人无码综合久久网| 亚洲一本到无码av中文字幕| 久久久久久亚洲av无码蜜芽| 天堂亚洲免费视频| 亚洲AV综合色区无码二区偷拍 | 亚洲成年人免费网站| 亚洲av成人综合网| 亚洲自偷自偷在线成人网站传媒| 亚洲色大成网站www永久网站| 亚洲国产精品成人午夜在线观看| 亚洲成人网在线观看| 亚洲综合久久一本伊伊区| 中文字幕在线观看亚洲日韩| 亚洲AV无码国产剧情| 亚洲国产成人久久综合区| 伊人婷婷综合缴情亚洲五月| 久久久久久a亚洲欧洲aⅴ| 久久久婷婷五月亚洲97号色| 亚洲人成影院午夜网站| 亚洲精品国产精品| 亚洲精品和日本精品|