GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型|世界播资讯

程序员客栈 2023-04-21 07:48:59


【资料图】

点蓝色字关注“机器学习算法工程师”

设为星标,干货直达!

自从 DALL·E 2 之后,在图像生成方面扩散模型替代GAN成了主流方向,比如开源的文生图模型stable diffusion也是基于diffusion架构的。近日, Adobe研究者在论文Scaling up GANs for Text-to-Image Synthesis提出了参数量为10亿(1B)的GAN模型:GigaGAN,其在文生图效果上接近扩散模型效果,而且推理速度更快,生成512x512大小图像只需要0.13s,生成16M像素图像只需要 3.66s。同时GigaGAN也支持latent空间的编辑功能,比如latent插值,风格混合,以及向量运算等。

GigaGAN改进了StyleGAN架构,采用两阶段训练策略:一个是64x64的图像生成器和一个512x512的图像超分2器,其图像生成器架构如下所示(这里也是采用CLIP text encoder来引入text condition):GigaGAN在 LAION2B-en和 COYO-700M数据集上训练,其在COCO数据集上的FID达到9.09,超过stable diffusion 1.5,推理速度比stable diffusion快20倍多(2.9s vs 0.13s):GigaGAN除了文生图能力,还可以实现可控的合成,比如风格混合,如下图所示:更多效果图和技术细节见论文https://arxiv.org/abs/2303.05511和网站https://mingukkang.github.io/GigaGAN/
x

热门推荐

理文造纸(2314.HK)上半年纯利按年跌57% 每吨净利润达到292港元

2022-08

啤酒行业高端化发展趋势凸显 力推中高端产品

2022-07

疫情后营业额翻四倍 多家小店迎来复苏

2022-05

强化优环境“软实力 赣州经开区助力企业走好绿色发展之路

2022-05

又有一家公司追锂 索通发展进军锂电材料领域胜算几

2022-05

海南推动农贸市场全面落实禁塑 加强违禁塑料制品源头治理

2021-12

柴犬登登拍卖记:动物是如何被司法拍卖的

2021-12

江西:到2025年鄱阳湖区断面水质优良比例达到50%以上

2021-12

西藏森林消防:锻造雪域救援尖兵 打造高海拔山岳救援队伍

2021-12

加强人才融通发展 第10届海峡两岸水利青年工程交流营成功举办

2021-12

推荐阅读

GAN卷土重来:10亿参数的GigaGAN效果堪比扩散模型|世界播资讯

2023-04

山东行政区划调整规划博兴划淄博_山东行政区划 世界播资讯

2023-04

「汇添富价值精选」OPEC产量八个月来首降

2023-04

学情调研+行走课堂!淄博这所中学创新考试方式 走心更走“新”

2023-04

环球信息:超稀有「大学 AJ1」再添一员!网友:市售必卖爆!

2023-04

今日快讯:浦发银行不良“三连双降” 利润下滑 未来重点聚焦服务企业和做大财富管理

2023-04

@太原人,通知!山西大严查

2023-04

马斯克威胁起诉微软:称ChatGPT使用推特数据训练

2023-04

这一巨头,又裁员!技术部门首当其冲?!

2023-04

当前播报:杨紫琼将主演《星际迷航》新电影 回归饰演女皇

2023-04