×
img

利用频率增广变分自编码器进行图像重建(英文版)

发布者:wx****97
2023-05-06
6 MB 10 页
人工智能(AI)
文件列表:
利用频率增广变分自编码器进行图像重建【英文版】.pdf
下载文档
英文标题:Catch Missing Details: Image Reconstruction with Frequency Augmented Variational Autoencoder中文摘要:本文提出了一种用于增强 VQ-VAE 结构的频率补全模块 (Frequency Complement Module, FCM),并且引入了一种动态频谱损失 (Dynamic Spectrum Loss, DSL),用于引导 FCM 动态地平衡频率以获得最佳重建。FA-VAE 进一步扩展到了文本到图像合成任务中,并提出了交叉注意力自回归变换器 (Cross-attention Autoregressive Transformer, CAT) 以获得更精确的文本语义属性。通过在几个基准数据集上进行广泛的重建实验,并与其它最先进的方法进行比较,结果表明,所提出的 FA-VAE 能够更忠实地恢复细节。CAT 在图像文本语义对齐方面也显示出了更好的生成质量。英文摘要:The popular VQ-VAE models reconstruct images through learning a

加载中...

已阅读到文档的结尾了

下载文档

网友评论>