×
img

上海证券:互联网传媒行业周报:字节、阿里推出图生视频AI生成器,谷歌上线多模态AI模型Gemini1.0

发布者:wx****b1
2023-12-12
363 KB 3 页
影视 上海证券
文件列表:
上海证券:互联网传媒行业周报:字节、阿里推出图生视频AI生成器,谷歌上线多模态AI模型Gemini1.0.pdf
下载文档
11月27日和28日,字节和阿里相继发布了图生视频项目相关论文,阿里推出了AnimateAnyone,新加坡国立大学和字节跳动则联合推出了MagicAnimate。AnimateAnyone由阿里巴巴智能计算研究院开发,通过优化的扩散模型让静态任务生成动态视频,创作者只需提供静态的角色图像(包括真人、动漫/卡通角色等)和一些动作、姿势(比如跳舞、走路)即可将其动画化,同时保留角色的细节特征(如面部表情、服装细节等)。MagicAnimate是新加坡国立大学和字节跳动联合推出的“人体图像动画生成器”,能够把指定的人物图片按照既定动作序列生成视频。在TikTok舞蹈数据集上,MagicAnimate生成的视频的真实度比最强基线提高了超过38%,用户只需三步即可使用:1)上传一张静态人物照片;2)上传想要生成的动作demo视频;3)调整参数,点击“Animate”。字节和阿里的两个图生视频均通过扩散模型创造时间连贯的人像动画,训练数据大多相同。12月5日,南洋理工大学联合清华和商汤提出的GaussianEditor算法成功解决了3D编辑领域长时间和低可控性的问题,通过采用高斯溅射表示,引入高

加载中...

已阅读到文档的结尾了

下载文档

网友评论>