文件列表:
开源证券:传媒行业周报:AI视频生成模型持续开源,关注游戏、综艺上新行业周报.pdf |
下载文档 |
资源简介
>
AI视频生成模型工具继续开源,积极布局多模态AI
5月9日,腾讯正式推出基于混元视频生成大模型打造的全新开源多模态定制化视频生成工具HunyuanCustom,其融合了文本、图像、音频、视频等多模态输入,能实现单、多主体视频生成及单主体视频配音、视频局部编辑等能力。此前大部分视频生成模型主要能实现文、图生视频,其中文生视频每次均需根据文本提示词重新生成,难以持续保持人物和场景的一致性,而图像生成视频模型主要实现“让图片动起来”,HunyuanCustom则通过引入身份增强机制和多模态融合模块,真正实现“图像提供身份,文本定义一切”,生成的视频在可控性、一致性、质量方面表现突出,用户只需上传一张或多张包含目标人物或物体的图片,并提供文本描述,便能识别出图片中的身份信息,并在完全不同的动作、服饰与场景中生成连贯自然的视频内容,此外还具备强大的音视频扩展能力,可满足视频创作者、短视频博主、电商从业者、广告创意人等不同用户和场景的需求,或在AI创作、电商、广告、游戏、教育领域得到广泛运用。此外,5月7日,海外公司Lightricks亦发布了开源视频生成模型LTXV-Video-13B,在多尺度
加载中...
已阅读到文档的结尾了