文件列表:
上海证券:互联网传媒行业周报-周观点:商汤发布国内首个流式多模态交互模型,可灵网页端上线.pdf |
下载文档 |
资源简介
>
主要观点
商汤发布国内首个流式原生多模态交互模型——6000亿参数日日新5.5系列中的5o,这是一种全新的AI交互模式,把文本、声音、图像还有视频等模态全都囊括到了一起,可以让AI跟人们交流的时候变得更加生动丰富。商汤用新AI“复活”了图灵、冯诺依曼等人物,新AI名叫Vimi,是基于日日新5.5能力打造的首个可控人物视频生成大模型,能够精确地控制人物的面部表情,还能在半身像的范围内调节人物的自然姿态。
快手可灵是全球首个用户可用的真实影像级视频生成大模型,发布一个月以来超50万人申请,已开放给超30万用户使用,生成超700万条短视频。可灵网页端上线,文生图模型重磅开源。可灵生成的视频不仅质量高,而且更符合物理规律,大幅度的运动也能准确刻画,之后可灵又新上线了图生视频和视频续写两项功能,其中图生视频功能,拥有很强的逼近世界运行规律的能力。这次的WAIC上,可灵再次更新,1)基础模型的升级方面,可灵生成的视频,画质得到了进一步提升。2)功能方面,可灵新增了首尾帧控制(图生视频)和镜头控制(暂只支持文生视频),只需上传首尾两张图片,可灵就能自动“脑补”出中间的运动变化过程。3)快手发布可灵W
加载中...
已阅读到文档的结尾了