文件列表:
东方证券:AIGC动态跟踪系列点评:AIGC多模态发展,电商落地场景受益.pdf |
下载文档 |
资源简介
>
核心观点事件1:OpenAI于3月14日正式发布GPT-4,其为多模态大模型(接受图像和文本输入,生成文本),同时向开发者开放API结构。事件2:阿里巴巴达摩院于3月21日在modelscope发布一款基于多阶段文本到视频生成扩散模型,其能实现基于文字生成视频。事件2:英伟达CEO黄仁勋于3月22日在GTC2023进行主题演讲,展示最新一代大模型Gen-2,其能实现基于文字生成视频。AIGC多模态发展,从文字逐步向图像及视频升级。1)对于GPT-4,其升级后三大特点为图像识别、高级推理、庞大的单词掌握能力。就图像识别功能来说,GPT-4可以分析图像并提供相关信息,但是图像输入功能还处于尚未公开的预览阶段,就文本输出方面,其更具有创造性和协作性,可以更准确地解决复杂问题。2)从文本向图片与视频升级:2022年谷歌和Meta都展示了各自在文本转视频上的尝试,但均处于研究阶段。近期,阿里达摩院在魔塔社区发布一款模型,可实现基于文字生成视频;英伟达CEO黄仁勋于3月22日在GTC2023的主题演讲中展示大模型Gen-2,其能实现基于文字生成视频。此类大模型的发布,标志着AIGC内容生成能力正逐
加载中...
已阅读到文档的结尾了