开源证券：传媒行业点评报告：豆包大模型家族再扩容，继续布局AI应用

发布者：wx****c6

2024-12-19

473 KB 3 页

影视开源证券

文件列表：

开源证券：传媒行业点评报告：豆包大模型家族再扩容，继续布局AI应用.pdf

下载文档

资源简介

字节跳动发布豆包视觉理解模型，多场景应用有望落地 12月18日，字节跳动旗下火山引擎于2024FORCE原动力大会发布了豆包视觉理解模型。通过豆包视觉理解模型，用户可以同时输入文本和图像相关的问题。模型能够综合理解并给出准确的回答，大幅简化开发流程。豆包视觉理解模型主要有三大能力：（1）更强的内容识别能力，不仅可以识别出图像中的物体类别、形状等基本要素，还能理解物体之间的关系、空间布局以及场景的整体含义；（2）更强的理解和推理能力，不仅能识别图文信息，还能进行复杂的逻辑计算；（3）更细腻的视觉描述能力，可以基于图像信息，更细腻的描述图像呈现的内容，还能进行多种文体的创作。基于这些能力，豆包视觉理解模型在教育、旅游、电商等场景有着广泛的应用。例如在教育场景中，为学生优化作文、科普知识；在旅游场景中，帮助游客看外文菜单、讲解照片中建筑的背景知识；在电商营销场景中，帮助商家充分描述商品细节，高效发布种草广告等等。此外，豆包视觉理解的输入价格为每千tokens0.003元，比行业平均价格降低85%，有利于企业和开发者利于视觉理解模型，在更广泛的场景创造商业价值。豆包大模型使用量大幅增长，模型

加载中...

已阅读到文档的结尾了

下载文档