文件列表:
中国银河:计算机行业:商汤日日新5.0对标GPT-4Turbo,打造“云、边、端”全栈大模型矩阵.pdf |
下载文档 |
资源简介
>
核心观点:
事件:4月23日,商汤科技SenseTime在上海、深圳等多地举报技术交流日活动,发布行业首个“云、边、端”全栈大模型产品矩阵,并全新升级“日日新SenseNova5.0”(以下简称“日日新5.0”)大模型体系。
“日日新SenseNova”大模型体系加速迭代,综合能力全面对标GPT-4Turbo。去年4月商汤首次公布“日日新SenseNova”大模型体系,以及自研的中文语言大模型应用平台“商量”,截止目前已经升级迭代到第五个版本。今年2月发布的“日日新4.0”参数在百亿量级,最高支持上下文本长度128K(约12万以上中文字),本次发布的“日日新5.0”,模型采用MoE(混合专家架构),基于超过10TBtokens中英文训练、覆盖大量合成数据集,模型参数量在6000亿左右,推理时上下文窗口长度超过GPT-4Turbo(支持128K上下文),可以有效达到200K左右,同时拥有端侧扩散和语言模型,在知识、推理、数学、代码等综合能力全面对标GPT-4Turbo。
文理双修能力大幅提升,多模态能力测试排名榜首。“日日新5.0”主要聚集增强了知识、数学、推理及代码能力,全面对标GPT
加载中...
已阅读到文档的结尾了