×
img

中国银河:计算机行业:商汤日日新5.0对标GPT-4Turbo,打造“云、边、端”全栈大模型矩阵

发布者:wx****3d
2024-04-25
298 KB 3 页
互联网 中国银河
文件列表:
中国银河:计算机行业:商汤日日新5.0对标GPT-4Turbo,打造“云、边、端”全栈大模型矩阵.pdf
下载文档
核心观点: 事件:4月23日,商汤科技SenseTime在上海、深圳等多地举报技术交流日活动,发布行业首个“云、边、端”全栈大模型产品矩阵,并全新升级“日日新SenseNova5.0”(以下简称“日日新5.0”)大模型体系。 “日日新SenseNova”大模型体系加速迭代,综合能力全面对标GPT-4Turbo。去年4月商汤首次公布“日日新SenseNova”大模型体系,以及自研的中文语言大模型应用平台“商量”,截止目前已经升级迭代到第五个版本。今年2月发布的“日日新4.0”参数在百亿量级,最高支持上下文本长度128K(约12万以上中文字),本次发布的“日日新5.0”,模型采用MoE(混合专家架构),基于超过10TBtokens中英文训练、覆盖大量合成数据集,模型参数量在6000亿左右,推理时上下文窗口长度超过GPT-4Turbo(支持128K上下文),可以有效达到200K左右,同时拥有端侧扩散和语言模型,在知识、推理、数学、代码等综合能力全面对标GPT-4Turbo。 文理双修能力大幅提升,多模态能力测试排名榜首。“日日新5.0”主要聚集增强了知识、数学、推理及代码能力,全面对标GPT

加载中...

已阅读到文档的结尾了

下载文档

网友评论>