文件列表:
开源证券:计算机行业点评报告:通义千问开源千亿模型,中文大模型生态加速发展.pdf |
下载文档 |
资源简介
>
事件:阿里云发布通义千问2.5并开源千亿参数大模型
(1)2024年5月9日,阿里云正式发布通义千问2.5。相比上一版本,2.5版模型的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。在中文语境下,文本理解、文本生成、知识问答&生活建议、闲聊&对话、安全风险等多项能力赶超GPT-4。
(2)2024年4月28日,阿里通义千问团队开源千亿级参数模型Qwen1.5-110B,是Qwen1.5系列中规模最大的模型,支持32Ktokens的上下文长度,支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。
通义千问坚持开源路线,110B参数版本对标Meta-Llama-3-70B
通义千问于2023年4月正式发布,于2023年8月开源。通义千问坚持“全模态、全尺寸”的开源路线,陆续推出十多款开源模型,包括0.5B至110B的八款大语言模型,以及视觉理解模型Qwen-VL、音频理解模型Qwen-Audio、代码模型CodeQwen1.5-7B、混合专家模型Qwen1.5-MoE。大语言模型方面,小尺寸模型(0.5B、1.8B、4B、7B、14B参数)支持在手机、PC等
加载中...
已阅读到文档的结尾了