文件列表:
国联证券:计算机:Meta发布开源大模型Llama3.1,开源模型能力进一步提升.pdf |
下载文档 |
资源简介
>
行业事件
Meta发布开源大模型Llama3.1,此模型包含405B、70B、8B三个版本。该模型在多项基准测试中超越GPT-4o和Claude3.5Sonnet,开源模型的能力或已追赶上闭源SOTA模型。
模型能力进一步提升,开源使用权重与代码
Meta外发的开源大模型Llama3.1最高版本参数量达到4050亿,该版本性能与最好的闭源模型性能接近。Llama3.1开源/免费使用权重和代码,并允许进行模型微调、蒸馏到其他模型以及在任何地点部署。模型提供128k上下文窗口,在多语言处理、优秀的代码生成、复杂问题理解推理能力上大幅提升,并包含模型工具使用。LlamaStackAPI可以轻松集成。整个生态系统包含25个合作伙伴,其中包括亚马逊、英伟达、Databricks、Groq、微软云和谷歌云。
强算力叠加Transformer架构,开发高质量开源模型
Meta在Llama3.1的报告中指出:数据、规模和复杂性管理是开发高质量模型的关键因素。数据上,改进了用于前训练和后训练的数据的数量和质量;规模上,模型在预训练时使用浮点运算规模几乎为最大版本Llama2的50倍,在15.6T文本上预
加载中...
已阅读到文档的结尾了