国联证券：计算机：Meta发布开源大模型Llama3.1，开源模型能力进一步提升

发布者：wx****31

2024-07-28

929 KB 5 页

互联网国联证券

文件列表：

国联证券：计算机：Meta发布开源大模型Llama3.1，开源模型能力进一步提升.pdf

下载文档

资源简介

行业事件 Meta发布开源大模型Llama3.1，此模型包含405B、70B、8B三个版本。该模型在多项基准测试中超越GPT-4o和Claude3.5Sonnet，开源模型的能力或已追赶上闭源SOTA模型。模型能力进一步提升，开源使用权重与代码 Meta外发的开源大模型Llama3.1最高版本参数量达到4050亿，该版本性能与最好的闭源模型性能接近。Llama3.1开源/免费使用权重和代码，并允许进行模型微调、蒸馏到其他模型以及在任何地点部署。模型提供128k上下文窗口，在多语言处理、优秀的代码生成、复杂问题理解推理能力上大幅提升，并包含模型工具使用。LlamaStackAPI可以轻松集成。整个生态系统包含25个合作伙伴，其中包括亚马逊、英伟达、Databricks、Groq、微软云和谷歌云。强算力叠加Transformer架构，开发高质量开源模型 Meta在Llama3.1的报告中指出：数据、规模和复杂性管理是开发高质量模型的关键因素。数据上，改进了用于前训练和后训练的数据的数量和质量；规模上，模型在预训练时使用浮点运算规模几乎为最大版本Llama2的50倍，在15.6T文本上预

加载中...

已阅读到文档的结尾了

下载文档