×
img

复旦大学(张奇):2024年大语言模型的能力边界与发展思考报告

发布者:wx****3d
2024-11-12
17 MB 101 页
文件列表:
复旦大学:2024年大语言模型的能力边界与发展思考报告.pdf
下载文档
本文主要探讨了大语言模型(LLM)的能力边界和发展思考。首先,文章分析了LLM的训练过程,包括预训练阶段、有监督微调阶段和强化学习阶段,以及每个阶段的功能。其次,文章讨论了LLM在知识获取、表示学习和任务能力方面的表现,并提出了如何评价预训练模型的优劣、高质量SFT训练数据的特征等关键问题。此外,文章还探讨了强化学习在特定任务中的应用,以及如何稳定高效地完成RLHF训练。最后,文章对LLM的推理能力进行了评估,并提出了大模型未来发展的两个路径:AGI和应用。

加载中...

本文档仅能预览20页

继续阅读请下载文档

网友评论>

开通智库会员享超值特权
专享文档
免费下载
免广告
更多特权
立即开通

发布机构

更多>>