天风证券：通信行业专题研究：OpenAIo1占领后训练扩展律前沿，从快速识别走向深度思考

发布者：wx****27

2024-09-24

1 MB 9 页

电信天风证券

文件列表：

天风证券：通信行业专题研究：OpenAIo1占领后训练扩展律前沿，从快速识别走向深度思考.pdf

下载文档

资源简介

o1模型通过强化学习训练和产生思维链，能在做出响应前花更多时间思考问题 9月12日，OpenAI发布一系列新大语言模型o1，经过强化学习（ReinforcementLearning）训练，可以执行复杂推理，该模型可以产生一个长程思维链（ChainofThought），在做出响应前花更多时间思考问题。新模型包括o1-preview和o1-mini两种版本，其中o1-mini更快、更具成本效益，适用于需要推理但不需要广泛知识的应用程序 o1-mini是一个较小的模型，针对预训练期间的STEM推理进行了优化。速度方面，在单词推理问题回答中o1-mini找到答案的速度比o1-preview大约快了3~5倍；成本方面，OpenAI向第五梯队API用户开放的o1-mini成本端比o1-preview便宜80%。 o1通用性不及GPT-4o，高推理能力伴随高成本作为早期模型，o1并不具备浏览网页、上传文件和图像等功能，通用性尚不及GPT-4o。但相较于GPT-4o多模态、反应快等特点，o1-preview更加注重推理能力，输入、输出tokens成本分别是GPT-4o的3、4倍。 o1在数理化复杂

加载中...

已阅读到文档的结尾了

下载文档