×
img

天风证券:通信行业专题研究:OpenAIo1占领后训练扩展律前沿,从快速识别走向深度思考

发布者:wx****27
2024-09-24
1 MB 9 页
电信 天风证券
文件列表:
天风证券:通信行业专题研究:OpenAIo1占领后训练扩展律前沿,从快速识别走向深度思考.pdf
下载文档
o1模型通过强化学习训练和产生思维链,能在做出响应前花更多时间思考问题 9月12日,OpenAI发布一系列新大语言模型o1,经过强化学习(ReinforcementLearning)训练,可以执行复杂推理,该模型可以产生一个长程思维链(ChainofThought),在做出响应前花更多时间思考问题。 新模型包括o1-preview和o1-mini两种版本,其中o1-mini更快、更具成本效益,适用于需要推理但不需要广泛知识的应用程序 o1-mini是一个较小的模型,针对预训练期间的STEM推理进行了优化。速度方面,在单词推理问题回答中o1-mini找到答案的速度比o1-preview大约快了3~5倍;成本方面,OpenAI向第五梯队API用户开放的o1-mini成本端比o1-preview便宜80%。 o1通用性不及GPT-4o,高推理能力伴随高成本 作为早期模型,o1并不具备浏览网页、上传文件和图像等功能,通用性尚不及GPT-4o。但相较于GPT-4o多模态、反应快等特点,o1-preview更加注重推理能力,输入、输出tokens成本分别是GPT-4o的3、4倍。 o1在数理化复杂

加载中...

已阅读到文档的结尾了

下载文档

网友评论>