×
img

华鑫证券:计算机行业点评报告:OpenAIday2更新发布,强化微调计划扩展

发布者:wx****f7
2024-12-24
243 KB 4 页
互联网 华鑫证券
文件列表:
华鑫证券:计算机行业点评报告:OpenAIday2更新发布,强化微调计划扩展.pdf
下载文档
事件 当地时间12月4日,人工智能头部公司OpenAI宣布,从当地时间12月5日开始,将在12天内进行12场发布会直播,期间将展示公司的新产品、新技术和新功能。直播第二日,OpenAI发布了强化微调技术,并邀请机构、学校和企业参与研究计划。 投资要点 强化微调技术发布,内测结果出色 12月7日,在发布会的第二场直播上,OpenAI发布强化微调(ReinforcementFine-Tuning)技术,强化微调是一种模型定制技术,能够帮助开发人员、研究人员及机器工程师利用强化学习创建在特定领域完成任务的专家模型。 微调技术迭代更新,模型自主强化学习。OpenAI在去年年初曾推出过监督微调,即让模型模仿输入的文本或图像的特征,可用于修改模型的语气、样式或响应格式等。最新推出的强化微调则更进一步,不仅可以模仿输入,更是教会模型以新的方式在自定义领域中进行推理,强化正确答案的思维路径,抑制错误答案的思路。具体而言,开发人员可以使用数十到数千个高质量任务来定制模型,并根据提供的参考答案对模型的响应进行评分。这项技术强化了模型如何推理类似问题,并提高其在该领域特定任务上的准确性。 实例测试强化微调,

加载中...

已阅读到文档的结尾了

下载文档

网友评论>