文件列表:
国金证券:计算机行业周报:OpenAI发布AIAgentOperator,AI应用落地加速.pdf |
下载文档 |
资源简介
>
本周观点
24日凌晨OpenAI发布AIAgent智能体Operator,通过CUA系统进行复杂的思维链反思和步骤规划,能够在不进行精调的情况下完成泛化任务。在目前的演示中,Operator可进行网购、订餐、论文分类搜索、文献综述等。CUA(Computer-UsingAgent)原理:融合GPT-4o的视觉能力,可通过处理原始像素数据来了解屏幕上发生的事情,按照“集成感知(提供计算机当前状态的屏幕截图)—推理—行动”的流程进行迭代循环,能够操作屏幕上的按钮、菜单和文本框。目前Operator以“研究预览”形式向ChatGPTPro美国用户开放,将逐步推广至Plus/Team/Enterprise用户,此外,Operator还为DoorDash、Instacart、OpenTable、Uber等企业提供服务。SamAltam表示将在ChatGPT免费版中提供o3-mini模型,目前该模型已完成安全测试,预计在未来几周正式发布。
未来,Operator预计会在包括真实场景的持续落地,更多代码编辑和终端操作,安防防御能力优化等几个维度持续优化。AIAgent的发展离不开底层大语音模型的升级
加载中...
已阅读到文档的结尾了