郎瀚威will:2025年Perplexity Comet电商选购类任务测试报告.pdf |
下载文档 |
资源简介
根据报告内容,主要概括如下:
1、报告由郎瀚威和猫猫头完成,测试了OpenAI Agent、Perplexity Comet、Manus和Genspark在电商购物场景下的能力。
2、测试了5个任务,包括亚马逊商品购买、自行车发货时间查询、聚会物品购买、预算内风衣购买和冰箱购买。结果显示Comet和Genspark表现较好,OpenAI Agent次之,Manus相对较弱。
3、Comet在购物场景中表现最佳,能够完成购买流程;Genspark也能完成加购和填写地址,但需要手动操作浏览器;OpenAI Agent可以加购和填写地址,但无法完成支付;Manus只能提供购买方案,无法完成购买。
4、报告还分析了各Agent的流量变化,发现Manus和Genspark流量稳定,Comet流量已归入主站无法分析。
5、报告指出购物场景能展示AI的个性化理解、执行过程复杂度、意图推理和反馈机制,是展示AI能力的良好场景。
本文档仅能预览20页