找回密码
 立即注册

BTC: 加载中...

ETH: 加载中...

USDT: 加载中...

BNB: 加载中...

XRP: 加载中...

ADA: 加载中...

SOL: 加载中...

DOGE: 加载中...

DOT: 加载中...

SHIB: 加载中...

TRX: 加载中...

搜索
查看: 340|回复: 1

召唤Agent小分队高效“打工”!这个OpenAI前员工的Agent产品又上新了

[复制链接]

1

主题

0

回帖

3

积分

新手上路

积分
3
发表于 前天 10:12 | 显示全部楼层 |阅读模式
Manus 火热,GensPark 转型,智谱全量上线 AutoGLM「沉思」,Camel-AI 推出 Multi-agent Matrix,OpenAI 发布 Agent Benchmark.....2025,注定是 Agent 的世界。



就在这两天,我们拿到了海外 Agent 公司 Convergence AI 的内测账号。


这家由OpenAI第5号员工于2024年4月创立的公司,在自己的通用 Agent —— Proxy 中悄悄上线了“并行Agent”新功能。


1.webp

*Proxy使用Orchestrator和多个Agent并行处理任务,右侧同步各Agent任务执行展示


*Orchestrator是智能体“协调者”,负责管理整体工作流并协调其他智能体的行动,通俗来说就是通用型Agent的“大脑”


Proxy 是一个光环加身的 Agent 产品。


它在2025年1月推出时,在 webvoyage 基准测试中险胜 OpenAI。而且,上线仅一个月它的用户数就迅速突破10万。


这一次更新的“并行Agent ”,能把用户输入给 Proxy 的任务,自动拆分,并生成多个子Agent 一起执行。


这就类似于,给 Agent 小组长加了好几个小兵。整个 Agent 小队一起执行任务,打工效率又双叒提升了。




多个Agent一起打工,3分钟完成Research任务


拿到内测账号后,我们比较完整地测试了两个 case。


并行 Agent 的最大效果是提升任务速度,这里先放关于效率的结论:



  • 当要求 Proxy 分析特斯拉股价报告时,Proxy通过 Orchestrator—— Agent的大脑,规划了四个子 Agent,总共耗时3分钟完成了任务。


  • 在要求它找到近期整个X平台上最火热AI话题的任务中,Proxy 也花费了3分钟。


这种效率,不得不说超越了很多人类🐮🐎。


想象一下,拿到任务,再进行需求沟(扯)通(皮)、执(摸)行(鱼),恐怕至少要等半天才能交付。


来看看这两项任务的实测过程:


Case1: 研究报告
首先,输入让 Proxy 做「特斯拉股票研究,并用图表表示数据」的需求,画面跳转到任务执行页面——


2.png



能看到,Proxy 通过自己的 Orchestrator,对任务进行分拆,生成了子Agent。这是整个任务最耗时的环节之一,大约需要20秒。


Orchestrator 这次生成了两个子Agent。


Agent1,执行新闻收集(Tesla News Collector)任务;Agent2,负责股票数据收集(Tesla Stock Data Collector)。


接下来,两个子Agent 开始“兢兢业业地打工”。


3.png

*Agent1,Tesla News Collector正在扒网页读新闻


4.png

*Agent2,Tesla Stock Data Collector正在扒网页整理数据


能看到,这两个子Agent虽然在执行不同的任务,但它们是同时、并行在工作。


当Agent1和Agent2完成任务后,Orchestrator开始继续Planning,并生成了下一个Agent。


5.png

*页面上方正在生成第三个Agent


第三个 Agent 的任务是对特斯拉的股票进行分析。


或许因为分析任务不需要浏览大量网页信息,Agent3,只用了5秒钟就完成了任务。


6.png

*Agent3执行任务


接下来的 Agent4 起到交付最终报告的作用。


在等待 Agent4 生成的同时,我们可以浏览其他已完成的任务。


7.png

*在生成Agent4的同时翻阅Agent3的分析结果


Agent4 完成任务后,可以在浏览框中查看整体的报告,还可以转成PDF。


至此,整个任务宣告结束。


8.png



整体看了一下,这次并行Agent执行完任务,只花费了3分钟。


9.webp

10.webp

*输入任务和输出报告时的时间分别是4月2日的23点15分和23点18分。


从结果看,报告的思考深度还有提升空间,但新闻资料、表格呈现等要求都悉数在列。


11.png

*报告结果


接下来,我们还让 Proxy 帮助「检索X上热度最高的AI话题」。


Case2  找到X上热度较高的AI话题


针对这个任务,Proxy 的 Orchestrator 规划了三个子Agent——X平台AI数据采集器、AI话题流行原因分析器和汇总结果Agent。


完整流程如下👇:


*为直观体现流程效果,视频经裁剪和7倍加速,实际任务完成时长为3分钟


此外,我们还尝试用 Proxy 执行了攻略制定、代码生成等任务。


综合而言,Proxy 这次上新的并行Agent,有以下几个特点:



  • 效率提升。Convergence AI 对我们的官方说法是效率平均提升5倍,复杂任务提升10倍。


  • 异步。在任务执行中,我们可以随时切换页面,也可以翻阅子Agent和其他任务。当然,如果不幸卡住也可以重新开一个任务。


  • Orchestrator 分拆任务有着自己的逻辑。比如,如果某个任务只需要一个子Agent,它也不会调取多个。


  • 并行 Proxy 遇到不确定的问题时,依然需要人类支持。比如,面对设计任务时它需要人类提供进一步的细节。


  • 交付结果仍然需要校验,更复杂的图表、PPT制作等功能还需要强化。


  • 目前来看,它的研究、规划类任务的效果强于代码任务。


目前,Proxy 依旧在紧锣密鼓的优化中。


就在测试后的几个小时内,我们看到Agent1、2、3的Tag就被优化为Proxy1、2、3,任务展示页面也在持续升级UI。


升级Before👇:
12.webp



After 👇:
13.webp





Orchestrator,Agent最重要的壁垒?


这次上新的并行Agent,被看作 Convergence AI 的杀手锏之一。


官方表示,上线了并行功能的 Proxy,目前是市面上唯一一款并行执行的通用型Agent。


Convergence AI 的工程负责人郑浅说,对于复杂任务,并行Agent的处理效率是线性处理任务的 Agent 的 10 倍。因此,并行Agent一定是未来趋势。


并行Agent的实现,不仅基于模型层,更依赖 Agent 的 Orchestrator。


在模型层,Proxy 采用了多种 LLM,包括主流模型和自研或开源的小型模型。


Convergence之前开源的 3B 参数模型,在 WebVoyager 测试中,已经能达到75%的准确率。此外,他们还在训练更小的 0.5B 参数模型,并通过精细化任务分工,让小型模型只处理相对简单的子任务。


在任务理解和规划上,Proxy 可以使用 DeepSeek-R1、o3-mini 等模型。


在模型之上,Convergence AI 更看重对 Agent orchestrator 的研发——去年11月,他们开始重点打造自己的 Agent orchestrator。


实现并行Agent的核心,是 Agent Orchestrator。没错,就是出现在 Proxy 任务面板中的“planning 大师”。


14.webp



简单来说,Proxy 通过 Agent graph 进行任务规划,来完成调度并行Agent,让每个 Agent 都清楚自己何时应该被唤醒,以及在完成任务后应该唤醒哪个 Agent。


目前,市面上并没有人开源真正的 Agent orchestrator,各家公司都通过各自不同的方式建设自己的 Agent orchestrator。


郑浅认为,orchestrator 这个能够高效、动态、精准、分配和管理任务的Agent“大脑”,代表了 Agent 公司的核心竞争力。


15.webp

*Porxy的特点


优秀的 Agent orchestrator 需要具备以下能力:



  • 计划并分配任务。单个 Agent 能力有限,一群Agent协作则能完成更复杂任务,如公司撰写报告需资料搜集、数据整理、分析、趋势预测等。Agent orchestrator 需要制定计划、分配任务,让 Agent 各司其职,最大化效率。


  • 重新规划与纠正。计划不一定完美,及时纠正能才将偏离计划拉回正轨。Agent orchestrator 同样需要监测任务进度,发现问题时及时调整策略。


  • 能够实现并行Agent的工作。根据任务同时生成能独立完成相应任务多个 Agent,协调其工作并进行整合。


“如果单纯缝合工具而不加强 Agent orchestrator 开发,就像没有大脑只有工具的人,无法很好执行地任何任务。”郑浅说。


所以,这次 Proxy 上线并行Agent功能,目的之一也是把自家 Agent orchestrator 的能力具象出来。


在 Convergence AI 之外,一些 Multi-Agent 框架也在强调 Orchestrator 的重要性。比如,AWS 最近开源的 Multi-Agent Orchestrator, 就强调自己是生产级多 Agent 编排框架。


从更宏观的视角,除却 orchestrator,如今的 Agent 公司正在走出不同的发展路线。


单从我们接触到的 Agent 公司,就有专注模型层本身、重视产品端到端交付、框架打造等几种,Agent Infra 的项目也正逐步增多。


或许,今年是真正靠谱的、通用Agent落地元年。


参考资料:锦秋集
https://mp.weixin.qq.com/s/Hpgqs69C4e0gw5_TPIyMuQ

0

主题

2

回帖

0

积分

新手上路

积分
0
发表于 前天 10:34 | 显示全部楼层
agent就是语言大模型公司派来 狂吃token的[哈哈][哈哈]
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|币圈社区

GMT+8, 2025-4-6 02:12 , Processed in 0.119462 second(s), 24 queries .

Powered by forum.gao.gs

© 2021-2024 币圈社区

快速回复 返回顶部 返回列表