2026年5月15日,伊利诺伊大学厄巴纳-香槟分校(UIUC)与斯坦福大学联合发布RecursiveMAS框架,该框架通过让AI代理共享嵌入向量而非文本进行协作,将多代理推理速度提升2.4倍,同时将token使用量降低75%。该研究有望大幅降低企业运行多代理系统的计算成本。
背景分析:多代理系统(Multi-Agent Systems)是当前企业AI应用的热门方向,但代理之间通过文本交换进行通信会造成巨大的token开销。RecursiveMAS通过嵌入共享机制,将通信内容压缩至原来的四分之一,同时不损失任务完成质量。
趋势判断:多代理系统的效率优化将成为2026年下半年AI工程的重点方向。随着企业部署的代理数量持续增长,降低协作开销将成为决定系统可行性的关键。预计该技术路线将快速被主流AI开发框架吸收。
来源:VentureBeat(https://venturebeat.com/orchestration/how-recursivemas-speeds-up-multi-agent-inference-by-2-4x-and-reduces-token-usage-by-75/)
