点镜scrm > 点镜行业动态 > 默认分类 > 阿里云通义开源网络智能体WebSailor,登顶开源榜单

阿里云通义开源网络智能体WebSailor,登顶开源榜单

作者:微企 www.saaservice.cn 发布时间:2025-07-29 21:00:03


在科技日新月异的今天,阿里云再次展现了其在人工智能领域的领先地位。近日,阿里云宣布通义正式开源了一款名为WebSailor的网络智能体,该智能体凭借其强大的推理和检索能力,在智能体评测集BrowseComp上脱颖而出,成功登顶开源网络智能体榜单。这一消息无疑在AI领域掀起了轩然大波。

据了解,WebSailor网络智能体具备在复杂场景下执行检索任务的能力。面对模糊问题,它能够迅速在浩瀚的网页海洋中进行快速检索,并通过严密的推理验证,从海量信息中筛选出准确答案。这种能力不仅提升了信息检索的效率,更保证了信息的准确性和可靠性。

为了打造这一强大的网络智能体,通义实验室团队采用了整套创新的post-training方法。这种方法显著提升了开源模型在复杂网页推理任务上的表现,使得WebSailor在高难度智能体评测集BrowseComp上取得了卓越的成绩,甚至超越了DeepSeek R1、Grok-3等知名模型和智能体。

为了验证WebSailor的实力,通义实验室在多个benchmark评测集上进行了实测。其中,BrowseComp作为OpenAI开源的浏览器检索效果评测集,包含了1266个高难度问题,是业界公认的难度最高的评测集之一。然而,令人惊讶的是,WebSailor不仅在开源模型和Agent阵营中实现了断层领先,甚至超越了部分闭源模型,仅次于OpenAI的DeepResearch。

值得一提的是,尽管WebSailor仅基于高难度数据进行训练,但它在处理普通任务SimpleQA的数据集时,也展现出了出色的表现。这充分证明了WebSailor方法的泛化能力和兼容性,使得它能够在不同场景下都能发挥出色的性能。

阿里云表示,WebSailor提供了一个通用的workflow,可以借鉴到其他领域的问题中。其强调的“高难度任务合成+小规模冷启动+高效RL优化”的组合拳策略,具有很强的普适性。未来,开源社区可以参考WebSailor的思路,去攻克更多类似“超越人类能力”的任务,如开放领域的复杂推理问答、学术知识发现,甚至跨模态的信息整合等。

随着WebSailor的开源,我们有理由相信,它将在未来的AI领域发挥更加重要的作用,推动人工智能技术的不断进步和发展。

联系我们

手机号码:+400-619-9527

no cache
Processed in 0.244071 Second.