点镜scrm > 点镜行业动态 > 默认分类 > 阿里云通义开源网络智能体WebSailor，登顶开源榜单

阿里云通义开源网络智能体WebSailor，登顶开源榜单

作者：微企 www.saaservice.cn 发布时间：2025-07-29 21:00:03

在科技日新月异的今天，阿里云再次展现了其在人工智能领域的领先地位。近日，阿里云宣布通义正式开源了一款名为WebSailor的网络智能体，该智能体凭借其强大的推理和检索能力，在智能体评测集BrowseComp上脱颖而出，成功登顶开源网络智能体榜单。这一消息无疑在AI领域掀起了轩然大波。

据了解，WebSailor网络智能体具备在复杂场景下执行检索任务的能力。面对模糊问题，它能够迅速在浩瀚的网页海洋中进行快速检索，并通过严密的推理验证，从海量信息中筛选出准确答案。这种能力不仅提升了信息检索的效率，更保证了信息的准确性和可靠性。

为了打造这一强大的网络智能体，通义实验室团队采用了整套创新的post-training方法。这种方法显著提升了开源模型在复杂网页推理任务上的表现，使得WebSailor在高难度智能体评测集BrowseComp上取得了卓越的成绩，甚至超越了DeepSeek R1、Grok-3等知名模型和智能体。

为了验证WebSailor的实力，通义实验室在多个benchmark评测集上进行了实测。其中，BrowseComp作为OpenAI开源的浏览器检索效果评测集，包含了1266个高难度问题，是业界公认的难度最高的评测集之一。然而，令人惊讶的是，WebSailor不仅在开源模型和Agent阵营中实现了断层领先，甚至超越了部分闭源模型，仅次于OpenAI的DeepResearch。

值得一提的是，尽管WebSailor仅基于高难度数据进行训练，但它在处理普通任务SimpleQA的数据集时，也展现出了出色的表现。这充分证明了WebSailor方法的泛化能力和兼容性，使得它能够在不同场景下都能发挥出色的性能。

阿里云表示，WebSailor提供了一个通用的workflow，可以借鉴到其他领域的问题中。其强调的“高难度任务合成+小规模冷启动+高效RL优化”的组合拳策略，具有很强的普适性。未来，开源社区可以参考WebSailor的思路，去攻克更多类似“超越人类能力”的任务，如开放领域的复杂推理问答、学术知识发现，甚至跨模态的信息整合等。

随着WebSailor的开源，我们有理由相信，它将在未来的AI领域发挥更加重要的作用，推动人工智能技术的不断进步和发展。