点镜scrm > 点镜行业动态 > 默认分类 > 当大模型步入“能做会执行”新纪元:AI 行业的变革与机遇

当大模型步入“能做会执行”新纪元:AI 行业的变革与机遇

作者:微企 www.saaservice.cn 发布时间:2025-08-28 21:00:03


近年来,随着人工智能技术的飞速发展,大模型已成为科技领域的热门话题。从最初的“能写会说”到如今正逐步迈向的“能做会执行”,大模型的能力边界正在不断拓展。这一转变不仅预示着AI技术的全新发展方向,更揭示了行业正从堆参数的预训练时代,转向以推理模型为核心的系统工程时代。

在过去,大模型主要通过扩大参数规模和语料库来提升性能,然而,这种堆参数的方式已经逐渐触及瓶颈。如今,行业焦点已经转向构建具备执行力与反馈机制的系统架构,让AI像Agent一样规划、行动、拿结果。这一转变意味着,训练数据从“文本”变“任务轨迹”,商业路径从“卖API”变“卖闭环”。谁先搭好“任务—反馈—资源”飞轮,谁就率先拿到AGI(通用人工智能)的入场券。

Perplexity联合创始人兼CEO Aravind Srinivas指出,当前行业正经历一场范式转移,从扩大模型参数与语料规模,转向构建具备执行力与反馈机制的系统架构。他强调,通用预训练模型虽然构建了语言理解的基底,但无法直接转化为可用系统。唯有借助推理机制与行为反馈,才可落地为具备自主任务执行能力的产品形态。

这一转变在行业内已形成共识。以Perplexity、DeepSeek等系统为代表的推理模型体系,正在形成新的产品架构共识:用结构化任务路径替代文本拟合,用真实反馈闭环替代离线评估。这一变革不仅促使产业链重构资源配置策略,更在系统工程层解构模型边界,建立起“任务能力—系统结构—资源决策”三位一体的闭环机制。

推理模型接棒预训练范式,成为生成式系统进入部署阶段的关键转折点。过去两年,生成式预训练模型在语言理解与生成方面取得显著突破,但这一范式已触及阶段性边界。行业重心正从扩大语料与参数规模,转向提升系统执行能力与任务推理深度。新一代模型将更依赖后训练阶段的结构化调优,以支持复杂逻辑链的处理、任务流程的执行及网页环境下的行为操作。

DeepSeek的出现成为北美团队显著对标压力之一,其突破不仅体现在工程能力上,更关键在于提出并实现了“推理模型”的具象路径。DeepSeek Zero展示了在无监督环境中,通过强化学习引导模型产生具备执行力的推理行为,为自动化agent的训练机制提供了结构性模板,也为行业探索能力边界打开了新通道。

在产品与研究协同推进的路径中,部分团队已引入结构化机制,将前沿研究聚焦于模型任务能力与系统性能优化,产品端则专注于界面设计、信息组织与用户体验。这一“双螺旋”机制确保每轮迭代均具备明确实验验证基础,形成稳定的反馈与更新节奏。同时,一种“延迟训练”策略也在部分公司内部被验证有效:初期通过UI包装构建原型,先行获取用户数据与行为反馈,再择机启动大模型训练,利用开源模型的性能进展弥合初期资源限制。

模型训练的重心正在从大规模语料抓取转向具象任务路径的构建。在任务导向的训练范式下,模型能力的提升不再依赖复刻人类语言表达,而聚焦于执行链式行为。训练样本以“任务行为路径”为单位组织,形成agent系统推理能力的关键基座。这一转变也带来了数据来源与训练目标的深度变化,企业普遍放弃自建预训练模型,将通用语义建构交由开源社区与闭源实验室完成,自身则聚焦在此基础上构建封闭式微调体系。

面对搜索引擎巨头的存量优势,新系统普遍选择避开算力正面碰撞,转向机制异构的路径切入。生成式系统在人均变现效率上与传统搜索

联系我们

手机号码:+400-619-9527

no cache
Processed in 0.262152 Second.