科技巨头竞逐的智能体，会成为 “AI 时代的 App” 吗？

频道：互联网日期：2026-04-01 02:54:47 浏览：10

近日备受关注的 OpenAI 新项目传来新消息。

The Information 援引内部消息称OpenAI 计划最快在今年秋天推出代号为「草莓（Strawberry）」的全新 AI。该 AI 具备前所未有的「推理」能力不仅能处理复杂的数学和编程任务还能应用于日常生活中的非技术问题。

此外报道还指出这项技术对未来 AI 产品尤其是旨在解决多步骤任务的「智能体（Agent）」具有重要意义。

智能体并非新事物。2022 年年底 ChatGPT 大火后「智能体」迅速引起整个行业的广泛关注。从开源项目 AutoGPT 到 OpenAI 官方推出的 GPTs 和 GPT 商店这些「雏形」在一定程度上展现了 AI 智能体的潜力与必要性。

2023 年人工智能行业的发展和竞争主要聚焦于大模型本身智能体的探索才刚刚起步。而到了 2024 年Google、百度、阿里巴巴、字节跳动、OpenAI 等国内外科技巨头明显加快了智能体的落地步伐。

智能体究竟是什么？

如果平时关注 AI 领域想必读者们对「智能体」这个词并不陌生但要准确说出智能体到底是什么可能并不容易。

事实上早在 1995 年出版的《未来之路》一书中微软公司创始人比尔・盖茨就提到了「智能体」的概念。然而近三十年来尤其是在 ChatGPT 出现后基于大模型的「智能体」其概念发生了很大的变化。

时至今日学术界对「智能体」尚未形成统一的定义。不过一般认为「智能体」是能够自主感知环境、做出规划并执行任务的智能实体它不是「副驾驶」而是「主驾驶」。

可以用一个直观的公式来表示：Agent（智能体）= LLM（大模型）+ Planning（规划）+ Feedback（反馈）+ Tool use（工具使用）。

以人类借助 ChatGPT 写文章为例为确保文章质量通常需先确定选题然后让 AI 辅助生成大纲再利用 AI 的搜索能力进行分析、调研接着让 AI 生成初稿最后通过不断反馈优化内容得到最终版本。

而 AI 智能体在大模型的基础上通过自主的规划、反馈和工具使用能力进一步减少了人工介入。具体来说AI 智能体能够自主使用资料搜索、阅读理解、数值计算等工具并通过规划「大纲 - 搜索、分析、调研 - 初稿 - 反馈再优化」等多步骤任务实现「人类一句话AI 跑断腿」的效果。

简言之AI 智能体通过迭代和对话式的模式工作不再是简单的指令执行者而是能够进行自我反思、规划和修正的参与者。

智能体：大模型上的 “新物种”

「智能体不仅会改变每个人与计算机交互的方式还将颠覆软件行业带来自我们从键入命令到点击图标以来最大的计算革命。」

去年 11 月比尔・盖茨在其个人网站发布的《AI 将彻底改变计算机使用方式》博文中认为 AI 智能体（AI Agent）将在未来五年颠覆人们使用计算机的方式。

当然坚定看好 AI 智能体的不止比尔・盖茨一人。

今年 3 月斯坦福大学教授吴恩达指出他们在研究中基于 GPT - 3.5 构建的智能体工作流在应用中的表现比 GPT - 4 更好基于 GPT - 4 构建的智能体工作流效果则更佳。他还表示AI 智能体将在 2024 年推动 AI 的大规模进步甚至可能超过下一代基础模型所带来的影响。

在 7 月举办的世界人工智能大会上基于大模型的智能体成为绝对焦点。蚂蚁集团董事长兼 CEO 井贤栋在演讲中表示从实践来看专业智能体是大模型落地严谨产业的有效路径。百度创始人李彦宏更是明确表示智能体是百度最看好的人工智能应用发展方向。

同期谷歌推出了 AI 智能体平台 Oscar开发者通过一定配置就能生成各种 AI 智能体。不仅如此百度文心有 AgentBuilder字节跳动有扣子（Coze）以及 HiAgent阿里巴巴有百炼智能体和钉钉智能体腾讯微信有云开发 AI 智能体…… 智能体平台逐渐成为大模型厂商的「标配」百度甚至喊出了「人人都是开发者」的口号。

可以说在经历 2023 年的思考和探索后AI 智能体在 2024 年已成为人工智能行业的新共识。