科技巨头竞逐的智能体,会成为 “AI 时代的 App” 吗?

频道:互联网 日期: 浏览:10
        近日备受关注的 OpenAI 新项目传来新消息。


The Information 援引内部消息称OpenAI 计划最快在今年秋天推出代号为「草莓(Strawberry)」的全新 AI。该 AI 具备前所未有的「推理」能力不仅能处理复杂的数学和编程任务还能应用于日常生活中的非技术问题。


此外报道还指出这项技术对未来 AI 产品尤其是旨在解决多步骤任务的「智能体(Agent)」具有重要意义。


智能体并非新事物。2022 年年底 ChatGPT 大火后「智能体」迅速引起整个行业的广泛关注。从开源项目 AutoGPT 到 OpenAI 官方推出的 GPTs 和 GPT 商店这些「雏形」在一定程度上展现了 AI 智能体的潜力与必要性。


2023 年人工智能行业的发展和竞争主要聚焦于大模型本身智能体的探索才刚刚起步。而到了 2024 年Google、百度、阿里巴巴、字节跳动、OpenAI 等国内外科技巨头明显加快了智能体的落地步伐。

智能体究竟是什么?

如果平时关注 AI 领域想必读者们对「智能体」这个词并不陌生但要准确说出智能体到底是什么可能并不容易。


事实上早在 1995 年出版的《未来之路》一书中微软公司创始人比尔・盖茨就提到了「智能体」的概念。然而近三十年来尤其是在 ChatGPT 出现后基于大模型的「智能体」其概念发生了很大的变化。


时至今日学术界对「智能体」尚未形成统一的定义。不过一般认为「智能体」是能够自主感知环境、做出规划并执行任务的智能实体它不是「副驾驶」而是「主驾驶」。


可以用一个直观的公式来表示:Agent(智能体)= LLM(大模型)+ Planning(规划)+ Feedback(反馈)+ Tool use(工具使用)。


以人类借助 ChatGPT 写文章为例为确保文章质量通常需先确定选题然后让 AI 辅助生成大纲再利用 AI 的搜索能力进行分析、调研接着让 AI 生成初稿最后通过不断反馈优化内容得到最终版本。


而 AI 智能体在大模型的基础上通过自主的规划、反馈和工具使用能力进一步减少了人工介入。具体来说AI 智能体能够自主使用资料搜索、阅读理解、数值计算等工具并通过规划「大纲 - 搜索、分析、调研 - 初稿 - 反馈再优化」等多步骤任务实现「人类一句话AI 跑断腿」的效果。


简言之AI 智能体通过迭代和对话式的模式工作不再是简单的指令执行者而是能够进行自我反思、规划和修正的参与者。

智能体:大模型上的 “新物种”

「智能体不仅会改变每个人与计算机交互的方式还将颠覆软件行业带来自我们从键入命令到点击图标以来最大的计算革命。」


去年 11 月比尔・盖茨在其个人网站发布的《AI 将彻底改变计算机使用方式》博文中认为 AI 智能体(AI Agent)将在未来五年颠覆人们使用计算机的方式。


当然坚定看好 AI 智能体的不止比尔・盖茨一人。


今年 3 月斯坦福大学教授吴恩达指出他们在研究中基于 GPT - 3.5 构建的智能体工作流在应用中的表现比 GPT - 4 更好基于 GPT - 4 构建的智能体工作流效果则更佳。他还表示AI 智能体将在 2024 年推动 AI 的大规模进步甚至可能超过下一代基础模型所带来的影响。


在 7 月举办的世界人工智能大会上基于大模型的智能体成为绝对焦点。蚂蚁集团董事长兼 CEO 井贤栋在演讲中表示从实践来看专业智能体是大模型落地严谨产业的有效路径。百度创始人李彦宏更是明确表示智能体是百度最看好的人工智能应用发展方向。


同期谷歌推出了 AI 智能体平台 Oscar开发者通过一定配置就能生成各种 AI 智能体。不仅如此百度文心有 AgentBuilder字节跳动有扣子(Coze)以及 HiAgent阿里巴巴有百炼智能体和钉钉智能体腾讯微信有云开发 AI 智能体…… 智能体平台逐渐成为大模型厂商的「标配」百度甚至喊出了「人人都是开发者」的口号。


可以说在经历 2023 年的思考和探索后AI 智能体在 2024 年已成为人工智能行业的新共识。

智能体:让 AI 从技术竞争走向场景应用

去年年底OpenAI 推出了 GPTs 和 GPT 商店允许用户无需编码即可创建自己的 GPT 版本。但 GPTs 依然只是充当「副驾驶」的角色虽有更多个性化定制的可能但无法拆解任务并一步步推算和执行。


事实上如今很多标榜为 AI Agent 的「智能体」更多还是 ChatBot(聊天机器人)反倒是钉钉的 AI 助理(英文名为 AI Agent)更接近实质上的智能体。


判断一个名义上的「智能体」是真的智能体还是常规的 AI 聊天机器人核心在于任务过程中人工的介入程度以及大模型在规划、决策上的参与程度。


但必须指出从「副驾驶」到「主驾驶」当下的智能体在技术上仍有很大的进步空间尚未能带来颠覆性的体验。不过未来才是关键比起以聊天为交互形式的聊天机器人AI 若想更深入地改变生活就需要拥有更强的自主性。


理想情况下AI 智能体能够根据各种条件智能地作出决策和规划。例如在制定旅游规划时它可以自主搜索交通住宿及各种旅游信息并充分考虑用户的历史偏好和习惯查漏补缺进行多次补充和修改。


又如用户在下班后的夏夜里拖着疲累的身心回家时AI 可以根据汽车或手机的位置提前感知并根据位置和时间在不同阶段智能地打开空调、扫地机器人、灯光等设备。


就像盖茨构想的那样未来我们无需为不同任务切换不同的应用只需用平常的语言告诉电脑和手机想做什么然后根据用户愿意分享的数据智能体将个性化地作出反应。

结语

本质上智能体是在 AI 的基础上借鉴人类的思考方式构建更专业的推理和决策能力以提供更智能化的用户体验。在一定程度上AI 智能体比 ChatGPT 更进了一步。


但可想而知单一智能体无法满足所有人的所有需求所以井贤栋认为未来智能化的用户体验需要众多专业智能体共同参与、各司其职李彦宏则认为未来将出现数百万量级的智能体。


下一个平台的竞争已不可避免。


正如移动时代的 App Store随着智能体的兴起AI Agent Store 也在成为新的竞争焦点。因此除了场景上的竞争对于拥有基础大模型的大厂来说生态更是智能体发展过程中的核心之一也是兵家必争之地。



    

欧比特爱玩:https://www.cnobt.com 欧比特爱玩https://www.cnobt.com
分享到: