陈根：AI Agent概念火爆，但今年不可能实现正观新闻

陈根：AI Agent概念火爆，但今年不可能实现

2025-03-11 12:01

文/陈根

最近关于AI Agent的概念很火爆，也有公司宣布成功开发了AI Agent智能体，并且要有邀请码才能试用。但是我想说的是，今年真正的AI Agent无法实现。为什么呢？

AI Agent 在英文里面的意思，就是AI代理或AI代理人，当然在国内翻译成人工智能体或人工智能代理。其实这种翻译并不准确，当然有文学的宏大感与技术美感。而真正准确的，其实就是直接的翻译，AI代理人，这个代理人的概念就类似于保险顾问，房产顾问，金融顾问之类的，是一种可以自主执行任务的AI程式，它可以感知环境、做出决策并执行行动，就像一个代替人类完成工作的代理人。

AI Agent 的核心是基于大语言模型 (LLM)，例如 GPT-4，它负责理解和处理人类的指令。但 AI Agent 不仅仅是大语言模型，它还包含其他组件，例如数据感知、外部工具调用、角色设定、任务规划等等，这些组件让 AI Agent 能够处理更复杂的任务。

简单的说，AI Agent就是一个具有更高智能，更高情商的大语言模型，就如同OpenAI最新宣布的GPT4.5一样，在智商、情商方面都进行了更有效的升级。换句话说，就是让人工智能更懂人，更能听懂我们的文字表达，并且能够实现相应的思考与决策，从而给出更符合我们想要的结果。

那么为什么我说今年AI Agent还不能实现呢？原因就在于我们还无法有效的解决机器幻觉的问题。就以OpenAI的GPT4.5来看，毫无疑问，这是目前最强的大语言模型，或者说代表着嘴领先水平的大模型。但在SimpleQA基准测试中，GPT-4.5的准确率为62.5%，幻觉率为7.1%，尽管这一成绩要远优于GPT-4o、OpenAI o1和o3-mini等模型，但是依然存在着相当高的幻觉率。

而其他的一些模型，那就更不谈这个幻觉率的问题。在AI领域，如果抛开幻觉率来谈大模型的先进性，就等于是耍流氓。因此，与其谈AI Agent是否在今年实现这种没有意义的炒作，不如关注我们是否能有效的找到方法解决机器幻觉的问题。

特别声明

本文为正观号作者或机构在正观新闻上传并发布，仅代表该作者或机构观点，不代表正观新闻的观点和立场，正观新闻仅提供信息发布平台。

打开正观新闻客户端，阅读体验更佳