陈根:AI Agent概念火爆,但今年不可能实现

观察未来科技 原创

2025-03-11 12:01

文/陈根

最近关于AI Agent的概念很火爆,也有公司宣布成功开发了AI Agent智能体,并且要有邀请码才能试用。但是我想说的是,今年真正的AI Agent无法实现。为什么呢?

AI Agent 在英文里面的意思,就是AI代理或AI代理人,当然在国内翻译成人工智能体或人工智能代理。其实这种翻译并不准确,当然有文学的宏大感与技术美感。而真正准确的,其实就是直接的翻译,AI代理人,这个代理人的概念就类似于保险顾问,房产顾问,金融顾问之类的,是一种可以自主执行任务的AI程式,它可以感知环境、做出决策并执行行动,就像一个代替人类完成工作的代理人。

AI Agent 的核心是基于大语言模型 (LLM),例如 GPT-4,它负责理解和处理人类的指令。但 AI Agent 不仅仅是大语言模型,它还包含其他组件,例如数据感知、外部工具调用、角色设定、任务规划等等,这些组件让 AI Agent 能够处理更复杂的任务。

简单的说,AI Agent就是一个具有更高智能,更高情商的大语言模型,就如同OpenAI最新宣布的GPT4.5一样,在智商、情商方面都进行了更有效的升级。换句话说,就是让人工智能更懂人,更能听懂我们的文字表达,并且能够实现相应的思考与决策,从而给出更符合我们想要的结果。

那么为什么我说今年AI Agent还不能实现呢?原因就在于我们还无法有效的解决机器幻觉的问题。就以OpenAI的GPT4.5来看,毫无疑问,这是目前最强的大语言模型,或者说代表着嘴领先水平的大模型。但在SimpleQA基准测试中,GPT-4.5的准确率为62.5%,幻觉率为7.1%,尽管这一成绩要远优于GPT-4o、OpenAI o1和o3-mini等模型,但是依然存在着相当高的幻觉率。

而其他的一些模型,那就更不谈这个幻觉率的问题。在AI领域,如果抛开幻觉率来谈大模型的先进性,就等于是耍流氓。因此,与其谈AI Agent是否在今年实现这种没有意义的炒作,不如关注我们是否能有效的找到方法解决机器幻觉的问题。

特别声明
本文为正观号作者或机构在正观新闻上传并发布,仅代表该作者或机构观点,不代表正观新闻的观点和立场,正观新闻仅提供信息发布平台。
最新评论
打开APP查看更多精彩评论

微信扫一扫
在手机上浏览