大模型及其应用系列第四篇——智能体（AI Agent）

*肖鹏大模型通常是一个预训练好的基础模型，尽管我们通常说的大模型其实是包含了大家常见的聊天应用，但它不能自动拆解任务并帮助用户完成任务，把最终结果反馈给用户。而智能体（AI Agent）具有记忆、分析、决策、调用工具执行的能力，前几天火出圈的就是一款通用型智能体产品。本篇介绍智能体的概念和主要功能**。（大模型及其应用系列第四篇，请在文章底部#大模型及AI应用#目录下浏览其它文章）**01什么是智

努力的光头强

725人浏览 · 2025-06-13 09:55:58

努力的光头强 · 2025-06-13 09:55:58 发布

[**肖鹏

大模型通常是一个预训练好的基础模型，尽管我们通常说的大模型其实是包含了大家常见的聊天应用，但它不能自动拆解任务并帮助用户完成任务，把最终结果反馈给用户。而智能体（AI Agent）具有记忆、分析、决策、调用工具执行的能力，前几天火出圈的Manus就是一款通用型智能体产品。本篇介绍智能体的概念和主要功能**。（大模型及其应用系列第四篇，请在文章底部#大模型及AI应用#目录下浏览其它文章）**

什么是智能体（AI Agent）

产业界和学术界通常把AI Agent翻译成“智能体”，而“agent（代理）"起源于哲学，指的是一种拥有欲望、信念、意图以及采取行动能力的实体。在人工智能领域，这一术语被赋予了一层新的含义：具有自主性、反应性、交互性等特征的智能“代理”。可以简单理解为你只需告诉Agent要完成的任务，Agent可以代替你去执行，最后把结果反馈给你。比如你只需告诉agent要订一张什么时间、去什么地方的机票，它会自动搜索、下单、支付完成订票的整个过程，中间无需个人干预。代理人不仅包括人类个体，还包括物理世界和虚拟世界中的其他实体，如机器人、代理程序等。首次提出”AI Agent“的是人工智能学者马文・明斯基（Marvin Minsky）。他在《思维的社会》一书中，把思维看作由大量相互作用的智能体（Agent）构成的复杂系统。每个智能体都执行特定的任务，并通过协作完成复杂的认知活动。例如在视觉感知中，可能存在专门负责识别边缘的智能体、识别颜色的智能体等，它们协同工作，使我们能够理解看到的图像。他认为社会中的某些个体经过协商之后可求得问题的解，这些个体就是 Agent，且 Agent 应具有社会交互性和智能性。Agent 的概念由此被引入人工智能和计算机领域，并迅速成为研究热点。

智能体的框架和主要功能

OpenAI 的应用研究主管 Lilian Weng 提出了 “Agent=LLM + 规划 + 记忆 + 工具+行动”的基础架构，其中 LLM 扮演了 Agent 的 “大脑”，在这个系统中提供推理、规划等能力。

图一 Agent的功能框架图

记忆：智能体具有短期记忆和长期记忆，用于存储和检索信息。

规划：智能体通过规划来决定如何实现目标，包括：

反射（Reflection）

自我反思（Self-Reflection）

思维链（Chain of Thought）

子目标拆解（Subgoal Decomposition）

工具：智能体可以自动调用各种工具，例如：

日程安排

电商下单

代码解释器

搜索

行动：智能体根据规划的结果采取行动

AI Agent功能主要包括感知、分析、决策和执行四大能力。首先是感知能力，通过传感器获取外部环境的信息，使AI Agent能够对周围的情况有所了解。其次是分析能力，通过对感知到的信息进行分析和处理，提取有用的特征和模式。然后是决策能力，AI Agent基于分析结果进行决策，制定相应的行动计划。最后是执行能力，将决策转化为具体的行动，实现任务的完成。这四大能力相互配合，使得AI Agent能够在复杂的环境中高效地运行和执行任务。比如，最近很火Manus，用户仅需告诉它你的需求，它便能自行搜索信息、思考问题并最终输出符合逻辑且质量优良的结果。Manus会学习用户的偏好，下次处理类似任务时将优先应用用户希望的结果展示或者根据用户的喜好帮助用户做出选择。这种自动化、智能化的处理方式无疑增加了工作效率。

AI Agent还可以根据Agent的行为对感知智能和能力的影响模式，分为不同类型，包括简单反射代理、基于模型的代理、基于目标的代理、基于效用的代理、学习代理和层次代理。这些代理可以根据其期望的结果或目标来确定决策和行动过程的最佳路径，从而实现特定的目的。

为什么需要智能体

大语言模型（LLM）主要侧重于对自然语言等数据理解和处理，虽然也能处理简单的对话和任务，但这种任务是交互式的，即通过提示词一步一步来回答问题比如你让 ChatGPT 买一杯咖啡，ChatGPT 给出的反馈一般类似 “无法购买咖啡，它只是一个文字 AI 助手” 之类的回答。但你要告知基于 ChatGPT 的 AI Agent 工具让它买一杯咖啡，它会首先拆解如何才能为你购买一杯咖啡并自动调用一系列下单以及支付等若干步骤，然后按照这些步骤调用 APP 选择外卖，再调用支付程序下单支付，过程无需人类去指定每一步操作。

另外，更擅长在多主体环境中进行交互和协作。多个 AI Agent 之间可以通过特定的通信协议和机制，进行信息共享、协商和协同工作，共同完成复杂的任务。在智能工厂中，不同的 AI Agent 可以分别负责生产调度、质量检测、设备维护等任务，它们之间相互协作，保障工厂的高效运行。

AI agent 在金融行业的应用表现为通过自动化完成繁琐的工作来改变金融专业工作流程。AI Agent可直接嵌入到工作流程中，可通过搜索网络、分析公开文件、与财务数据源集成以及利用语言大模型为上市和私营公司生成文件，通过专有数据集成以客户自定义格式自动生成报告。

AI Agent通过提供快速、个性化的响应来增强客户满意度，同时降低企业的运营成本。AI Agent的多语言能力和全天候服务提升了客户的互动体验。此外，通过精准的数据收集与分析，AI Agent帮助企业洞察市场趋势，优化产品与服务，制定更有效的市场策略。

国内外主要智能体厂商和产品

中国当下的AI Agent市场已经迎来丰富的参与者，包括互联网大厂类、生成AI类、企服SaaS类、创业类、3C类等多类型企业。这些企业依据自身技术或行业know-how迅速切入市场，通过先手占据更好的生态占位；并且越来越多的企业正在进行产品打磨与场景探索。

字节跳动（COZE）。扣子Coze是字节跳动新一代的AI Bot 开发平台，适用于快速、低门槛搭建专属于个人的Chatbot，并一键发布到豆包、飞书、微信等各个渠道。

阿里云（钉钉）。2024年4 月18 日，钉钉正式上线AI 助理市场（AI Agent Store）。首批上架了200 +AI 助理，通过Agent Store 的这种创新模式可以显著降低创作门槛并吸引更多用户，各行各业的人都可以拥有自己专属的助理。

用友大易。用友大易成立于2007年，是用友集团旗下成员企业。TRM.AI2.0是国内首家基于企业服务大模型的智能招聘系统，运用先进的AI技术，帮助企业建立精细化的人才招聘与运营体系。

Manus：全球首款通用型 AI Agent 产品，以 “手脑并用” 为核心，通过规划、验证与执行闭环，能够独立完成简历筛选、房产遴选等复杂任务。

智谱 AI：推出自主智能体 AutoGLM，基于智谱 AI 的大模型等技术，能完成多种复杂任务，可根据用户需求进行文本创作、知识问答、任务规划等，推动了国产 AI 智能体的发展。

昆仑万维：发布了 “天工 SkyAgents” 平台，用户无需代码编程，通过自然语言和简单操作，几分钟内就可部署属于自己的 AI Agents，可完成行业研究报告、健身计划制定、旅行航班预定等私人定制需求。

Microsoft。微软推出的企业级AI助手Microsoft 365 Copilot Chat，支持AI Agent功能，能够自动化处理日常办公任务，如文档编辑、会议安排等。其Copilot Studio平台已建立全球最大的企业级AI Agent生态系统，超过10万家企业使用。

Claude 3.5 Sonnet。在医药研发中展现强大能力，支持数据分析和决策辅助。

如何学习AI大模型？

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓

CSDN粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传CSDN，朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】

读者福利： 👉👉CSDN大礼包：《最新AI大模型学习资源包》免费分享 👈👈

（👆👆👆安全链接，放心点击）

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

👉1.大模型入门学习思维导图👈

要学习一门新的技术，作为新手一定要先学习成长路线图，方向不对，努力白费。

对于从来没有接触过AI大模型的同学，我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线，大家跟着这个大的方向学习准没问题。（全套教程文末领取哈）
在这里插入图片描述

👉2.AGI大模型配套视频👈

很多朋友都不喜欢晦涩的文字，我也为大家准备了视频教程，每个章节都是当前板块的精华浓缩。
在这里插入图片描述

在这里插入图片描述

👉3.大模型实际应用报告合集👈

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。（全套教程文末领取哈）

在这里插入图片描述

👉4.大模型实战项目&项目源码👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战项目来学习。（全套教程文末领取哈）
在这里插入图片描述

👉5.大模型经典学习电子书👈

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。（全套教程文末领取哈）
在这里插入图片描述

👉6.大模型面试题&答案👈

截至目前大模型已经超过200个，在大模型纵横的时代，不仅大模型技术越来越卷，就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道，我总结了大模型常考的面试题。（全套教程文末领取哈）
在这里插入图片描述

为什么分享这些资料?

只要你是真心想学AI大模型，我这份资料就可以无偿分享给你学习，我国在这方面的相关人才比较紧缺，大模型行业确实也需要更多的有志之士加入进来，我也真心希望帮助大家学好这门技术，如果日后有什么学习上的问题，欢迎找我交流，有技术上面的问题，我是很愿意去帮助大家的！

这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理，鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位，在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利，同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。

在这里插入图片描述

CSDN粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传CSDN，朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】

读者福利： 👉👉CSDN大礼包：《最新AI大模型学习资源包》免费分享 👈👈

（👆👆👆安全链接，放心点击）

天启AI社区

GitCode 天启AI是一款由 GitCode 团队打造的智能助手，基于先进的LLM（大语言模型）与多智能体 Agent 技术构建，致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话，还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力，真正做到“一句话，让 Al帮你完成复杂任务”。

更多推荐

对近期接触到的直播相关知识进行梳理

M3U8 文件是 HLS (HTTP Live Streaming) 协议的核心组件，它本质上是一个播放列表文件，包含媒体流的结构信息。直播与视频聊天的对比：我觉得直播是通过流媒体技术把现场的图像和声音采集后分发出去，供观众在线围观，可以认为是开放的，一般没有人数限制；而视频聊天是点对点的线上交流，是基于UDP/TCP的实时传输协议实现的。流媒体是通过互联网实时传输音视频内容的技术，用户无需等待完