三个月时间,从后端开发崽逐渐转型为 agent 工程师,想聊聊自己的三个小技巧。

  1. 读官方文档。LangChain、Anthropic、Manus 等公司或组织的官方文档、博客质量很高,特别是 LangChain,文档简直手把手教读者怎么做一个 agent

  2. 看大佬分享。Manus Peak Ji、LangChain CEO、Claude Code 之父 Boris 等等,这几位都有很多公开的分享、博客、采访,从一个 Agent 开发者的角度去思考、理解他们分享的内容

  3. 多动手实践。告诉 Claude Code 自己要基于什么技术栈,做一个什么样的 agent。实际做一个 agent 出来。

    分享一下我从零做完一个完整Coding Agent的过程。

整个项目用了大概一周,6500行代码,能够自动探索代码库、调用工具执行操作、从执行结果中学习并持续迭代,直到任务完成。

把方法论整理出来,需要的兄弟扫码添加微信发你~
在这里插入图片描述

第一步: 搞清楚Agent有哪些类型

做之前先想清楚要做哪一类,不同类型的技术路线差很多。

2025-2026年主流的Agent类型大概分四类:

==CodingAgent:==自主完成编程任务(修bug、写代码、跑测试)。代表:Claude Code、CursorAgent、SWE-agent。技术核心是ReAct循环+工具调用。

==BrowserAgent:==操作浏览器完成网页任务。代表:Browser-use、Operator。技术核心是视觉理解+DOM操作。

==DataAgent:==分析数据、生成报告、操作数据库。代表:各类Text-to-SQL工具。

==Multi-Agent:==多个Agent协同,分工完成复杂任务。代表:AutoGen、CrewAl。技术核心是任务分解和Agent间通信。

我选了CodingAgent,原因是技术栈最清晰,有高质量参考项目,SWE-bench有标准评测,最适合深度学习。

第二步: 系统研究高质量开源项目

确定方向后,不要急着写代码,先把领域内最好的项目研究透。我研究了四个:

SWE-agent (Princeton)
代码量最小,最适合入门。核心贡献是ACI(Agent-ComputerInterface)概念:专门为LM设计工具接口,而不是直接让LM用Linuxshell。每轮输出 thought+command,接收执行反馈,标准ReAct循环。SWE-bench约53%.
ReAct主循环的标准实现方式,工具接口如何为LM设计而不是为人类设计。

Aider
生产级CLI工具,代码量大但工程质量高。最值得学的是repo-map技术:用tree-sitter提取代码符号,按PageRank排序依赖关系,把整个repo的结构压缩成几干token的摘要注入Systemprompt。解决了"大型代码库塞不进上下文"这个核心问题。
上下文管理的工程实现,tree-sitter多语言符
号提取。

OpenHands
目前结构最完整的开源实现,SWE-bench72%。核心是CodeAct(用Python代码作为action格式)和事件溯源状态管理:记录所有command/edit/result,跨 action 持久化上下文。最新版本用 Claude Sonnet 4.5+extended thinking.

事件溯源的状态管理,Docker沙箱隔离,大规模工程的组织方式。

Open-SWE
2026年的最新形态,多Agent编排+异步执行+LangGraph状态机。

了解当前最新技术方向,明确v1不需要做到这个复杂度。

第三步: 设计架构

核心思路:以SWE-agent的ReAct架构为骨架,加入Aider的repo-map上下文管理,再叠加Reflection纠错循环。覆盖的技术点最全,也是最能学到东西的路径。

最终确定五层架构:

入口层 CLl/Chat/GitHub Issue

AgentCore ReAct主循环+EventLog(事件溯源)

LLM层 统一Backend接口(多模型路由)

工具层 12个工具+Runtime抽象(本地/Docker)

上下文层 RepoMap +TokenBudget+History

==关键设计原则:==每层只依赖下一层的抽象接口,不穿透。新增工具只需继承BaseTool,新增模型只需实现LLMBackend,不改核心代码。这是维持代码质量的关键。

第四步:技术选型

每个选型都要有明确理由,不要因为"大家都用"就选。

特别说一下 MockBackend:
Agent测试最大的痛点是依赖真实API–慢、贵、不稳定。解决方案是实现一个MockBackend,按预设脚本返回Action,不调真实LLM。这样376个测试20秒跑完,每个模块可以独立验证。

最重要的一点

  • 研究参考项目时带着问题去读,不是泛泛浏览:
  • 它的主循环在哪里?怎么组织的?
  • 工具接口怎么设计的?为什么这样设计?
  • 上下文超限时怎么处理的?
    测试文件在测什么?用了什么mock策略?

带着这四个问题读完参考项目,架构基本上就自己想清楚了。

项目名forge-agent,如果开源项目对您有用,需要的兄弟观一下get~

那么,我们如何学习AI大模型呢?

这份精心整理的AI大模型学习资料,我整理好了,免费分享!只希望它能用在正道上,帮助真正想提升自己的朋友。让我们一起用技术做点酷事!

ps:微信扫描即可获取
加上后我将逐一发送资料
与志同道合者共勉
真诚无偿分享!!!

在这里插入图片描述


适学人群

我们的课程体系专为以下三类人群精心设计:

  • AI领域起航的应届毕业生:提供系统化的学习路径与丰富的实战项目,助你从零开始,牢牢掌握大模型核心技术,为职业生涯奠定坚实基础。
  • 跨界转型的零基础人群:聚焦于AI应用场景,通过低代码工具让你轻松实现“AI+行业”的融合创新,无需深奥的编程基础也能拥抱AI时代。
  • 寻求突破瓶颈的传统开发者(如Java/前端等):将带你深入Transformer架构与LangChain框架,助你成功转型为备受市场青睐的AI全栈工程师,实现职业价值的跃升。

在这里插入图片描述


※大模型全套学习资料展示

通过与MoPaaS魔泊云的强强联合,我们的课程实现了质的飞跃。我们持续优化课程架构,并新增了多项贴合产业需求的前沿技术实践,确保你能获得更系统、更实战、更落地的大模型工程化能力,从容应对真实业务挑战。
在这里插入图片描述资料内容涵盖了从入门到进阶的各类视频教程和实战项目,无论你是小白还是有些技术基础的技术人员,这份资料都绝对能帮助你提升薪资待遇,转行大模型岗位。

01 大模型系统化学习路线

作为学习AI大模型技术的新手,方向至关重要。 正确的学习路线可以为你节省时间,少走弯路;方向不对,努力白费。希望这份最科学最系统的学习成长路线图和学习规划,带你从零基础入门到精通!

在这里插入图片描述

👇微信扫描下方二维码即可~

在这里插入图片描述
本教程比较珍贵,仅限大家自行学习,不要传播!更严禁商用!

02 大模型学习书籍&文档

新手必备的权威大模型学习PDF书单来了!全是一系列由领域内的顶尖专家撰写的大模型技术的书籍和学习文档(电子版),从基础理论到实战应用,硬核到不行!
※(真免费,真有用,错过这次拍大腿!)

请添加图片描述

03 AI大模型最新行业报告

2025最新行业报告,针对不同行业的现状、趋势、问题、机会等进行系统地调研和评估,以了解哪些行业更适合引入大模型的技术和应用,以及在哪些方面可以发挥大模型的优势。

在这里插入图片描述

04 大模型项目实战&配套源码

学以致用,在项目实战中检验和巩固你所学到的知识,同时为你找工作就业和职业发展打下坚实的基础。

图片

05 大模型大厂面试真题

面试不仅是技术的较量,更需要充分的准备。在你已经掌握了大模型技术之后,就需要开始准备面试,我精心整理了一份大模型面试题库,涵盖当前面试中可能遇到的各种技术问题,让你在面试中游刃有余。

图片
在这里插入图片描述

06 全套AI大模型应用开发视频教程

(包含提示工程、RAG、LangChain、Agent、模型微调与部署、DeepSeek等技术点)

在这里插入图片描述


由于篇幅有限
只展示部分资料
并且还在持续更新中…

ps:微信扫描即可获取
加上后我将逐一发送资料
与志同道合者共勉
真诚无偿分享!!!
在这里插入图片描述
最后,祝大家学习顺利,抓住机遇,共创美好未来!

Logo

AtomGit AI 社区提供模型库、数据集、Agent、Token等资源

更多推荐