2026年彻底免费的辅助编程Agent大模型汇总
本文整理了当前市面上真正免费、无需担心Token额度的编程AI助手与Agent工具,按国内云端方案、海外云端方案、开源本地方案三大类划分,结合开发者社区口碑排序,并附上详细的安装配置步骤与核心使用指南,帮助开发者零成本提升编码效率。
一、国内云端免费编程Agent(开箱即用·中文友好)
1. Trae(字节跳动)⭐⭐⭐⭐⭐
研发厂商:字节跳动
免费政策:个人版永久完全免费,无Token限制,无次数限制,每日刷新高级模型额度
核心功能:
- SOLO智能体模式:一句话生成完整前后端项目,自动任务拆解与多文件编辑
- Builder模式:图转代码、UI设计稿转页面、原型快速落地
- CUE智能预测:Tab键一键应用代码建议,兼容VS Code插件生态
- 内置豆包Seed-Code + DeepSeek R1/V3模型,中文理解能力拉满
网友好评度:国产AI IDE口碑天花板,被称为"免费版Cursor"。开发者普遍称赞其UI流畅、项目生成能力强,中文注释精准,前端开发效率提升显著。VS Code插件安装量超170万,社区活跃度极高。
适合人群:中文开发者、全栈工程师、前端快速原型开发、学生及个人开发者
📦 安装与配置步骤
- 方式一:VS Code 插件安装(推荐)
- 打开 VS Code 扩展面板(快捷键
Ctrl+Shift+X/Cmd+Shift+X) - 搜索「Trae」,找到字节跳动官方发布的插件,点击安装
- 安装完成后,左侧边栏出现 Trae 图标,点击后选择「手机号登录」,扫码或输入手机号完成字节账号登录
- 登录后自动激活个人免费版,无需额外付费与认证
- 打开 VS Code 扩展面板(快捷键
- 方式二:独立客户端安装
- 访问 Trae 官网下载对应系统(Windows/macOS/Linux)的安装包
- 双击安装后启动客户端,登录字节账号即可使用完整IDE能力
- 基础优化配置
- 进入插件设置页,开启「自动代码补全」「行内建议」
- 可配置补全触发方式:自动触发 / Tab 手动触发
- 模型选择:默认使用混合模型,复杂任务可手动切换为深度思考模式
💡 核心使用方法
- SOLO 智能体生成项目:在侧边栏对话输入「生成一个Vue3+Element Plus的后台管理系统,包含登录页、用户管理、数据看板」,点击发送后 Agent 会自动拆解任务、创建多文件、写入代码,全程无需手动干预
- Builder 图转代码:点击顶部「Builder」按钮,上传UI设计稿/手绘草图,即可一键生成高还原度的前端页面代码
- 行内代码补全:编码时会自动弹出灰色补全建议,按
Tab键即可采纳 - 快捷代码操作:选中代码后右键可选择「解释代码」「优化代码」「生成单测」「添加注释」等常用操作
2. 通义灵码(阿里云)⭐⭐⭐⭐☆
研发厂商:阿里云
免费政策:个人基础版永久免费,Agent模式每日2000次调用额度,代码补全无限制
核心功能:
- Agent 2.0模式:自主读取代码库、修改文件、执行终端命令,接近Codex CLI体验
- 全链路代码生成:行级补全、函数级生成、单元测试自动编写
- 深度适配VS Code与JetBrains全家桶
- 内置安全漏洞扫描,阿里云生态深度优化
网友好评度:国产首选编程助手,Gartner AI代码助手挑战者象限唯一中国厂商。用户评价其"中文理解准、补全速度快、大项目不卡顿",Agent模式是目前国内最接近Claude Code体验的免费方案。
适合人群:全栈开发者、Java/Python后端、阿里云生态用户、企业团队
📦 安装与配置步骤
- VS Code 端安装
- 扩展商店搜索「通义灵码」,安装阿里云官方插件
- 点击侧边栏通义灵码图标,选择「阿里云账号登录」,扫码完成授权
- 登录后自动开通个人免费版,无额外认证步骤
- JetBrains 全家桶安装(IDEA/PyCharm等)
- 打开
Settings → Plugins,搜索「TONGYI Lingma」安装 - 重启IDE后,右侧工具栏出现通义灵码面板,扫码登录即可
- 打开
- Agent 模式开启
- 在对话面板顶部切换「Agent 2.0」模式,开启后即可获得代码库读取、文件编辑、终端执行能力
- 首次使用终端执行需在弹窗中确认授权,允许 Agent 运行命令
💡 核心使用方法
- 全项目代码问答:直接提问「项目里用户登录接口的鉴权逻辑是什么」,Agent 会自动检索整个代码库并给出答案
- 自动生成单元测试:选中函数代码,输入「为这段代码生成JUnit5单元测试,覆盖边界条件」
- 漏洞扫描:点击面板「安全检测」按钮,自动扫描当前项目代码中的安全漏洞并给出修复方案
- 代码重构:输入「将当前文件的工具类拆分为三个模块,保持接口兼容」,Agent 会自动修改对应文件
3. 文心快码 Comate(百度)⭐⭐⭐⭐
研发厂商:百度
免费政策:个人版完全免费,无次数限制,30天试用后继续免费使用核心功能
核心功能:
- 自动Debug天花板:语法/逻辑/环境错误全类型识别,一键给出多种修复方案
- SPEC规范驱动开发:先生成开发规范文档,再按规范写代码,减少AI幻觉
- 跨文件重构:自动检索关联文件,同步更新调用逻辑
- 支持VS Code插件与独立客户端
网友好评度:以"自动Debug封神"著称,IDC评为工程化落地满分工具。开发者反馈"排错效率提升3倍",尤其适合C++、Java等复杂工程开发。
适合人群:后端工程师、复杂项目维护、Debug需求高频的开发者
📦 安装与配置步骤
- 打开 VS Code 扩展商店,搜索「文心快码 Comate」安装官方插件
- 点击侧边栏 Comate 图标,使用百度账号扫码登录
- 登录后自动激活个人免费版,核心功能永久免费
- 可选配置:在设置中开启「自动补全」「实时代码纠错」,调整补全灵敏度
💡 核心使用方法
- 一键 Debug:代码运行报错后,选中报错信息和对应代码,输入「帮我排查这个错误的原因并给出修复方案」,支持逻辑错误、依赖错误、环境错误等多类型排查
- SPEC 规范驱动开发:在对话中输入「生成一个订单系统的开发规范文档」,生成确认后,后续代码生成都会严格遵循该规范,减少幻觉
- 跨文件重构:输入「将所有接口的超时时间统一修改为30秒」,Agent 会自动检索所有相关文件并批量修改
- 行内补全:编码过程中自动生成代码建议,支持函数级、块级补全
4. CodeGeeX(智谱AI)⭐⭐⭐⭐
研发厂商:智谱AI
免费政策:完全开源免费,支持本地部署,云端版个人永久免费
核心功能:
- 支持100+编程语言,代码补全、解释、翻译、生成全覆盖
- 开源可私有化部署,代码数据不出本地
- 兼容VS Code、JetBrains、Vim等主流IDE
- 代码解释与注释生成能力突出
网友好评度:开源社区口碑优秀,GitHub星标数持续增长。用户评价"免费无套路、多语言支持全、私有化部署放心",是企业内网开发的首选免费方案。
适合人群:隐私敏感型开发者、企业内网环境、多语言开发团队
📦 安装与配置步骤
- 云端版(开箱即用)
- VS Code 扩展搜索「CodeGeeX」安装,注册智谱账号登录即可
- 支持 JetBrains、Vim、Visual Studio 等全平台IDE插件
- 本地私有化部署(进阶)
- 从 GitHub 拉取 CodeGeeX 开源仓库
- 通过 HuggingFace 下载对应参数的模型权重
- 部署推理服务后,在插件中配置本地服务地址即可离线使用
💡 核心使用方法
- 代码翻译:选中一段Java代码,输入「翻译成Python实现」,自动转换语法与依赖
- 批量注释生成:选中代码块,右键选择「生成逐行注释」,自动添加中文注释
- 代码解释:针对复杂算法代码,可逐步拆解讲解执行逻辑
- 支持完全离线模式,配置本地模型后断网也可正常使用
二、海外云端免费编程Agent(额度充足·能力强劲)
1. Codeium / Windsurf ⭐⭐⭐⭐⭐
研发厂商:Codeium Inc.
免费政策:Tab代码补全永久不限量;免费版每日5次Cascade多文件智能体、每月25次顶级模型调用
核心功能:
- Cascade Agent模式:任务级自动化,多文件自主编辑与重构
- Flow模式:自主规划执行步骤,处理复杂开发任务
- 支持70+编程语言,兼容所有主流IDE
- 代码搜索与知识库问答
网友好评度:全球公认"无附加条件的最佳免费选项"。Product Hunt评分4.9/5,开发者盛赞"补全质量接近Copilot但完全免费",是学生和独立开发者的标配工具。
适合人群:全栈开发者、多语言编程、预算为零的独立开发者
📦 安装与配置步骤
- VS Code 插件安装
- 扩展商店搜索「Codeium」安装官方插件
- 点击侧边栏 Codeium 图标,选择「Sign In」,跳转官网用邮箱/Google账号注册登录
- 登录后回到 VS Code 自动激活免费版,代码补全永久无限制
- Windsurf IDE 独立安装
- 访问 Windsurf 官网下载客户端(Windows/macOS/Linux)
- 安装后登录 Codeium 账号即可使用完整 Agent 能力
- 基础配置
- 开启「Autocomplete」自动补全
- 可配置排除文件路径,避免对
node_modules等目录生成无效建议
💡 核心使用方法
- Cascade Agent 多文件编辑:在对话中输入「给项目添加一个用户头像上传功能,包含后端接口和前端页面」,Agent 会自动规划步骤,跨文件修改代码
- Flow 模式:开启后 Agent 会自主迭代优化代码,直到完成复杂开发任务
- 代码搜索:输入「@搜索 数据库连接配置」,快速定位项目中的相关代码
- 行内补全:编码时实时生成建议,
Tab采纳,支持70+编程语言
2. Amazon Q Developer(原CodeWhisperer)⭐⭐⭐⭐☆
研发厂商:亚马逊AWS
免费政策:个人开发者完全免费,无限制代码补全 + 每月50次Agent请求 + 每月1000行代码转换
核心功能:
- 内置安全漏洞扫描,自动检测代码安全Bug
- AWS服务代码生成深度优化,云原生开发神器
- 支持15种主流编程语言
- 代码重构与现代化转换能力
网友好评度:AWS开发者必装工具,安全扫描功能广受好评。用户评价"免费且功能不缩水,AWS项目开发效率翻倍",是云原生开发的免费首选。
适合人群:云原生开发者、AWS用户、注重代码安全的工程师
📦 安装与配置步骤
- VS Code 扩展搜索「Amazon Q」安装AWS官方插件
- 点击侧边栏 Amazon Q 图标,选择「个人开发者登录」,使用亚马逊账号注册登录(无需绑定信用卡)
- 登录后自动开通免费版,代码补全无限制,每月赠送50次 Agent 请求额度
- 可选配置:开启「自动安全扫描」,提交代码前自动检测漏洞
💡 核心使用方法
- 注释驱动代码生成:写一句功能注释,自动生成对应代码块
- Agent 代码库问答:输入「解释当前项目的部署流程」,Agent 会读取整个代码库并给出解答
- 安全扫描:点击「Run Security Scan」,自动检测代码中的OWASP Top 10漏洞、密钥泄露等风险
- 代码现代化:输入「将这段Java 8代码升级为Java 17的Stream写法」,自动完成语法升级
3. Gemini Code Assist ⭐⭐⭐⭐
研发厂商:Google
免费政策:每日6000次请求,月度近18万次免费额度,免费额度天花板
核心功能:
- Gemini CLI终端Agent:支持Docker沙箱执行、MCP工具连接
- 100万Token超长上下文,可加载整个代码库
- 多模态支持:可理解截图、架构图并生成代码
- Google Cloud生态深度集成
网友好评度:以"额度最慷慨"著称,每日数千次的免费请求量远超竞品。开发者评价"算法与底层代码生成能力极强,长上下文无敌",适合处理大型代码库。
适合人群:算法工程师、大型项目开发、Google Cloud用户
📦 安装与配置步骤
- VS Code 扩展搜索「Gemini Code Assist」安装Google官方插件
- 使用Google账号登录,免费版每日6000次请求额度
- CLI 版本安装(可选,终端Agent)
- 执行
npm install -g gemini-cli安装终端版 - 配置 Gemini API Key 即可在终端使用完整 Agent 能力
- 执行
- 配置长上下文:在设置中开启「全项目索引」,支持加载百万Token级别的代码库
💡 核心使用方法
- 大代码库分析:直接提问「梳理整个项目的架构设计和模块依赖关系」,支持百万行代码级别的分析
- 多模态生成:上传架构图/UI截图,输入「根据这张设计图生成React组件代码」
- 终端 Agent:在命令行输入
gemini "修复当前项目的启动报错",自动排查并修改代码 - 算法优化:针对算法题、性能瓶颈代码,给出多种优化方案并分析时间复杂度
4. Cursor(免费版)⭐⭐⭐☆
研发厂商:Cursor Team
免费政策:每月2000次代码补全 + 50次Premium高级Agent会话,新用户7天Pro无限试用
核心功能:
- Agent模式:多文件自主编辑、终端命令执行
- Cmd+K快速生成、Cmd+L对话、Cmd+I多文件编辑
- 支持GPT-4o、Claude等顶级模型
- 基于VS Code构建,插件生态兼容
网友好评度:曾经的AI IDE王者,免费版额度足够轻度使用。社区反馈"体验一流但免费额度不够重度开发",适合作为入门体验或辅助工具。
适合人群:AI编程入门者、轻度开发、想体验顶级模型的开发者
📦 安装与配置步骤
- 访问 Cursor 官网下载对应系统的安装包,双击安装
- 启动后使用邮箱注册登录,新用户赠送7天Pro无限试用,到期后自动切换为免费版
- 免费版额度:每月2000次补全 + 50次高级Agent会话
- 基础配置:
Settings → Models可选择默认模型,免费版支持GPT-4o mini等模型
💡 核心使用方法
- 快速编辑:选中代码后按
Cmd/Ctrl + K,输入修改指令即可快速编辑 - 对话问答:按
Cmd/Ctrl + L唤起对话面板,可针对当前文件或全项目提问 - Agent 模式:输入
@agent指令后描述任务,Agent 会自动多文件编辑、执行终端命令 - 多文件批量编辑:按
Cmd/Ctrl + I选中多个文件,批量执行重构、修改配置等操作
三、开源本地部署方案(彻底免费·完全无限制)
以下方案100%免费且无任何Token限制,代码数据完全本地运行,永不泄露。唯一成本是你的电脑硬件。
1. Ollama + Continue.dev ⭐⭐⭐⭐⭐
方案构成:Ollama(本地模型运行) + Continue(VS Code插件)
免费政策:完全开源免费,Apache 2.0协议,无任何使用限制
核心功能:
- 本地运行Qwen3-Coder、DeepSeek-Coder、CodeLlama等开源代码模型
- VS Code内聊天、补全、多文件编辑、代码库问答全功能
- 支持Agent模式,可自主修改文件、执行命令
- 8GB显存即可流畅运行7B模型,24GB可跑80B MoE模型
网友好评度:本地免费方案的"黄金组合",开发者社区口碑炸裂。被称为"零成本替代GitHub Copilot",隐私党与离线开发者的终极方案。
适合人群:隐私敏感开发者、离线开发环境、有一定动手能力的极客
📦 安装与配置步骤
第一步:安装 Ollama 本地模型运行环境
- 访问 Ollama 官网下载对应系统安装包,Windows/macOS 双击安装,Linux 执行一键安装脚本:
curl -fsSL https://ollama.com/install.sh | sh - 安装完成后,终端执行
ollama -v验证是否安装成功 - 拉取代码专用大模型(推荐新手用7B参数,显存≥8GB即可运行):
# 中文友好的国产代码模型,推荐首选 ollama pull qwen3-coder:7b # 代码能力极强的开源模型 ollama pull deepseek-coder-v2:7b # 大显存用户可选34B版本,能力更强 # ollama pull qwen3-coder:34b - 执行
ollama run qwen3-coder:7b测试模型是否正常运行
第二步:安装并配置 Continue 插件
- VS Code 扩展商店搜索「Continue」安装官方插件
- 安装后点击侧边栏 Continue 图标,打开配置文件
config.json - 将配置修改为本地 Ollama 模型,示例配置:
{ "models": [ { "title": "Qwen3-Coder 7B", "provider": "ollama", "model": "qwen3-coder:7b", "apiBase": "http://localhost:11434" } ], "tabAutocompleteModel": { "title": "Qwen3-Coder 7B", "provider": "ollama", "model": "qwen3-coder:7b" } } - 保存配置后,重启 VS Code 即可生效
💡 核心使用方法
- 代码补全:编码时自动弹出补全建议,
Tab键采纳,完全本地运行无延迟 - 代码问答:选中代码后在 Continue 面板提问,支持解释、优化、重构、生成单测
- Agent 模式:输入
/edit指令,描述修改需求,自动修改当前文件 - 代码库索引:执行
/codebase构建本地代码库索引,实现全项目问答 - 彻底离线无限制,无任何Token额度,代码数据永不离开本机
2. Goose(Block开源)⭐⭐⭐⭐☆
研发厂商:Block(原Square)
免费政策:完全开源免费,Apache 2.0协议,GitHub 26k+ Stars
核心功能:
- 终端式AI编程Agent,功能对标Claude Code
- 插件化架构:支持文件操作、网页浏览、数据库查询等扩展
- 支持Claude、GPT-4及本地模型
- 完全本地运行,代码数据不出机器
网友好评度:被誉为"Claude Code免费平替",开源社区增长速度惊人。开发者评价"终端体验丝滑,插件生态发展迅猛,离线也能用"。
适合人群:终端党、后端工程师、隐私优先的开发者
📦 安装与配置步骤
- 安装方式(三选一)
- macOS:
brew install block/tap/goose - Windows/Linux:从 GitHub Releases 下载对应二进制包,解压后添加到系统PATH
- 源码安装:
go install github.com/block/goose/cmd/goose@latest
- macOS:
- 配置本地模型(实现完全免费)
- 确保本地 Ollama 服务已启动并拉取代码模型
- 终端执行
goose configure - 选择模型提供商为 Ollama,配置本地地址
http://localhost:11434 - 选择使用的模型,如
qwen3-coder:7b
- 验证安装:终端输入
goose --version确认安装成功
💡 核心使用方法
- 基础使用:在项目目录下执行
goose启动会话,输入需求即可 - 常用场景指令:
给当前项目添加README文档:自动分析项目并生成说明文档修复项目启动时的依赖报错:自动读取报错并修改代码运行单元测试并修复失败用例:自动执行测试并迭代修复
- 插件扩展:可安装文件操作、网页浏览、数据库查询等插件,扩展Agent能力
- 完全终端化操作,适合后端开发者、运维工程师使用
3. Aider ⭐⭐⭐⭐
研发厂商:开源社区
免费政策:完全开源免费,Apache 2.0协议,自备API Key或本地模型
核心功能:
- 终端编程Agent,Git原生集成,每次修改自动提交
- Token效率极高,比Claude Code省4.2倍Token
- Architect模式:先架构设计再编码,减少AI幻觉
- 支持Claude、GPT-4o、Gemini及本地模型
网友好评度:终端Agent口碑之王,Token效率封神。资深开发者评价"最懂Git的AI编程工具,适合CI/CD流水线集成"。
适合人群:后端工程师、终端重度用户、CI自动化场景
📦 安装与配置步骤
- 环境要求:Python 3.10+
- 安装 Aider:
pip install aider-chat - 配置本地模型(实现零成本使用)
- 确保本地 Ollama 已启动并拉取了代码模型
- 启动 Aider 时指定本地模型:
aider --ollama --model deepseek-coder-v2:7b - 可选:如需使用云端免费API,可配置对应环境变量
💡 核心使用方法
- 基础使用:在项目目录下执行
aider 文件名,即可针对指定文件进行编码 - Architect 架构模式:添加
--architect参数,先生成架构设计再编码,大幅减少幻觉 - Git 原生集成:每次修改自动生成 Git 提交,可随时回滚,支持代码版本对比
- 批量修改:一次性传入多个文件,执行跨文件重构
- Token 效率极高,比同类工具节省数倍Token消耗,本地运行完全无成本
4. Cline(VS Code扩展)⭐⭐⭐⭐
研发厂商:开源社区
免费政策:扩展完全免费,10人以内团队永久免费,自备API Key
核心功能:
- VS Code内嵌Agent,无需切换编辑器
- 支持多模型自由切换,无平台加价
- 多文件编辑、终端执行、代码重构全支持
- 团队版支持协作与权限管理
网友好评度:VS Code生态最受欢迎的免费Agent插件。用户评价"无缝融入现有工作流,想换什么模型就换什么模型",10人小团队可省数千元年费。
适合人群:VS Code用户、小团队开发、喜欢灵活配置的开发者
📦 安装与配置步骤
- VS Code 扩展商店搜索「Cline」安装开源插件
- 打开插件设置,配置模型提供商(完全免费方案选 Ollama)
- 配置本地 Ollama 地址与模型名称,例如
qwen3-coder:7b - 保存配置后,侧边栏点击 Cline 图标即可开始使用
💡 核心使用方法
- 无需离开 VS Code,在编辑器内直接使用 Agent 能力
- 支持多文件创建与编辑、终端命令执行、网页浏览等能力
- 可自由切换不同模型,按需选择速度优先或质量优先
- 10人以内小团队完全免费,支持团队协作与权限管理
- 适合习惯 VS Code 工作流,不想切换工具的开发者
四、选型速查表
| 工具 | 类型 | 完全无限制 | 中文友好 | Agent能力 | 上手难度 | 推荐指数 |
|---|---|---|---|---|---|---|
| Trae | 国内云端 | 接近无限制 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | 极低 | ⭐⭐⭐⭐⭐ |
| 通义灵码 | 国内云端 | 每日限额充足 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ | 极低 | ⭐⭐⭐⭐☆ |
| Codeium | 海外云端 | 补全无限 | ⭐⭐⭐ | ⭐⭐⭐⭐ | 极低 | ⭐⭐⭐⭐⭐ |
| Amazon Q | 海外云端 | 补全无限 | ⭐⭐⭐ | ⭐⭐⭐☆ | 低 | ⭐⭐⭐⭐ |
| Ollama+Continue | 本地开源 | ✅ 彻底无限 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | 中等 | ⭐⭐⭐⭐⭐ |
| Goose | 本地开源 | ✅ 彻底无限 | ⭐⭐⭐ | ⭐⭐⭐⭐ | 中等 | ⭐⭐⭐⭐☆ |
| Aider | 本地开源 | ✅ 彻底无限 | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ | 中等 | ⭐⭐⭐⭐ |
五、网友总结的最佳免费组合方案
方案一:国内开发者懒人包(零配置·全免费)
Trae(主力开发) + 通义灵码(Debug辅助) + CodeGeeX(备用补全)
- 日常编码用Trae的SOLO模式快速生成项目
- 排错调优用通义灵码的Agent模式深度分析
- 备用方案保证服务稳定,全程零成本
方案二:海外开发者性价比之王
Codeium(日常补全) + Gemini CLI(复杂推理) + Amazon Q(安全扫描)
- 日常写代码Codeium无限补全够用
- 复杂算法与大代码库用Gemini长上下文
- 提交前用Amazon Q做安全审计
方案三:隐私党终极方案(彻底离线)
Ollama + Qwen3-Coder + Continue.dev
- 代码永不离开本机,涉密项目放心用
- 一次配置永久免费,无任何订阅套路
- 8GB显存笔记本即可流畅运行
六、避坑与常见问题排查
- 注意"免费"与"无限免费"的区别:很多工具宣称免费,但有每日/每月额度限制,重度开发可能不够用
- 本地方案有硬件门槛:7B模型需8GB显存,34B以上建议16GB+显存,纯CPU运行速度较慢;显存不足可使用量化版本模型(如q4_k_m)
- 自备API Key方案需自行承担模型费用:Aider、Cline等框架本身免费,但调用云端API仍需支付模型厂商费用(可搭配本地模型实现完全免费)
- 数据安全优先:公司代码建议使用本地部署方案或经过企业安全审核的工具
- 插件不生效排查:
- 检查网络连接是否正常,海外工具可能需要网络代理
- 确认账号登录状态,部分工具登录过期会导致功能失效
- 本地模型方案检查 Ollama 服务是否正常启动,端口11434是否被占用
- 补全速度慢排查:
- 云端方案检查网络延迟,可切换国内节点
- 本地方案可降低模型参数,或使用更高量化比的模型版本
更多推荐

所有评论(0)