前言:

随着人工智能的火速发展,AI相关的技术越来越成熟,智能体(AI Agents)正逐渐成为人与大模型(如大语言模型)交互的主要方式。智能体是能够执行任务、解决问题并提供服务的 AI 系统,它们通过模拟人类的行为和决策过程,使得与大模型的交互更加自然、高效和个性化。

在这里插入图片描述

一个基于大模型的AI Agent系统可以拆分 LLM(大模型)、记忆(Memory)、任务规划(Planning)以及工具使用(Tool) 的集合。在LLM为基础的AI Agent系统中,大模型为AI Agent系统的大脑负责计算,并需要其他组件进行辅助。

在这里插入图片描述

今天给大家来介绍一款 - 华为云Flexus与开源项目DeepSeek的深度融合产品,为AI Agent的搭建提供了强大的底层能力。而Dify平台作为一站式的大模型应用开发工具,也让智能体的构建更加轻量与灵活。


一、什么是华为云推出的Dify-LLM应用开发平台:

在这里插入图片描述

随着生成式AI技术的快速发展,怎么样快速构建和部署大模型应用成为各行各业关注的焦点。最近,由华为云推出的Dify-LLM应用开发平台,结合Flexus X实例的卓越性能,为用户提供了一站式生成式AI的解决方案。

在这里插入图片描述

  • ①. 该解决方案可以在华为云上快速部署单机版、高可用版Dify LLM应用开发平台,同时支持将在Dify应用开发平台创建的的文档知识库挂载华为云对象存储服务 OBS桶。

  • ②. Dify是一款开源的大语言模型(LLM)应用开发平台。它融合了后端即服务(Backend as Service)和LLMOps的理念,使开发者可以快速搭建生产级的生成式AI应用。

在这里插入图片描述

  • ③. Flexus X实例是华为云基于擎天架构、瑶光云脑、盘古大模型等核心技术打造的全新云服务器产品。

在这里插入图片描述

本文将从单机部署搭建到AI Agent开发,从0到1来实现华为云Dify平台的部署与开发流程,并重点展示Flexus X实例在算力、成本、可靠性等方面的核心优势。


二、华为云Dify-LLM应用开发平台实战:

首先需要进行华为云的实名认证,并且需要先保证充值10元左右,因为在实验的过程中需要开通DeepSeek商用大模型,是需要收费的,一般在5-10元左右,这里建议给个优惠券更好。

在这里插入图片描述

2.1 华为云账号注册与实名认证:

可以打开以下链接先进行华为云账户的注册与实名认证,人个中心,注册推荐使用手机号就可以,密码一定要记住,否则找回时比较流程繁琐。

在这里插入图片描述

这里推荐使用“人个认证”,可以选“身份证”进行实名认证,也比较简单,完成注册华为云账号并完成实名认证。接下来就是要确保账户余额充足(建议不低于10元)。千万要先进行充值,否则在部署时,会出现失败的情况。

在这里插入图片描述

充值也是比较简单一点,华为云的收银台也是提供了多种充值的渠道,我这里使用的是支付宝充值。

在这里插入图片描述


2.2 开通模型服务:

在这里插入图片描述

若需接入DeepSeek等商用大模型,需在 华为云ModelArts Studio控制台开通在线推理服务(支持免费体验或商用按需计费)。

在这里插入图片描述

选择"模型推理 -> 在线推理",开通DeepSeek-V3-32K大模型的商用服务(未使用服务时不会产生费用),开通以后可以进行“在线体验”一下。

在这里插入图片描述

在这里插入图片描述


2.3 在ModelArts Studio(MaaS)预置服务中开通商用服务的作用:

MaaS预置服务的商用服务为企业用户提供高性能、高可用的推理API服务,支持按Token用量计费的模式。该服务适用于需要商用级稳定性、更高调用频次和专业支持的场景:

在这里插入图片描述

  • ①. 企业智能客服:企业希望利用推理API优化客服系统,实现智能问答、意图识别,提升客服效率与客户满意度。
  • ②. 内容创作辅助:媒体、广告公司借助推理API进行文案创作、创意生成,提高内容产出的效率与质量。
  • ③. 智能数据分析:金融、电商企业通过推理API对海量数据深度分析,挖掘数据价值,辅助决策制定。

在这里插入图片描述


2.3 商用模型在线体验对比 - 模型定位与架构:

在这里插入图片描述

  • ①. DeepSeek-V3-32K‌:
    采用 ‌混合专家架构(MoE)‌,总参数高达 ‌6710亿‌,但对每个输入的激活参数仅约 ‌370亿‌,显著降低推理成本;支持多模态输入(文本/图像/未来音视频),强调高效扩展性和通用任务处理能力,适合轻量级推理与实时交互场景。
  • ②. DeepSeek-R1-32K‌:
    采用 ‌密集参数架构‌(参数规模约 ‌780亿‌),全量参数激活;专为复杂逻辑推理设计(如数学证明、代码生成),通过强化学习优化深度任务性能,在长上下文推理中稳定性更强。

在这里插入图片描述


三、单机部署Dify-LLM平台:

解决方案帮助快速部署单机版、高可用版Dify LLM应用开发平台,同时支持将在Dify应用开发平台创建的的文档知识库挂载华为云对象存储服务 OBS桶。

可以直接访问快速搭建Dify-LLM应用开发平台-华为云,在“方案架构”里面选择“一键部署(社区单机部署)”。

在这里插入图片描述

这里可以看到有一个“预估成本”,单机:2~5元( 按需计费:Flexus云服务器X实例0.95元/小时,弹性公网IP EIP 0.80元/GB,体验本方案预计成本不超过5元)。

在这里插入图片描述

第一步是“选择模板”:

这里默认会内置一个模板“已有模板”,同时,也会提供一个模板的URL,也是一个默认提供好的json文件:

在这里插入图片描述

可以看到这里会规定一些相关的配置参数:

  • ①. 实例规格:弹性云服务器 ECS规格请参考部署指南配置,默认:x1.8u.16g(8核16G内存)。
  • ②. 云服务器系统盘:云服务器系统盘大小,磁盘类型默认为高IO,单位:GB,取值范围为40-1,024,不支持缩盘,默认:100。
  • ③. 网络配置:弹性公网带宽大小,该模板计费方式为按流量计费,单位:Mbit/s,取值范围:1-300Mbit/s,默认:300。

第二步是“参数配置”:

上面是名称与描述相关的参数,资源栈名称不能重名,最好自定义一下,不过,建议这里搞一个ajax自动校验的功能,看看是否重名了,这样交互的体验更好一点。

在这里插入图片描述

下面可以看到有一些参数的设置,是不是跟上面那个json的配置文件很像呢?不过,我这里也是在测试阶段,就用默认的参数即可,先体验一把再说,如果有特殊要求,可以进行修改,比如访问的人多,可以合理调整一下带宽。

在这里插入图片描述

开启加密,因为初次开启加密功能会自动为创建“aos/default”默认密钥,可以授权资源编排服务创建并使用密钥。


第三步“资源栈设置”:

“IAM权限委托”可明确定义RF服务在资源栈上可执行的所有操作(如创建、更新、删除资源栈等),如果委托权限不足,有可能导致后续部署、生成执行计划等操作失败。

在这里插入图片描述

这里有一个IAM权限委托的选择:

  • ①. 如果是测试用户,可以不进行创建。
  • ②. 如果是公司的账号,只有一个的话,建议创建,可以更精细化控制权限。

在这里插入图片描述

另外,建议勾选“回滚设置”,开启回滚表示操作失败时,会自动回滚至系统所保存的上一个成功的资源状态,但是在创建后可在资源栈详情页面修改。

“删除保护”可以防止资源栈被意外删除,创建后可在资源栈详情页面修改。

在这里插入图片描述


第四步“配置确认”:

资源编排服务使用免费,但资源栈内包含的资源可能需要付费,可通过创建执行计划后获取预估费用。

在这里插入图片描述

这个页面是对前面三个步骤填写的内容做一个确认操作的页面,就是密码这个是打*号了,无法去确认,可以优化一下,再一次输入确认密码的话,这样更安全。

这里可以直接点“直接部署资源栈”,也可以点击“创建执行计划”(推荐),这样就可以看到比较详细的部署流程,万一有错误,可以及时的发现与调整。

在这里插入图片描述

等到“事件”中出现“Apply required resource success”,表示该解决方案资源已发放完成。

在这里插入图片描述

确认参数后启动部署创建资源栈,约10分钟完成云服务器、安全组等资源部署,通过输出链接访问Dify Web界面。

在这里插入图片描述


四、总结:

随着人工智能技术的飞速发展,AI智能体(AI Agent)凭借其自主感知、决策和执行能力,正成为人机交互的核心载体,这类智能实体通过模拟人类行为模式,显著提升了大模型交互的自然性与效率,构建AI智能体系统需四大核心组件支撑:

‌- ①. 大语言模型(LLM)‌:作为系统“大脑”,承担核心计算与推理任务
‌- ②. 记忆模块‌:实现经验存储与上下文关联
‌- ③. 任务规划‌:自主拆解目标并生成执行路径
‌- ④. 工具调用‌:整合外部资源完成任务执行

华为云推出的Dify-LLM应用开发平台,深度融合Flexus X实例的擎天架构与盘古大模型能力,为开发者提供了一站式智能体构建解决方案。该平台支持:

在这里插入图片描述

‌- ①. 快速部署‌:10分钟完成单机/高可用架构搭建,弹性云服务器成本低至0.95元/小时
‌- ②. 生态集成‌:无缝对接DeepSeek商用大模型及华为云OBS对象存储
‌- ③. 企业级支持‌:通过ModelArts Studio提供高可靠推理API服务,满足智能客服、内容创作等场景需求

在这里插入图片描述

通过实操验证,开发者仅需完成实名认证、模型服务开通、资源栈配置三步,即可在华为云上高效部署智能体应用开发环境。Flexus X实例在算力性能与成本控制上的突破,为AI智能体从实验室走向产业化提供了坚实基础。

828 B2B企业节已经开幕,汇聚千余款华为云旗下热门数智产品,更带来满额赠、专属礼包、储值返券等重磅权益玩法,是中小企业和开发者上云的好时机,建议密切关注官方渠道,及时获取最新活动信息,采购最实惠的云产品和最新的大模型服务!

Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐