国内大模型发展趋势|5月份解读

大厂狂卷Agent

在今年年初DeepSeek带来的大模型低成本推理能力的进步,直接影响了以Manus为代表的AI Agent的发展。

4月Manus完成了7500万美元的融资,估值暴涨五倍。Mansu验证了市场对Agent的狂热,于此同时,国内百度、腾讯、字节等也不断加码,AI Agent成为行业认定的下一个方向。

自2024年以来,全球AI Agent赛道的融资金额已突破665亿元人民币。AI Agent 在成为2025名副其实的竞争风口。

腾讯和字节跳动在短短一个月内先后将核心资源投向Agent领域。

腾讯在5月21日的AI产业峰会上宣布将企业级大模型知识库升级为“智能体开发平台”,强调智能体自主拆解任务、调用工具的能力。

在今年一季度财报会上,马化腾表示,腾讯在Agent的布局主要有两个方面,一是通用性Agent,在元宝、ima等AI原生产品中构建,包括腾讯推出的Qbot和上线的“AI高考通”,结合DeepSeek与腾讯混元模型,尝试在C端寻找Agent的高频场景。

另一方面则根植于微信独特生态的Agent,深度链接微信生态要素,与通用性Agent形成差异化优势。

而字节跳动则通过集成DeepSeek R1的“飞书知识问答”将Agent深嵌于B端办公场景中。火山引擎的Data Agent,专注数据分析和智能营销,不断在行业落地,在6月11日FORCE原动力大会上将再度更新。

可以看到,大厂正试图在通用性和垂直性之间寻找Agent的最佳表达形式,也预示着AI产品形态将更多朝智能助手而非模型展示倾斜。

这股热潮的背后,是AI商业化的现实需求。只有让模型具备“自主拆任务、调工具、做决策”的能力,才能真正帮用户解决问题。这种“能干活”的Agent,被看作是AI价值落地的关键。

实际上,“狂卷Agent”其实是大厂们在大模型之后的另一个战场。从“拼模型”转向“拼Agent”,本质上是模型价值转化为业务能力的开始。

未来Agent是否能真正承担起“AI终端产品”的角色,将决定哪些厂商能够在这场AI长期战中占据上风。2025年或许真的会成为“AI Agent元年”,因为这才是大模型商业化的真实起点。

国产开源模型,赶超全球

国产开源大模型在2025年5月呈现明显的加速赶超态势,以DeepSeek-R1-0528的开源和阿里巴巴Qwen3的持续迭代为代表,不仅技术性能直逼国际顶尖水平,更通过开源生态的构建推动全球AI格局的重塑。

DeepSeek-R1-0528的发布是国产模型深度进化的标志。它在5月底开源后,凭借660B参数量和优化的推理架构,实现了单任务30-60分钟的持续思考能力,提升了复杂问题处理的上限。除此之外,DeepSeek 不仅完整开源了模型权重,还公布了训练数据策略、推理方式、评测基准和部署工具,促进了开发者的快速落地和生态二次开发。这种“高质量开源”已经不再是表面上的代码开放,而是实质性地推动了国产模型走向工程实用化、产品级落地化。

阿里巴巴的Qwen3虽发布于4月末,但在5月持续释放影响力,其混合专家架构和“快慢双模推理”机制更是开创了国产模型的新态势。不仅如此,Qwen3 同样提供了完整的模型家族,覆盖从轻量级模型到超大参数模型多个尺寸版本,在开源性能测试榜单中更是表现亮眼,不难看出,国内模型在多任务通用性、推理稳定性等方面已具备全球竞争力。

值得注意的是,国产开源模型的发展不仅体现在模型性能的提升,更体现在背后技术体系和工程能力的成熟。无论是训练效率优化、并行训练架构,还是多模态集成、工具链支持,国内团队正在构建一套自主可控、具有中国特色的技术生态。这使得国产大模型逐渐从“追随者”转变为“引领者”的姿态,也为国内 AI 应用提供了更为坚实的技术底座。

总体看来,5月的国产开源模型进展不仅是一次技术层面的突破,更是对外界质疑“国产大模型只能追随”的有力回应。随着 DeepSeek 和 Qwen3 等高质量开源模型的发布,中国在大模型竞赛中已不再仅是全球开源成果的“使用者”,而逐步成为推动全球开源社区演进的重要“贡献者”。这不仅意味着中国在 AI 基础设施上的技术自信正逐步建立,也预示着未来国产模型将在全球生态中发挥更加重要的角色。

“六小龙”变“四小虎”,AI创企掉队

曾经风光无限的”六小龙“,在2025年行将过半之际,已从舆论焦点中淡出,其核心结构也发生了显著变化,缩减为“四小虎”(智谱AI、MiniMax、月之暗面、阶跃星辰)。这一转变的核心在于部分创企在激烈的大模型竞赛中已实质掉队。

零一万物和百川智能掉队明显。零一万物将超大模型训练任务交给阿里,不再追逐通用人工智能,转向应用层开发,创始人李开复坦言“只有大厂能够烧超大模型”,道出了初创公司在资源密集型预训练上的巨大成本和性价比劣势。百川智能则选择专注于医疗等垂直赛道,其创始人王小川曾提出百川智能的底层模型对标OpenAI,但如今已进入静默期,不再更新。两者在战略、技术、目标上,都已不再符合“六小龙”最初设定的“争夺国产OpenAI”的高门槛标准。

留下的四家,发展势头也大不如前。这些公司虽然还未放弃预训练,但模型节奏明显放缓,技术成果也被新入局的DeepSeek等开源玩家抢占风头。在OpenAI快速迭代的背景下,国内这些创企的技术差距也被进一步放大。同时,它们在资本市场的吸引力也大幅减弱,目前除了智谱尚有融资消息,其余三家已沉寂数月。

商业化能力的滞后,是“六小龙”风格不再的核心问题。本身大模型的研发就是烧钱游戏,像OpenAI靠ChatGPT的商业版本已有千万级付费用户支撑高昂研发投入,而六小龙则鲜有公开收入数据。在大厂相继all in大模型后,小团队曾经的技术已被轻易追平乃至反超。

技术人才的流动,也反映了这轮洗牌的方向。零一万物和百川智能的核心高管接连离职,或回流至大厂,或选择自行创业。其他“小龙”也面临核心人才被挖角或流失的问题。AI创业公司逐渐失去了对顶级人才的吸引力,反之也进一步压缩了它们的技术创新空间。

“六小龙”向“四小虎”的转变,也可以看到一个更广泛的信号,国内AI创企在大模型时代的黄金窗口正在收缩。在资本收紧、算力集中、技术外溢加剧的背景下,能否转向创新,或将决定这些企业的生死存亡。AI创业公司要想走得更远,必须找到自己的新故事。

国内主要大模型进展

DeepSeek

5 月 29 日,DeepSeek 上线 DeepSeek-R1-0528 模型,这是其 R1 模型的首次重要升级。该模型仍以 DeepSeek V3 模型为基座,但整体表现已接近 o3 和 Gemini-2.5-Pro 等顶尖模型,其思维深度与推理能力显著提升,针对议论文、小说、散文等文体进行了进一步优化,能够输出篇幅更长、结构内容更完整的长篇作品,同时呈现出更加贴近人类偏好的写作风格。

同时,DeepSeek 推出了基于新版 R1 模型训练的小模型 Qwen3-8B,其表示以此得到的模型能力比肩 2350 亿参数的 Qwen3-235B。

阿里

5月,阿里在AI领域展现了全方位的布局和持续的创新能力。从财报中可以看出,AI已经成为阿里业务增长的重要驱动力,特别是在阿里云收入增长方面。包括在AI辅助开发领域上,通义灵码2.5版本和通义灵码AI IDE的发布。同时,在AI技术创新和普惠AI方面,主要是视觉理解模型qwen-vl-plus-2025-05-07快照版的推出和qwen-max、plus、turbo资源包的价格调整。阿里云百炼平台的持续更新,进一步丰富了阿里AI生态。

在具体产品层面,5月夸克AI迎来重大升级,推出“深度研究”功能,通过通义千问大模型将专业研究任务从数天压缩至分钟级,并生成结构化报告。该功能已支持PDF导出,每日限量开放体验,重点覆盖学术课题与行业分析场景。

5月27日,夸克上线行业首个高考志愿“深度搜索”能力,依托自建的高考知识库(含全国千所院校就业数据及城市就业数据),结合动态检索与多轮校验技术,为用户提供自然语言问答式填报建议,日均服务量突破百万次。同日,夸克健康大模型在国家副主任医师职称考试中超越合格线,覆盖12个学科中的4个达到主任医师水平,病例分析题准确率提升至53%,标志着医疗AI进入实战验证阶段。

5月14日,阿里正式开源通义万相「Wan2.1-VACE」,这是业界功能最全的视频生成与编辑模型,单一模型可同时支持文生视频、图像参考视频生成、视频重绘、视频局部编辑、视频背景延展以及视频时长延展等全系列基础生成和编辑能力。

本次共开源1.3B和14B两个版本,其中1.3B版本可在消费级显卡运行,开发者可在GitHub、HuggingFace及魔搭社区下载体验。该模型还将逐步在通义万相官网和阿里云百炼上线。

自今年2月以来,通义万相已先后开源文生视频模型、图生视频模型和首尾帧生视频模型,目前在开源社区的下载量已超330万,在GitHub上斩获超1.1w star,是同期最受欢迎的视频生成模型。

百度

5月,百度在AI领域继续保持强劲发展势头,尤其是在大模型技术的产业化应用和生态建设方面取得了显著进展。

5月21日,百度在“万象·AI开发者大会”上发布全球首个千亿参数多模态大模型“文心·灵眸”。该模型融合视觉Transformer、语音编码器与语义理解模块,具备图像生成、视频理解、语音交互等12种模态处理能力,并已率先在物流场景中落地。百度与美团联合推出“智能配送大脑”,显著提升路径规划效率40%,并将异常订单处理时间缩短至15秒,展现出大模型驱动下的智能决策与产业协同能力。

5月20日,百度举办了AI Day活动,百度集团副总裁吴甜对文心大模型最新版本的技术创新进行了系统性的讲解。她表示:"文心大模型4.5 Turbo源自文心4.5,效果更好、成本更低。"基于文心4.5 Turbo,文心X1升级到X1 Turbo,性能提升的同时,具备更先进的思维链推理能力。

在代码场景上,基于文心大模型的语言和代码能力,百度研制了代码智能体和智能代码助手——文心快码。百度每天新增的代码中,文心快码生成的代码占比已超过40%。

此外,百度在智能体产品层面也实现突破,旗下“通用超级智能体”平台“心响”App于5月26日正式上线iOS端。该应用支持通过主智能体调度多个子智能体,具备自主任务分解、执行与优化能力,能够以自然语言输入一键完成复杂任务流程,极大拓展了AI在个人与企业场景中的应用边界,也被认为是百度推进“人人可用的智能体”战略的重要落地成果。

5 月 16 日,百度 AI 搜索结果上线国内首个基于百亿级内容库的深度搜索(DeepSearch),并上线了个人知识库、创作画布等创新功能,打造 “边想边搜” 的新一代智能搜索体验。

此次推出的 DeepSearch 功能具备类似人类用户的搜索思维,可提供 “边想边搜” 解决复杂问题的能力,且免费无限次使用。它实现了更全面的主动思考,突破传统搜索的关键词匹配局限,通过大模型理解用户真实搜索意图,构建有逻辑的搜索框架,并可通过 “意图理解 -> 任务拆解 -> 搜索结果 -> 反思补充” 的机制保证回答效果,还能通过大模型评估问题复杂度,只在必要时执行多轮搜索,确保简单问题快速回答、复杂问题深度推演。

百度在AI领域呈现“技术-产品-生态”全面发力的态势,其AI-first战略在商业化落地与技术创新上的协同效应显著。

字节跳动

字节跳动在AI领域动作频频,旗下多个业务线密集发布了一系列聚焦实用性与效率提升的AI新工具和模型,展现出其在内容创作、办公协作和基础模型研发上的加速布局。

5月29日,字节跳动旗下剪映推出两款 AI 创作工具 —— 小云雀和剪小映,均聚焦于利用 AI 技术简化内容创作流程,提升生产效率。

“小云雀”面向短视频创作者、电商营销人员以及普通用户的视频内容创作 Agent,主打“灵感即所得,创作零门槛”。”小云雀AI”已经接入豆包和DeepSeek,目前仅安卓可下载,iOS 预计 6 月发布。

不同于传统 AI 工具仅提供一个通用输入框,「小云雀AI」先让用户明确选择场景(如智能成片、数字人视频、AI 设计、AI 换背景等),以此避免生成内容“跑题”,提升了交互效率和结果的相关性。

而“剪小映”主打一键式操作,用户只需上传图片和视频,应用便会自动进行剪辑,并提供多种滤镜模板和音乐选择,快速生成具有抖音风格的视频内容。简化的流程使得即使是没有专业剪辑经验的用户,也能轻松制作出高质量的短视频。

此轮产品迭代前,字节已通过豆包与飞书拓展AI应用边界。5月23日,豆包App上线实时视频通话功能,基于视觉推理模型实现联网搜索与智能问答,进一步强化其作为智能助手的服务能力。5月21日,飞书推出的知识问答工具深度整合企业知识库,用户可通过左侧工具栏直接调用,实现工作场景的即时问题解答,字节已将AI能力渗透至办公协同领域。

5月13日,字节跳动火山引擎在上海举办大模型巡展活动,发布了一系列新的大模型产品。与以往大幅跃迁不同,此次产品特点突出“小而专”和“聚焦实用”。

其中,火山引擎发布的豆包视频生成模型Seedance 1.0 lite支持文生视频、图生视频,可生成5秒或10秒、480P或720P的视频;虽然参数规模小,但能实现影视级质量并大幅提升生成速度,兼顾效果、速度和性价比。该模型重点优化了指令遵循精度和语义理解能力,能更精确控制人物表情、衣着及响应文本中的程度副词。

另一款产品豆包1.5·视觉深度思考模型(Doubao-1.5-thinking-vision-pro)同样以实用至上,激活参数仅20B却具备强大的多模态理解和推理能力。此外,火山引擎还发布了基于智谱AI模型的Seed 2.0。这些产品表明字节跳动正通过多元化AI模型布局满足不同场景需求,主要面向电商广告、娱乐特效、影视创作、动态壁纸等应用场景。

5月12日,字节跳动Seed团队正式发布了最新的向量模型Seed1.5-Embedding。

Seed团队是字节跳动内部专注于大模型研发的核心团队之一。早在2023年,字节跳动就开始筹建独立于原有组织架构的Flow和Seed团队,前者负责AI应用开发,后者专注于大模型研发。据雷峰网报道,字节目前已整合AI研发团队,AI Lab即将全部收归Seed团队之下,形成更加集中的研发力量。

Seed1.5-Embedding向量模型的发布,代表了字节跳动在向量表示学习领域的技术突破。向量模型是自然语言处理和机器学习中的重要基础技术,用于将文本、图像等非结构化数据转换为计算机可以处理的向量表示。Seed1.5-Embedding模型的推出,将为字节跳动的各种AI应用提供更加强大的语义理解和表示能力。

这一模型的发布与字节跳动"实用至上"的AI发展战略相契合。据接近字节跳动的相关人士透露,相比执着于"一鸣惊人"的大招,今年以来,“小步快跑”、"多线程并进"成为字节发展的思路。Seed1.5-Embedding模型的发布正是这一战略的具体体现。

科大讯飞

5月,科大讯飞主要以星火X1为核心,重点在教育领域实现技术突破与场景落地上,包括通过与地方政府的战略合作,星火大模型在更多行业和场景中得到应用。

5月31日,科大讯飞与重庆两江新区成功签约,这是科大讯飞董事长刘庆峰在一个月内第五次高规格"政务露面"。此前,科大讯飞已分别于4月28日在河南、5月14日在大连等地与政府机构开展深度合作。

在5月的武汉数字教育大会上,星火X1深度推理大模型展示了科大讯飞在认知智能领域的技术突破,同时联合中国教科院正式启动中小学科学教育智能导师项目。

会上展示的成果包括:基于星火X1能力的AI黑板,它能实现3D图形动态渲染和跨时空“对话”等教学功能,有效提升了课堂互动性;星火智能批阅机,利用OCR识别和知识图谱技术,能够智能批改作业、分析学情并提供个性化反馈,达到接近真人的批改效果;以及覆盖教学、学习、研究和管理全场景的智慧课程平台,该平台结合学科大模型和知识图谱技术,能为学生提供个性化的学习路径推荐和AI学伴服务。

5 月 6 日 ,科大讯飞在安徽合肥召开的科大讯飞 2025 年度发布会上,发布了全新一代的 AI 学习机 T30 Pro、T10 Pro 和 A10 Pro,并推出了智能助听器 Pro 系列、智能听诊器等医疗相关产品。其中 AI 学习机新增了 “类人型” 主观题批改、全民对话式英语口语实训以及专属学习机版检索式 AI 等三大功能。

腾讯

根据腾讯发布的2025年第一季度财报显示,公司当季总收入达1800亿元人民币,同比增长13%。其中,To B业务表现亮眼,实现营收549亿元。企业服务收入实现双位数增长,这一增长主要得益于云服务以及AI相关收入的快速提升,突显了AI业务对腾讯整体业绩的积极贡献。

5 月 28 日,腾讯混元发布并开源语音数字人模型 HunyuanVideo-Avatar。该模型基于腾讯混元视频大模型及腾讯音乐天琴实验室 MuseV 技术联合研发,支持头肩、半身与全身景别,以及多风格、多物种与双人场景,能够面向视频创作者提供高一致性、高动态性的视频生成能力。

5月20日,腾讯混元发布游戏视觉生成平台,即一站式AIGC游戏内容生产引擎,同时推出面向工业级游戏资产生成的AIGC系列大模型Hunyuan-Game。

同时在5月21日,腾讯在北京举办了"2025腾讯云AI产业应用峰会"。峰会期间,腾讯云宣布其大模型知识引擎全面升级为腾讯云智能体开发平台(TCADP),并正式对外发布。该平台该平台接入 DeepSeek - R1、V3 模型和联网搜索。还将计划推出世界模型混元3D场景模型,并开源企业级混合推理模型、端侧混合推理模型、多模态基础模型。

包括此前,腾讯大模型产品批量更新,已推出视觉深度推理模型混元T1 Vision、端到端语音通话模型混元Voice、混元图像2.0模型等。

5月19日,腾讯正式推出QBot,标志着QQ浏览器全面升级为AI浏览器。QBot集成了腾讯自研的混元大模型和DeepSeek模型,提供AI搜索、AI浏览、AI办公、AI学习和AI写作五大核心功能,旨在为用户提供更智能、高效的浏览体验。

在搜索方面,QBot支持文字、语音和图片等多种输入方式,能够理解用户的多样化需求并提供精准的答案。在浏览体验上,QBot具备快速解读网页内容、总结全文、生成脑图等功能,帮助用户高效获取和理解信息。此外,QBot还提供文档编辑、格式转换、表格提取等办公工具,满足用户在工作和学习中的多样化需求 。

此外,QQ浏览器还于5月23日,推出行业首个高考Agent「AI高考通」,该高考志愿智能体基于腾讯混元大模型深度训练,可结合历年录取数据、院校专业排名及考生个人特质,提供包含院校适配度分析、就业前景预测、志愿梯度建议的决策闭环,彻底改变传统填志愿的盲目性。

5月16日,腾讯混元发布实时生图模型——腾讯混元图像2.0模型(Hunyuan Image 2.0)。首次实现毫秒级实时生图,用户输入文字或语音的同时,图像即可实时变化,告别传统AI作画的等待时间。得益于腾讯自研的超高压缩编解码器和全新扩散架构,在提升模型参数量的同时,大幅降低了图像编码序列长度,并通过多模态大语言模型强化了语义理解,让模型能“秒懂”复杂指令。

360

5月26日,360宣布旗下全系浏览器产品全面升级,4亿用户正式迈入AI浏览器时代。

在此次升级中,360 AI浏览器围绕搜索、阅读与助手三大核心场景,推出了一系列实用的智能能力:其中,AI搜索模块基于新一代超级搜索系统,支持用户通过语音、图片或自然语言描述提出模糊需求,系统可自动理解意图、智能规划任务,并在网页、视频等多个平台并行检索,结构化呈现多维答案,相较传统搜索方式,整体效率更高、结果更精准,真正实现"找东西一步到位"。

昆仑万维

5月22日,昆仑万维面向全球市场,同步发布天工超级智能体(Skywork Super Agents)。这款产品采用了AI agent架构和deep research技术,能够一站式生成文档、PPT、表格(excel)、网页、播客和音视频多模态内容。它具有强大的deep research能力,在GAIA榜单上排名全球第一,超过了OpenAI Deep Research和Manus。

这是全球首款基于AI Agent架构的Office智能体手机APP,标志着“AI Office智能体”时代从桌面端全面迈向移动端。

5月13日,昆仑万维正式开源(17B+)Matrix-Game大模型,即Matrix-Zero世界模型中的可交互视频生成大模型。Matrix-Game是Matrix系列在交互式世界生成方向的正式落地,也是工业界首个开源的10B+空间智能大模型,它是一个面向游戏世界建模的交互式世界基础模型,专为开放式环境中的高质量生成与精确控制而设计。

Matrix-Game聚焦于视频生成与用户交互的深度融合,让用户可以通过简单直观的指令,自由探索、操控、甚至创造出细节丰富、物理规则合理的虚拟世界。

月之暗面

5月4日,月之暗面正式发布了Kimi-Audio,一款全新的开源音频基础模型,旨在推动音频理解、生成和交互领域的技术进步。

Kimi-Audio是一个通用音频大模型,能够处理各种音频处理任务。根据相关报道,Kimi-Audio-7B-Instruct是由KimiTeam于2025年4月28日发布的开源音频基础模型,模型能够在单个统一框架内处理各种音频处理任务。该模型基于Qwen2.5-7B,融合Whisper技术,支持语音识别、音频理解、音频转文本、语音对话等多种任务。

MiniMax

5月中旬,MiniMax发布了其最新语音大模型Speech-02,并在两项全球权威语音基准测评榜单中拔得头筹,力压OpenAI、AI语音明星创企ElevenLabs旗下的所有语音模型。

Speech-02不仅在WER(字错率)、SIM(相似度)等硬性指标上实现了与真人无异、甚至更好的SOTA表现,还通过数据、架构层面的创新,实现了超强的泛化能力,支持30+种语种、不同口音、不同情绪的个性化定制。

此外,Speech-02每百万字符输出价格为50美元,价格低至ElevenLabs的1/4,实现了性能与成本的平衡,进一步加速了相关技术的商业化落地。

目前,以Speech-02为代表的多款MiniMax语音交互模型,已经收获多家行业头部企业和新锐创企的选用,商业化进展迅猛。在AI语音交互这一前景广阔的技术领域中,MiniMax已率先验证了技术到应用的高效转化路径。

阶跃星辰

5月7日,阶跃星辰与 ACE Studio 正式联合发布并开源音乐大模型——ACE-Step(中文名:音跃),成为继语音、视频、图片、视觉推理等多模态大模型之后的又一重要突破,展现了音乐创作与生成的最新进展。

ACE Studio 是一家以生成式 AI 技术为核心的科技公司,旗下的产品 ACE Studio,是一款 Gen-AI 为核心的音乐创作工作站产品(The Cursor.ai for music),用户遍布全球,包括格莱美获奖者,世界顶级的工作室都在使用。

快手

5月29日,快手旗下的可灵AI发布了全新的2.1系列模型,包括标准版(720p)和高品质版(1080p)两个版本。可灵2.1涵盖标准版(可选720p、1080p,仅支持图生视频)、大师版(1080p、影视级效果,支持图生视频、文生视频)两个版本可选。从产出效果看,可灵选择用标准版覆盖常见的短视频设计需求,大师版则用于覆盖影视级内容需求。

更重要的是,可灵2.1进一步降低了视频生成成本。在可灵2.0大师版本中,生成5秒视频需要100灵感值(1元人民币等于10灵感值),此次升级后,生成5秒720p视频价格降至20灵感值,同时长的1080p视频价格35灵感值,大师版视频价格100灵感值。

5月27日,快手2025年第一季度财报显示,公司总营收同比增长10.9%至326亿元,经调整净利润达46亿元,经调整后净利润率14%。在整体稳健增长的背景下,可灵AI的表现尤为突出,季度营业收入超过1.5亿元,展现出强劲的商业化能力。

值得注意的是,在业绩电话会上,快手联合创始人、执行董事、董事长兼首席执行官程一笑透露,目前P端付费订阅会员贡献了可灵AI营业收入的近70%。这一数据表明,快手的AI商业化策略主要面向专业用户群体,包括自媒体视频创作者和广告营销从业者等,这些专业用户对AI视频生成工具有着更高的需求和支付意愿。

财报显示,可灵AI的商业化进程正在进入加速期,2025年第一季度可灵AI收入超过1.5亿元。快手在财报中写道:“可灵AI已经广泛应用于广告营销、短剧和智能终端等多个行业,这也使得我们对于可灵AI成为新AI时代视频创作的基础设施的愿景更有信心。”

从第一季度财报中可灵AI的商业化表现,到2.1系列模型的技术迭代和商业模式优化,再到未来在视频生成、虚拟人、直播助手等领域的规划,快手正在全方位构建其在AI视频生成领域的竞争优势。

商汤

5月28日,在权威大模型测评机构SuperCLUE《中文大模型基准测评2025年5月报告》中,商汤「日日新 V6」(SenseNova-V6 Reasoner)凭借出色的综合能力表现,以62.96分的优异成绩,与Doubao-1.5-thinking-pro并列国内第一,摘得金牌,并在智能体Agent测试任务中获得国内最高分。

5月13日,商汤科技发布了全新升级的商量APP,支持用户通过语音与AI交互,体验更自然流畅的对话。从技术角度看,商量APP的升级版本融合了商汤日日新V6的多模态推理能力,使普通用户能够通过日常对话方式体验到AI交互。

同时,根据Hugging Face——全球最大的AI开源社区上的数据,在Open Compass本月的多模态大模型评测榜单中,商汤「日日新 V6」(SenseNova-V6 Pro)曾以80.4的总分,超越Gemini 2.5 Pro,位居第一,成为全球最强多模态大模型。

京东云

5月20日,京东云城市大会在上海召开,正式发布JoyScale AI算力平台、JoyBuild大模型开发计算平台、JoyAgent智能体2.0等九大产品,并推出医疗、工业、金融三大垂直行业一体机,助力企业重构AI基础设施,生成专属数字员工,加速大模型深度应用落地。

同时,京东集团技术委员会主席、京东云事业部总裁曹鹏表示,“随着深度应用加速来临,数字员工的上岗率将成为衡量一个企业先进性的标准。有多少工作是AI完成的,决定了企业未来能跑多快。新一代Agent成为深度应用的代表,京东云JoyAgent2.0正在帮助企业生成专业数字员工。同时,大规模应用爆发,也将推动AI基础设施迈向标准化,AI Infra1.0已经具备。”

面壁智能

5月21日,面壁智能于近日完成新一轮数亿元融资,本轮融资由洪泰基金、国中资本、清控金信和茅台基金联合投资。面壁智能称,最新一轮融资的完成,将进一步为公司构筑高效大模型技术、产品壁垒、加速行业赋能与生态拓展奠定坚实基础,协同产业上下游推动“端侧大脑”在千行百业规模化应用。

自2024年以来,面壁智能已完成3轮融资,节奏较为密集。对于此次融资,李大海表示,大模型已经进入行业赋能的加速时刻,需要对技术、市场具备更加前沿性的判断,并为大模型行业赋能提供充足的供给。一直以来,面壁智能以打造高效大模型为目标,本次融资将进一步加深面壁智能的壁垒,持续推动大模型商业化进程。

什么值得买科技

5月28日,值得买科技举办AI进展线上分享会,介绍了集团“全面AI战略”一年来的成果及进展。值得买科技方面透露,AI进展分享会将以月为周期,持续向外界同步集团AI进展,不仅介绍具体AI成果,也希望以此与行业保持高频沟通、共建AI时代。

本次分享会上,值得买科技发布了1个引擎产品、2款面向用户的AI产品以及1个面向行业生态的AI底层基础设施,分别是“火眼”AIUC引擎、“什么值得买”GEN2和购物Agent“张大妈”,以及“海纳”MCP Server,展现了从技术底层、产品形态到生态共建的全面布局。

 一、大模型风口已至:月薪30K+的AI岗正在批量诞生

2025年大模型应用呈现爆发式增长,根据工信部最新数据:

国内大模型相关岗位缺口达47万

初级工程师平均薪资28K

70%企业存在"能用模型不会调优"的痛点

真实案例:某二本机械专业学员,通过4个月系统学习,成功拿到某AI医疗公司大模型优化岗offer,薪资直接翻3倍!

二、如何学习大模型 AI ?


🔥AI取代的不是人类,而是不会用AI的人!麦肯锡最新报告显示:掌握AI工具的从业者生产效率提升47%,薪资溢价达34%!🚀

由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。

但是具体到个人,只能说是:

“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。

这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。

我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

1️⃣ 提示词工程:把ChatGPT从玩具变成生产工具
2️⃣ RAG系统:让大模型精准输出行业知识
3️⃣ 智能体开发:用AutoGPT打造24小时数字员工

📦熬了三个大夜整理的《AI进化工具包》送你:
✔️ 大厂内部LLM落地手册(含58个真实案例)
✔️ 提示词设计模板库(覆盖12大应用场景)
✔️ 私藏学习路径图(0基础到项目实战仅需90天)

 

第一阶段(10天):初阶应用

该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。

*   大模型 AI 能干什么?
*   大模型是怎样获得「智能」的?
*   用好 AI 的核心心法
*   大模型应用业务架构
*   大模型应用技术架构
*   代码示例:向 GPT-3.5 灌入新知识
*   提示工程的意义和核心思想
*   Prompt 典型构成
*   指令调优方法论
*   思维链和思维树
*   Prompt 攻击和防范
*   …

第二阶段(30天):高阶应用

该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。

*   为什么要做 RAG
*   搭建一个简单的 ChatPDF
*   检索的基础概念
*   什么是向量表示(Embeddings)
*   向量数据库与向量检索
*   基于向量检索的 RAG
*   搭建 RAG 系统的扩展知识
*   混合检索与 RAG-Fusion 简介
*   向量模型本地部署
*   …

第三阶段(30天):模型训练

恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。

到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?

*   为什么要做 RAG
*   什么是模型
*   什么是模型训练
*   求解器 & 损失函数简介
*   小实验2:手写一个简单的神经网络并训练它
*   什么是训练/预训练/微调/轻量化微调
*   Transformer结构简介
*   轻量化微调
*   实验数据集的构建
*   …

第四阶段(20天):商业闭环

对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。

*   硬件选型
*   带你了解全球大模型
*   使用国产大模型服务
*   搭建 OpenAI 代理
*   热身:基于阿里云 PAI 部署 Stable Diffusion
*   在本地计算机运行大模型
*   大模型的私有化部署
*   基于 vLLM 部署大模型
*   案例:如何优雅地在阿里云私有部署开源大模型
*   部署一套开源 LLM 项目
*   内容安全
*   互联网信息服务算法备案
*   …

学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。

如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。

这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐