谷歌于当地时间2025年3月25日发布了Gemini 2.5 Pro,这款AI模型被描述为他们“最智能的AI模型”,并在官方博客中宣布。它是Gemini系列的最新升级,旨在通过内置的推理能力提升性能和准确性。

图片

模型特点

Gemini 2.5 Pro被设计为“思考模型”,意味着它能在回应前进行推理。

这种能力使其能够处理更复杂的问题,并支持更强大的上下文感知代理。

相比之前的Gemini 2.0版本,它在多个基准测试中表现优异,尤其是在科学、数学和编码领域。

图片

推理能力全面开挂

Gemini 2.5 Pro的核心突破在于思维链推理——面对问题时,它会像人类专家一样进行多轮逻辑推演:

  • 信息整合:分析文本、图像、音频等多源数据。

  • 逻辑论证:构建因果关系链,排除干扰信息。

  • 决策优化:结合上下文语境,输出高精度答案。

这种能力让它在数学、科学、代码等高难度任务中一骑绝尘:

  • Humanity’s Last Exam(人类终极考试):18.8%准确率,无需外部工具直接刷新纪录。

  • AIME 2025数学竞赛:超越所有竞品登顶。

  • 代码编辑测试:Aider Polyglot得分68.6%,碾压OpenAI、DeepSeek。

(就连编程界的“地狱级”测试SWE-bench,它也能拿下63.8%分,仅次于Claude 3.7 Sonnet5)

图片

单次处理100万token

如果说推理是大脑,多模态与超长上下文就是Gemini 2.5 Pro的感官和记忆:

  • 输入兼容性:文本、代码、图像、音频、视频,甚至TB级数据集,统统一口吞。

  • 上下文窗口:100万token(约75万单词),相当于完整解析《指环王》三部曲!更重磅的是,200万token升级已在路上。

这意味着什么?

  • 开发者可用它分析整本小说,生成深度书评。

  • 企业可一次性处理跨模态海量数据(财报+市场视频+用户评论),输出商业洞察。

  • 甚至能一键生成交互式网页应用,比如根据指令用p5.js绘制曼德博分形图!

图片

访问与定价

即日起,Gemini 2.5 Pro已面向两类用户开放:

  • 开发者:通过Google AI Studio平台直接调用。

  • 高级用户:订阅20美元/月的Gemini Advanced服务(移动端/桌面端均支持)。

  • 企业级服务则将在未来几周登陆Vertex AI平台,定价方案即将公布。

结语

谷歌明确表示,推理能力将成未来所有AI模型的标配,而Gemini 2.5 Pro只是起点,将继续收集反馈以进一步改进模型。

这场竞赛远未结束。

Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐