Kling AI发布2.0模型

可灵Kling AI发布了两个新模型:KLING 2.0 Master用于视频生成,KOLORS 2.0用于图像生成

这两个模型在提示遵循性方面都有所改进,KLING 2.0在处理包含顺序动作和复杂运动的提示时表现尤为突出。

demo展示确实很惊艳,看下面链接:

demo视频链接

Coze支持MCP

coze总算支持MCP了,扣子发布新产品coze空间,使用体验类似于manus,可调用各种mcp服务完成复杂任务,同时即将允许用户将「扣子开发平台」MCP发布至「扣子空间」。

图片

coze空间可以用户自己添加各种MCP服务,然后提交任务,coze空间会调用各种mcp服务完成复杂任务(manus是官方默认给定的tool和工作流)

coze空间功能:

  • 从回答问题,到解决问题,让 Agent 帮你完成更多的工作:

  • 自动分析需求,拆解为多个子任务

  • 自主调用工具(浏览器、代码编辑器等),执行任务

  • 输出完整的结果报告,例如网页、PPT 、飞书文档等

图片

想获取一线AI实战和内幕信息,🔍👇🏻,拉你进👗👗

OpenAI发布了新的o3和o4-mini推理模型

o3在编码、数学、科学和多模态领域推动了最先进的性能,而o4-mini则提供了快速且高效的性能。

两者都具备代理工具访问权限,并能够“通过图像进行思考”。

看这个实测案例

确实现在独一档的存在,特别是它的推理能力

图片

图片

图片

谷歌推出Gemini 2.5 Flash

Gemini 2.5 Flash 是性价比之王,大杀器 🤯

构建应用程序、游戏,提升生产力,只需几分钱。

Gemini 2.5 Flash 在基准测试中摧毁了Claude 3.7 Sonnet,且价格低至20倍

图片

谷歌升级Gemini Live

谷歌正在扩展Gemini Live的Project Astra功能——面向所有安卓用户!

这将使用户能够通过手机摄像头或屏幕共享与实时视觉AI互动,并进行多语言对话,讨论所看到和听到的内容。

模型可以和你的手机互动

图片

图片

微软升级Edge浏览器

微软还开始在其Edge浏览器中推出Copilot Vision

它将读取屏幕上的内容并朗读总结,充当浏览互联网时的实时协作者。

最棒的是:它是免费的——并且是可选择加入的(默认不启用)!

ChatGPT一周年,你错过了多少革命性时刻?一图总结2023生成式AI里程碑大事件时间线-36氪

更多AI内容👇🏻👇🏻

OpenAI这次要颠覆什么?实测案例来啦!新一代AI“小专家”来了!能看图、写代码、自主决策

福布斯2025 AI 50榜单,这些公司正在悄悄改变世界

通俗易懂讲AI:5分钟搞懂小模型/大模型/多模态!使用效果翻倍!

通俗易懂讲AI之MCP,为什么MCP这么火?

🔍:ai_service,点关注,不迷路,更多AI内幕等着你

Logo

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。

更多推荐