AI本周大事件:OpenAI神秘更新、谷歌Gemini进化,更多内容看文章
可灵Kling AI发布了两个新模型:KLING 2.0 Master用于视频生成,KOLORS 2.0用于图像生成这两个模型在提示遵循性方面都有所改进,KLING 2.0在处理包含顺序动作和复杂运动的提示时表现尤为突出。
Kling AI发布2.0模型
可灵Kling AI发布了两个新模型:KLING 2.0 Master用于视频生成,KOLORS 2.0用于图像生成
这两个模型在提示遵循性方面都有所改进,KLING 2.0在处理包含顺序动作和复杂运动的提示时表现尤为突出。
demo展示确实很惊艳,看下面链接:
Coze支持MCP
coze总算支持MCP了,扣子发布新产品coze空间,使用体验类似于manus,可调用各种mcp服务完成复杂任务,同时即将允许用户将「扣子开发平台」MCP发布至「扣子空间」。
coze空间可以用户自己添加各种MCP服务,然后提交任务,coze空间会调用各种mcp服务完成复杂任务(manus是官方默认给定的tool和工作流)
coze空间功能:
-
从回答问题,到解决问题,让 Agent 帮你完成更多的工作:
-
自动分析需求,拆解为多个子任务
-
自主调用工具(浏览器、代码编辑器等),执行任务
-
输出完整的结果报告,例如网页、PPT 、飞书文档等
想获取一线AI实战和内幕信息,🔍👇🏻,拉你进👗👗
OpenAI发布了新的o3和o4-mini推理模型
o3在编码、数学、科学和多模态领域推动了最先进的性能,而o4-mini则提供了快速且高效的性能。
两者都具备代理工具访问权限,并能够“通过图像进行思考”。
看这个实测案例
确实现在独一档的存在,特别是它的推理能力
谷歌推出Gemini 2.5 Flash
Gemini 2.5 Flash 是性价比之王,大杀器 🤯
构建应用程序、游戏,提升生产力,只需几分钱。
Gemini 2.5 Flash 在基准测试中摧毁了Claude 3.7 Sonnet,且价格低至20倍
谷歌升级Gemini Live
谷歌正在扩展Gemini Live的Project Astra功能——面向所有安卓用户!
这将使用户能够通过手机摄像头或屏幕共享与实时视觉AI互动,并进行多语言对话,讨论所看到和听到的内容。
模型可以和你的手机互动
微软升级Edge浏览器
微软还开始在其Edge浏览器中推出Copilot Vision
它将读取屏幕上的内容并朗读总结,充当浏览互联网时的实时协作者。
最棒的是:它是免费的——并且是可选择加入的(默认不启用)!
更多AI内容👇🏻👇🏻
OpenAI这次要颠覆什么?实测案例来啦!新一代AI“小专家”来了!能看图、写代码、自主决策
通俗易懂讲AI:5分钟搞懂小模型/大模型/多模态!使用效果翻倍!
🔍:ai_service,点关注,不迷路,更多AI内幕等着你

GitCode 天启AI是一款由 GitCode 团队打造的智能助手,基于先进的LLM(大语言模型)与多智能体 Agent 技术构建,致力于为用户提供高效、智能、多模态的创作与开发支持。它不仅支持自然语言对话,还具备处理文件、生成 PPT、撰写分析报告、开发 Web 应用等多项能力,真正做到“一句话,让 Al帮你完成复杂任务”。
更多推荐
所有评论(0)