Google今晚杀疯了:定标准(A2A),发武器(firebase),祭免费(2.0 Flash)

Google AI踏空后的追赶

你见过一家公司逆袭得有多励志?

Google可能就是个例子,AI世界铁王座被OpenAI、微软等企业抢走后,它现在想夺回失去的一切。 在Gemini Veo 2成为AI视频生成的王者后,最近Gemini 2.5 Pro重新拿回LLM世界第一宝座,文生图和Canvas等一些小产品也接连上线。

今天,Google在“Google Cloud Next 25”上,就端出了很多硬菜,挺让人惊讶的东西就有几样。

模型端:

其中包括将开放Veo 2的API 和 发布新的Gemini 2.0 Flash Live,企业福音。

Veo 2 ,API可调用Gemini 2.0 Flash Live ,更快的性能Gemini 2.0 Flash Lite,成本效益更好Gemini 2.5 Flash Preview Chirp 3

产品端:

Lyria 文生音乐模型,已经向部分客户开放预览;

Veo 2 视频创作模型,增加新的编辑和视觉效果定制;

Imagen 3 图像生成器,显著性能升级Chirp 3 自定义语音,只需 10 秒音频即可创建自定义语音

第七代Ironwood,为推理时代打造的第一个 TPU芯片,峰值计算能力提高5倍

Deep Research,升级为Gemini 2.5 Pro大模型驱动

以上这些产品都将集成到AI 开发平台 Vertex AI 上,对企业客户输出服务。

最重要的是谷歌发布了一个A2A(Agent2Agent)协议,让不同供应商的AI Agent能够互相协作。 这个谷歌版MCP,目前已经有Salesforce、SAP等50多家科技公司参与。

A2A协议是什么? 就是给AI智能体(比如各种自动化的AI程序)制定的“社交协议”。让不同公司、不同平台开发的AI能互相发消息、分工合作,哪怕它们原本不认识对方。

核心功能拆解:

1️⃣ 跨平台聊天:比如公司A的招聘AI,能直接联系公司B的背景调查AI,不用提前对接系统。就像你用微信能加任何好友聊天。

2️⃣ 长期任务支持:能处理需要几天才能完成的任务(比如分析整个供应链),过程中随时报告进度,不像现在很多AI只能即时问答。

3️⃣ 多媒体沟通: 不仅能传文字,还能发视频/音频(比如让AI分析工厂监控视频时直接传视频流)。

4️⃣ 安全保障:用企业级登录验证(类似银行系统的权限控制),防止AI乱联系不该联系的对象。

A2A和MCP的区别:

MCP:像是“AI使用工具的说明书”,主要教AI怎么调用各种API(比如访问数据库、发邮件)

A2A:像是“AI之间的社交软件”,解决AI们如何组队干活的问题

同时,谷歌还发布了Agent Develoment 开源ADK,这个工具包的价值: 让开发者用极简代码(100行左右)就能造出Agent:

能通过A2A和其他AI聊天的智能体

能同时使用MCP调用各种工具的智能体

支持文字/语音/视频多模态的智能体

大家是不是觉得不知道能干嘛,实际应用场景举例:

假设某公司要招聘:

简历筛选AI(用A2A协议)自动联系背调公司的AI

背调AI通过MCP调取警方数据库

所有进度实时同步到HR的智能体看板

发现合适人选后,面试安排AI自动协调双方时间

关键突破点:

以前每个AI都是孤岛,现在通过A2A+ADK:

不同厂商的AI能快速组队

复杂任务可以拆给多个AI完成

企业不用自己从头开发整套系统

看完了标准层创新,看看谷歌这次发布的重头戏产品:

一款AI编程产品——firebase.studio 。它就像lovable+cursor+replit+bolt+windsurf全部合为一体 ,而且是在浏览器中免费使用!

大家可以使用自然语言构建任何应用程序,随时修改后部署它。

简单来说: Google把之前的Project IDX开发工具正式并入Firebase,改名叫Firebase Studio。现在你可以在浏览器里直接开发全栈应用,重点变化有两个:

新增功能:

1️⃣ AI辅助建项目: 现在点个按钮,AI会帮你生成Next.js应用的初始代码(类似现在流行的大模型生成代码),但开发者依然能完全控制代码。

2️⃣ 双工作模式切换 :你既可以用AI智能模式快速生成内容,也能切回传统云开发环境(基于虚拟机的云工作空间),两种模式无缝衔接。

保留的功能: 之前IDX有的全栈模板、安卓模拟器、团队协作、一键部署这些功能全都在,没被砍掉。

遗憾的是,Firebase Studio一直显示很火爆,无法体验。

其实我今天刚在DeepSite上体验了一把浏览器生成并预览AI程序,鲸哥在输入框输入“帮我生成一个贪吃蛇游戏”,左侧的代码就开始自动生成,右侧的预览框就不断显示程序生成过程,预计Firebase也是这样,估计生成的效果更好。

可以猜测,Firebase这次不是简单改名,而是把开发工具深度整合到Firebase生态。Firebase原本就有数据库/认证等后端服务,现在加上浏览器里的全栈开发环境,相当于把前后端开发+云服务打包成全家桶。

另外,一个不太起眼的“换皮肤”产品,其实也很重要。

Google推出了 AI Studio UI 的第一系列更新,包括更清晰的导航、上下文操作和视觉刷新。 接下来将要改进:改进的提示框、模型卡片、历史记录、更好的代码视图等更多功能。

此前大家吐槽新的2.5 pro模型,在Gemini应用里找不到,非得放到AI Studio这个新空间中。

Google AI Studio 负责人Logan Kilpatrick(前OpenAI 前开发者关系负责人)解释说: 用户旅程和目标非常明显不同,我们正在构建一个平台,让开发者能够最终将 Gemini 建成自己的产品,而不是只用Gemini作为AI日常助手。

目前看,对于企业,Google全力整合 Vertex AI ,输出云计算和模型服务;

对于开发者,Google全力迭代 AI Studio,提供产品化的AI能力;

对于个人和团队用户, Google Workspace则是用AI升级了过往的产品;

技术能力产品都跟了上来,战略布局也清晰了。

海外博主AshutoshShrivastava认为,Google最终能赢得一切的原因是因为他们拥有一切,他们主导了四个关键领域:

  • 应用程序
  • 基础模型
  • 云和芯片
  • 数据优势

委实如此,现在Gemini 2.5 Pro在编程能力超过了Claude 3.7 sonnet,OpenRouter 上使用最多的视频模型是 Veo-2,从落后到赶超,Google用了2年时间。

相比 Meta 在AI时代的挣扎,Google确实更从容一些。“技术工程”的底蕴还在,也能给一些迷途大厂很多启发。

最后,如果你需要付费使用ChatGPT、Grok、Gemini、Claude等AI工具,可选择开通虚拟信用卡进行付款。4399Pay是一家专门提供国际虚拟信用卡的平台,无限开卡且免KYC;有兴趣的朋友可以添加客服TG(@dabai717)进行了解。