.webp)
Google AI踏空后的追赶
你见过一家公司逆袭得有多励志?
Google可能就是个例子,AI世界铁王座被OpenAI、微软等企业抢走后,它现在想夺回失去的一切。 在Gemini Veo 2成为AI视频生成的王者后,最近Gemini 2.5 Pro重新拿回LLM世界第一宝座,文生图和Canvas等一些小产品也接连上线。
今天,Google在“Google Cloud Next 25”上,就端出了很多硬菜,挺让人惊讶的东西就有几样。
模型端:
其中包括将开放Veo 2的API 和 发布新的Gemini 2.0 Flash Live,企业福音。
Veo 2 ,API可调用Gemini 2.0 Flash Live ,更快的性能Gemini 2.0 Flash Lite,成本效益更好Gemini 2.5 Flash Preview Chirp 3
产品端:
Lyria 文生音乐模型,已经向部分客户开放预览;
Veo 2 视频创作模型,增加新的编辑和视觉效果定制;
Imagen 3 图像生成器,显著性能升级Chirp 3 自定义语音,只需 10 秒音频即可创建自定义语音
第七代Ironwood,为推理时代打造的第一个 TPU芯片,峰值计算能力提高5倍
Deep Research,升级为Gemini 2.5 Pro大模型驱动
以上这些产品都将集成到AI 开发平台 Vertex AI 上,对企业客户输出服务。
最重要的是谷歌发布了一个A2A(Agent2Agent)协议,让不同供应商的AI Agent能够互相协作。 这个谷歌版MCP,目前已经有Salesforce、SAP等50多家科技公司参与。
A2A协议是什么? 就是给AI智能体(比如各种自动化的AI程序)制定的“社交协议”。让不同公司、不同平台开发的AI能互相发消息、分工合作,哪怕它们原本不认识对方。
核心功能拆解:
1️⃣ 跨平台聊天:比如公司A的招聘AI,能直接联系公司B的背景调查AI,不用提前对接系统。就像你用微信能加任何好友聊天。
2️⃣ 长期任务支持:能处理需要几天才能完成的任务(比如分析整个供应链),过程中随时报告进度,不像现在很多AI只能即时问答。
3️⃣ 多媒体沟通: 不仅能传文字,还能发视频/音频(比如让AI分析工厂监控视频时直接传视频流)。
4️⃣ 安全保障:用企业级登录验证(类似银行系统的权限控制),防止AI乱联系不该联系的对象。
A2A和MCP的区别:
MCP:像是“AI使用工具的说明书”,主要教AI怎么调用各种API(比如访问数据库、发邮件)
A2A:像是“AI之间的社交软件”,解决AI们如何组队干活的问题
同时,谷歌还发布了Agent Develoment 开源ADK,这个工具包的价值: 让开发者用极简代码(100行左右)就能造出Agent:
能通过A2A和其他AI聊天的智能体
能同时使用MCP调用各种工具的智能体
支持文字/语音/视频多模态的智能体

大家是不是觉得不知道能干嘛,实际应用场景举例:
假设某公司要招聘:
简历筛选AI(用A2A协议)自动联系背调公司的AI
背调AI通过MCP调取警方数据库
所有进度实时同步到HR的智能体看板
发现合适人选后,面试安排AI自动协调双方时间
关键突破点:
以前每个AI都是孤岛,现在通过A2A+ADK:
不同厂商的AI能快速组队
复杂任务可以拆给多个AI完成
企业不用自己从头开发整套系统
看完了标准层创新,看看谷歌这次发布的重头戏产品:
一款AI编程产品——firebase.studio 。它就像lovable+cursor+replit+bolt+windsurf全部合为一体 ,而且是在浏览器中免费使用!
大家可以使用自然语言构建任何应用程序,随时修改后部署它。
简单来说: Google把之前的Project IDX开发工具正式并入Firebase,改名叫Firebase Studio。现在你可以在浏览器里直接开发全栈应用,重点变化有两个:
新增功能:
1️⃣ AI辅助建项目: 现在点个按钮,AI会帮你生成Next.js应用的初始代码(类似现在流行的大模型生成代码),但开发者依然能完全控制代码。
2️⃣ 双工作模式切换 :你既可以用AI智能模式快速生成内容,也能切回传统云开发环境(基于虚拟机的云工作空间),两种模式无缝衔接。
保留的功能: 之前IDX有的全栈模板、安卓模拟器、团队协作、一键部署这些功能全都在,没被砍掉。
遗憾的是,Firebase Studio一直显示很火爆,无法体验。
其实我今天刚在DeepSite上体验了一把浏览器生成并预览AI程序,鲸哥在输入框输入“帮我生成一个贪吃蛇游戏”,左侧的代码就开始自动生成,右侧的预览框就不断显示程序生成过程,预计Firebase也是这样,估计生成的效果更好。

可以猜测,Firebase这次不是简单改名,而是把开发工具深度整合到Firebase生态。Firebase原本就有数据库/认证等后端服务,现在加上浏览器里的全栈开发环境,相当于把前后端开发+云服务打包成全家桶。

另外,一个不太起眼的“换皮肤”产品,其实也很重要。
Google推出了 AI Studio UI 的第一系列更新,包括更清晰的导航、上下文操作和视觉刷新。 接下来将要改进:改进的提示框、模型卡片、历史记录、更好的代码视图等更多功能。
此前大家吐槽新的2.5 pro模型,在Gemini应用里找不到,非得放到AI Studio这个新空间中。
Google AI Studio 负责人Logan Kilpatrick(前OpenAI 前开发者关系负责人)解释说: 用户旅程和目标非常明显不同,我们正在构建一个平台,让开发者能够最终将 Gemini 建成自己的产品,而不是只用Gemini作为AI日常助手。
目前看,对于企业,Google全力整合 Vertex AI ,输出云计算和模型服务;
对于开发者,Google全力迭代 AI Studio,提供产品化的AI能力;
对于个人和团队用户, Google Workspace则是用AI升级了过往的产品;
技术能力产品都跟了上来,战略布局也清晰了。
海外博主AshutoshShrivastava认为,Google最终能赢得一切的原因是因为他们拥有一切,他们主导了四个关键领域:
- 应用程序
- 基础模型
- 云和芯片
- 数据优势
委实如此,现在Gemini 2.5 Pro在编程能力超过了Claude 3.7 sonnet,OpenRouter 上使用最多的视频模型是 Veo-2,从落后到赶超,Google用了2年时间。
相比 Meta 在AI时代的挣扎,Google确实更从容一些。“技术工程”的底蕴还在,也能给一些迷途大厂很多启发。
最后,如果你需要付费使用ChatGPT、Grok、Gemini、Claude等AI工具,可选择开通虚拟信用卡进行付款。4399Pay是一家专门提供国际虚拟信用卡的平台,无限开卡且免KYC;有兴趣的朋友可以添加客服TG(@dabai717)进行了解。