是棋逢对手还是技高一筹?
如果说人工智能领域是一盘崭新的蛋糕,那么技术的革新换代就是各企业切割蛋糕最有力的武器。作为人工智能领域最前沿的两大巨头,OpenAI 与谷歌 DeepMind正不断推进技术创新发展,双方你追我赶,以惊人的速度推动人工智能领域这块“蛋糕”越做越精美。
12月20日,谷歌DeepMind首席科学家宣布推出全新测试模型——Gemini 2.0 Flash Thinking。而这是在OpenAI “12 天马拉松”发布的倒数第二天。
据介绍,谷歌此次发布的Gemini 2.0 Flash Thinking模型是一个多模态推理模型,通过思维链过程可视化,以AI思维的透明度与闪电般解题的速度重新定义AI模态的新架构。同时还可以联动使用Google Search和Google Maps等相同系列工具。大大提升用户在谷歌生态中的交互体验。
透明度:只给结果得两分,给出过程得满分
如果AI回答问题是一张考卷,那么传统AI模型只给结果的答题方式似乎并不合格,是要接受老师批评的程度。而现在,几秒钟内AI给出的不仅是答案,同时还有推理过程。
Gemini 2.0 Flash Thinking的核心特点之一是AI思考的透明度。
Google的最新模型引入了一个创新功能:用户可以通过下拉菜单查看其逐步推理的过程。Google DeepMind 首席科学家 Jeff Dean 演示了该模型如何通过一系列“思考”步骤解决物理问题,整体耗时1分多钟。
首先,让我们来详细解释一下这个新功能是如何工作的。在Google的最新模型中,当用户输入一个问题或请求时,模型会开始处理并生成答案,这一点与其他传统的模型相似。不同的是,用户同时可以通过一个下拉菜单实时查看模型的推理过程。下拉的菜单会显示模型在每个步骤中所考虑的因素、所采用的策略以及最终得出的结论。这种逐步展示的方式使得用户能够清楚地看到模型是如何从输入到输出进行推理的,从而更好地理解其决策逻辑。
其次,这个新功能的引入对于增强模型的可解释性具有重要意义。在过去,许多AI模型被批评为“黑箱”操作,即它们的内部工作机制和决策过程对于用户来说是不可见的,这种不透明性导致了人们对AI系统的不信任和担忧。如今,通过引入逐步推理的过程展示,Google的最新模型为用户提供了一个窗口,可以窥见模型的内部工作原理。这种透明度不仅有助于用户更好地理解模型的行为,同时增加用户与模型之间的信任,更加理解AI给出结果。
同时,这种透明度不仅有助于建立用户对AI系统的信任,还为监管机构提供了一个工具,以评估和监督AI系统的公平性和合规性。
对于开发者而言,开发者可以通过观察模型的推理过程来发现潜在的问题和改进的空间,从而不断优化和提升模型的性能,更加有效地优化AI系统。
多模态能力:排名超过o1预览版
根据独立基准测试网站lmarena.ai的初步评估结果,Gemini 2.0 Flash Thinking在多个领域展现出了卓越的性能表现,尤其是在数学问题解决、创意写作以及视觉任务处理等方面更是表现突出。
值得注意的是,这款模型不仅在整个评测中超越了o1预览版的成绩,而且总分排名第一,在编程挑战、数学解题技巧和创新写作等多个具体项目中也取得了最佳成绩(其中部分项目与其他顶尖AI模型并列)。这些令人瞩目的成就充分展示了Gemini 2.0 Flash Thinking的多模态功能及其对不同类型数据的强大适应能力。
与OpenAI推出的o1模型相比,Gemini 2.0 Flash Thinking从设计之初就特别注重于图像处理能力的开发,这使得它在面对包含文字信息以外的复杂数据集时能够更加游刃有余。例如,在进行自然语言生成的同时结合图片内容进行描述或分析等任务上,Gemini 2.0显示出了明显的优势。此外,这种跨模态理解的能力对于提升用户体验至关重要,这意味着Gemini 2.0允许用户通过多种方式与系统交互,无论是输入文本还是上传图片都能得到准确而有意义的反馈。
Gemini 2.0 VS OpenAI o1:是棋逢对手还是技高一筹?
OpenAI与Google激战以久。
此前,OpenAI 在 ChatGPT 中引入的搜索功能直接对谷歌等传统搜索引擎构成了挑战,试图吸引大量原本使用这些网站进行网络搜索的用户。
在人才争夺中,过去的18个月,OpenAI成功挖掘到85位谷歌员工加盟,其中工程师占据了半数。最近,他们更是从谷歌DeepMind团队中引入了三位资深计算机视觉与机器学习专家——Lucas Beyer、Alexander Kolesnikov以及Xiaohua Zhai。几位顶尖人才加入位于瑞士苏黎世OpenAI办事处,专注于多模态人工智能技术的研发工作。
同时在产品上,OpenAI 公司也适时地发布产品信息,计划从12月5日开始的12天内,通过12场直播发布新模型和功能,这一系列动作被命名为“12天的 OpenAI”,即在上文提到的“12 天马拉松”。
如今看来,双方的战场不局限于任何可争夺的地方,从发布周期到市场份额的争夺,从活跃用户到人才的挖角行动,放眼皆是两大头部企业竞争的硝烟。而技术创新的对垒,应当是两大科技巨头最有效与最精彩的部分。
毫无疑问,谷歌的Gemini 2.0 Flash Thinking是与OpenAI的o1模型在技术上对打的产品。谷歌选择在属于“OpenAI 圣诞”时间的倒数第二天发布Gemini 2.0,除了新品发布刻不容缓外,多少也有些与OpenAI针尖对麦芒的味道。
只是目前来看,无论是 Chatbot Arena 排行榜还是在部分性能测试结果中,Gemini 2.0各方面皆优于OpenAI的o1。
Targum 创始人和 CEO Alex Volkov 通过 10 个难题对两者进行了对比测试,结果发现,谷歌的Gemini 2.0 的速度要快得多。
从技术层面看,谷歌的Gemini 2.0如今略胜一筹。但两者的竞争你追我赶,在技术变化的日新月异下,鹿死谁手,犹未可知。
无论如何竞争,谷歌与OpenAI的竞争必然在不断推动AI 技术的快速发展,也为全球科技产业带来了前所未有的变革。
未来 AI 领域的格局,值得期待。
写在最后,如果需要付费使用Gemini 2.0、ChatGPT等AI工具,可以开通国际虚拟信用卡进行付款。4399Pay就是一家专门提供国际虚拟信用卡的平台,可以免KYC;有兴趣的朋友可以添加客服TG(@dabai717)进行了解。