沉寂一年后,谷歌带着它的多模态大模型Gemini(双子座)高调杀回AI圈。
此前,谷歌曾凭借AlphaGo在全球掀起了一波AI浪潮。但新一轮AI浪潮的风头却被ChatGPT抢走,谷歌迫切需要一款现象级AI产品来证明自己的实力,这也就不难理解,为何谷歌要冒着风险在演示视频中夸大自家大模型的性能。因为他们太想让Gemini「看起来」优于竞品了。
从命名也能看出,谷歌对Gemini的功能寄予了超越人脑的厚望。官方称Gemini是AI模型的巨大飞跃,其多项能力超过ChatGPT。自此,谷歌正式向竞争对手OpenAI和微软宣战,争夺人工智能霸主地位。AI圈最强终于不再是ChatGPT的独角戏。
最强大模型之战硝烟正浓。
作为应对ChatGPT-4的杀手锏,谷歌在发布会上称Gemini是其迄今为止规模最大、能力最强、最灵活的AI模型。不仅如此,谷歌称Gemini是自己从头开始构建的多模态模型,更接近人类认识世界的方式。
不同于ChatGPT的逐步更新,谷歌一次性就发布了三种模式的Gemini,分别是Gemini Nano、Gemini Pro和Gemini Ultra。不同版本在性能上有着明显差异,现在大家能用上的都是Gemini Pro,但在功能上能迎战ChatGPT的是Gemini Ultra。
虽然宣传视频翻车,但Gemini的数据表现还是相当优异。在运算效能方面,Gemini几乎“吊打”GPT-4。Gemini Ultra在32个多模态基准测试中,其中30个测试集的性能超过当前SOTA结果。在数学问题、Python代码任务、阅读等方面,Gemini的性能都超过了此前最先进的水平。
在纯文本问题上,Gemini是第一个在MMLU(大规模多任务语言理解)测评上超过人类专家的模型。Gemini的得分为90%,人类专家得分约为89%,而GPT-4在这类问题上的得分为86%;在多模式问题上,Gemini得分为59%,GPT-4得分为57%,Gemini的表现均为最佳。
除了在常规能力上全面超越GPT-4,Gemini最大的特色是多模态,也就是可以同时识别和理解文本、图像、音频、视频和代码五种信息,用户可以交错添加文字、图像、视频等内容,Gemini也可以输出相应交错的文本和图像。从一开始,Gemini就在不同模态上进行预训练,再通过额外的多模态数据进行微调,这进一步提升了模型的有效性。
抢跑就一定能将优势保持到最后吗?答案可能是:未必。
对于刚起步的大模型行业来说,行业格局未定,后续的竞争依然充满变数。谷歌一开始在AI领域遥遥领先,最后却沦为OpenAI的追赶者;ChatGPT一出现便技惊四座,现如今又被Gemini赶超……这样的故事在不断上演。谷歌视频里演示的多模态能力,实际上在一年内就能实现。但一年时间里ChatGPT也会不停迭代,到时候Gemini还会是ChatGPT的对手吗?
谷歌的野心绝不止步于追赶,而是希望全方位碾压。Gemini的发布不仅是为了与ChatGPT一较高下,背后潜藏的是一个更大的项目。除了Gemini,谷歌还发布了迄今为止最强大、最高效,并且可扩展的TPU系统——Cloud TPU v5p,专为训练尖端的AI模型而设计。新一代TPU将加速Gemini的发展,帮助开发人员和企业客户更快地训练大规模生成式AI模型,开发出新产品和新功能。一个更可靠、可扩展的训练模型和最高效的服务模型,才是谷歌做出Gemini的重要目标。
这一战,谷歌布局深远,夺回AI霸主的野心昭然若揭。面对已经打出王炸的谷歌,对手OpenAI肯定不会坐以待毙,而OpenAI的绝招正是你根本猜不到它会出什么牌。最强大模型之争,枪声已经打响。
大模型的竞争才刚开始,国产同行们要加把劲了。
这一年来,国内发布比较知名的大模型有百度文心一言、阿里通义千问、腾讯混元、科大讯飞星火、商汤商量、字节跳动豆包、智谱AI-ChatGLM等。
表面上看各家大模型都各有优势,但其实都还处于起步阶段,算法上还未取得突破性的成果,和国外大模型相比还有一定差距,Gemini的出现或许可以加速行业内的优胜劣汰,让大量没有足够竞争力的产品加速出局,同时,它也启发了国产大模型:与其跟进式研发,不如将AI功能尽快赋能在已有的产品和服务之中,这样反而成本更低、见效更快。
在大模型的竞赛中,头部选手的经验或多或少会被其他追赶者复用,这对后来者来说是宝贵的学习机会,只要保持住追赶的势头,就有超越的可能,这次是谷歌,下次又会是谁呢?
最后
我们是信用卡开卡平台4399pay,有532959等经典卡段十余种,支持各平台投放,海淘,467413卡段支持ChatGPT。无限开卡安全可靠收费透明,期待你的关注!