全球第一易主,谷歌Gemini2.5 Experimental发布,再次硬刚OpenAI

OpenAI和谷歌你选谁?

Gemini反超OpenAI和DeepSeek!

北京时间3月26日凌晨,谷歌最新推出的Gemini 2.5 Pro Experimental,刚刚被誉为迄今为止最先进的 AI 模型。 

碰巧的是,就在谷歌发布该消息之前,OpenAI率先进行了直播,后续在差不多时间发布了全新的GPT-4o图像生成模型。 

OpenAI指出,人类一直借助视觉信息来交流思想,从早期洞穴壁画到现代信息图表都证明了视觉表达的重要性。 

过去 AI 常能生成令人惊艳的视觉效果,却难以满足实际应用需求;GPT-4o 则能同时保留对话上下文与提示词,并允许用户上传图像进行扩展或修改,大幅提升了视觉输出的精准度和实用价值。 

其背后依托海量网络图文数据训练,建立起语言与图像之间更紧密的关联,并通过完善的后期优化,让生成的图像拥有更高保真度与更丰富的表达方式。 

在价格与性能方面,GPT-4o 同样展现了新变化。 

它的标记器词汇量已提升至约20万个,大幅减少了多语言提示时的损耗。 

费用方面,GPT-4o定价仍高于 GPT-3.5,但相较 GPT-4Turbo便宜近一半:每百万输入tokens收费 5 美元,每百万输出tokens收费15美元。 

值得注意的是,OpenAI 破天荒地向免费用户也开放了这一“旗舰”模型,这在以往并不多见。 

过去半年间,谷歌与 OpenAI 的发布总是不断“撞期”,两家在 AI 领域的正面交锋逐渐升级。

当前谷歌发布的Gemini 2.5 Pro Experimental已经在LMArena排行榜上拔得头筹,超越了 Claude 3.7、Grok 3 以及 DeepSeek-R1 等知名模型。

它在数学、科学以及创意写作等多项基准测试中表现突出,尤其在推理和编码上更是领先一步。 

这一次,谷歌强调让系统“像人一样思考”,而非单纯提供答案。 

Gemini 2.5 Pro 的核心创新在于把推理作为系统底层能力来构建,能够在充分思考和权衡之后才给出解决方案。 

相较于只把推理当作“外挂”的做法,这种全方位的整合让模型在回复时更准确、更贴近真实场景,也更能捕捉用户的上下文含义和细微差异。 

事实证明,这种转变确实大幅提升了模型的表现。 

在谷歌自家的多项评估中,Gemini 2.5 Pro取得了极为抢眼的成绩:

在高度复杂的推理基准上稳居榜首,并且无需依赖昂贵的投票或其他变通手段。

在GPQA与AIME 2025等基准中都领先于同类产品。

面对难度极高的“人类的最后考试”(由数百名专家构建,用来测试人类知识和推理极限)时,更是拿下了18.8% 的优异成绩,而且全程未借助任何工具辅助。

同时,编码能力的飞跃同样值得一提。

相比Gemini 2.0,2.5 Pro 在构建 Web 应用、编写代理式代码以及进行代码转换等任务上都有重大突破。

在 SWE-Bench Verified(专门用来衡量代理编码水平的基准)中,更是靠着定制代理配置取得了 63.8% 的表现。

事实上,谷歌在不久前就推出过Gemini 2.0 Flash Thinking,它能够进行多步推理,并让用户实时追踪它的推理过程。

如今全系 Gemini 2.5 模型都具备类似的 “思考” 功能,在回应之前先对问题进行内部推理和分析,带来准确度与性能的双重提升。

谷歌表示,这背后是“增强过的基础模型结合更好的后期训练”共同作用的结果。 

Gemini 2.5 的发布,意味着谷歌在迈向“智能代理时代”上又向前推进了一大步。 

未来,所有 Gemini 2.5 系列模型都将集成这种“带有思考能力”的结构,能够自主理解复杂情境并执行相应的任务。 

目前,Gemini 2.5 Pro 已在 Google AI Studio 以及 Gemini Advanced 应用平台上线,面向商业和个人用户开放,提供了长达一百万 Token 的上下文窗口。 

需要注意的是,想要使用Gemini 2.5 Pro,需要拥有 Google One AI Premium 订阅(每月20美元,支持国际虚拟信用卡进行支付,需要用卡可选择牛牛虚拟卡平台),并且只能在Gemini Advanced 版本中体验。 

据悉,谷歌计划在未来几周内将其引入Vertex AI,并且届时上下文窗口也会扩展到两百万Token。 

话说回来,同一天发布的俩大产品,GPT-4o属于“全模态”模型,能够处理文本、图像、音频及视频,并以此为基础实现ChatGPT的原生图像生成功能,可谓惊叹;Gemini Pro 2.5则主打强化逻辑推理与复杂问题解答,可号称最智能。 

两大巨头吸足了外界目光。 

当然,两家企业的竞争不断升温,也为AI领域带来了更激烈的创新与更丰富的技术选择,最终受益的相信也是广大用户。 

最后,如果你需要付费使用ChatGPT、Grok、Gemini、Claude等AI工具,可选择开通虚拟信用卡进行付款。牛牛虚拟卡是一个专门提供国际虚拟信用卡的平台(无限开卡且免KYC),有需要的朋友可以添加客服TG(@bullbull1999)咨询了解。

此外,大家平时做跨境业务,高质量的IP必不可少,推荐一家IP平台: 苏豪云(https://sohoclouds.com/),提供原生的静态住宅IP代理。100% 独享、0欺诈风险,你值得拥有!

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注