尊龙凯时是真网吗
谷歌AI突然登顶!震惊全球,人类未来或将巨变
新闻动态
新闻动态

谷歌AI突然登顶!震惊全球,人类未来或将巨变

AI领域的老大突然换人了,那些科技巨头之间的竞争真是越来越激烈了。

谷歌发布Gemini 2.5 Pro,拿下多个冠军

谷歌AI又出大招了!最近在AI圈子里掀起了一场大风暴。

前几天,谷歌提前发布了全新升级的Gemini 2.5 Pro Preview(也就是I/O版本)。这个新模型一亮相就直接拿了三个冠军,成功登顶LMeana排行榜。

而且,它还是第一个在文本、视觉和Web开发这些基准测试里都达到顶尖水平的模型。

简单来说,这是从2022年底ChatGPT火起来之后,谷歌第一次在代码生成这块的关键评估中全面超过对手,把其他竞争者都甩在了后面。

图片来源:Google

图片来源:Google

谷歌Gemini 2.5 Pro全面升级

图源:Google

这次发布的版本是今年3月份推出的多模态大语言模型Gemini 2.5 Pro的一个超级重磅升级版。

谷歌那边说,原本打算在谷歌I/O大会上发布这个更新,但看到大家对这个模型的热情这么高,就干脆提前放出来了,让大家都能早点用上,赶紧去开发一些新东西。

现在呢,这个模型已经面向Google AI Studio里的独立开发者、Vertex AI云平台上的企业用户,还有Gemini应用的普通用户开放了。

谷歌还说了,他们没调价也没改速率限制。也就是说,现在用Gemini 2.5 Pro的用户会自动换成新模型,价格还是老样子:每百万个输入token收1.25美元,每百万个输出token收10美元,最多支持20万个token的上下文窗口。

跟Claude 3.7 Sonnet的15美元比起来,谷歌的这个模型明显更划算。而且企业用户还能通过Canvas工具来实现低代码开发,方便又省事。

谷歌新模型编码能力高出Claude 3.7 Sonnet

图源:Google

数据显示,谷歌的新模型得分是1499.95,这可比Sonnet 3.7的1377.10高多了,编码能力直接把Claude 3.7 Sonnet按在地上摩擦。

Gemini 2.5 Pro升级版来了

图源:微博

之前,旧版的Gemini 2.5 Pro(03-25)得分是1278.96,排在第三名。这也就说明新版进步超级大,提升了整整221分!

另外,DeepMind的CEO德米斯·哈萨比斯也说:“特别开心跟大家介绍我们做过的最好的编程模型!今天,我们推出了Gemini 2.5 Pro Preview I/O版,编程能力提升了不少。这个版本在LMArena编程分类里排名第一,在WebDev Arena榜单上也是领先的。”

图源来自微博哦。可以说,头把交椅被取代这件事,真的能看得出谷歌的实力和它的野心有多大。

Gemini 2.5 Pro:从提示到可交互网页应用

当然啦,从谷歌放出的各种初步测试成绩来看,大家对这个新模型的夸奖还真不是空穴来风。那咱们就来说说,它到底有哪些让人眼前一亮的地方。

首先呢,Gemini 2.5 Pro Preview(也就是I/O版本)最大的亮点就是——只要给它一个提示,就能生成一个完整的、能互动的网页应用或者模拟程序。

谷歌还说了,用户要是输入一些视觉风格或者主题相关的提示,它就能直接把这些想法变成能用的代码。这样一来啊,那些想搞设计的开发者或者创意团队,就更容易上手了,门槛也低了不少。

无代码也能打造复杂应用

图源:Google

简单来说,就算你完全不会编程,只要是个普通用户,也能用Gemini 2.5 Pro Preview(也就是I/O版)轻松做出很复杂的应用。

比如,你只需要用平常说话的方式告诉它想要什么功能,或者直接上传一张自己随手画的设计草图,这个Gemini 2.5 Pro I/O版就能自动看懂你的草图,然后生成可以正常工作的代码。要是你在草图里画了个麦克风图标,它不仅能给你做个录音按钮,还会加上动态的波浪效果,还能让暂停功能也正常运作。最后呢,它会直接帮你整出一个完整的网页应用,直接就能用了!

Gemini 2.5 Pro让AI开发更高效

图源来自微博哈。

另外呢,当用户往项目里加新功能的时候,这个模型还能把现有的视觉风格继承下来,不会显得像是东拼西凑的,比如在已经有的React项目里新增组件的时候,CSS类名和动画效果啥的都会自动对齐。

对于这个功能啊,AI艺术工具EverArt的CEO彼得罗·斯基拉诺试了一下,直接就说新版的Gemini 2.5 Pro I/O太厉害了,只要给它一句话提示,就能生成一个互动模拟小游戏,把这个“一只大猩猩打一百个人”的社交媒体梗给整得特别还原,简直就像真的一样。

Hyperbolic CTO力挺Gemini 2.5 Pro

图源来自微博哈。

对了,Hyperbolic公司的联合创始人兼首席技术官(CTO)金宇辰也在自己的账号上写到:“Gemini 2.5 Pro Preview(05-06)现在已经成为我最爱用的编程工具了。在好多高难度的任务测试里,它都比o3(也就是GPT-4o)和Claude 3.7 Sonnet强多了。比如说,让我试试用它来生成一个模拟水桶晃动时水波动画的效果,结果它做得特别棒,把那两个模型远远甩在后面。谷歌啊,我觉得这完全可以叫Gemini 3了!”

Gemini 2.5 Pro:从文字到应用

图源来自微博。

另外呢,有个叫“RameshR”的网友(@rezmeram),他试了一下这个模型,然后不到一分钟就生成了一个类似俄罗斯方块的互动小游戏,还带真实的音效。他在帖子里面调侃说:“这下休闲游戏行业要遭殃啦!”

除了能用一条文字提示就生成完整应用这个亮点之外,Gemini 2.5 Pro I/O版本还在理解视频方面有了更大的进步。

Gemini 2.5 Pro:互动学习与智能开发的新纪元

图源:微博

Gemini 2.5 Pro这个家伙可厉害了!在VideoMME这些基准测试里,它的视频理解能力达到了84.8%,是目前最先进的水平。这就让它可以轻松地把视频内容变成互动学习的应用程序,像是给教育和产品展示这些领域打开了新大门。

在前端开发这块,Gemini 2.5 Pro也在努力让“设计稿转代码”变得更智能。它能更懂设计风格,自己生成对应的CSS代码。比如说你给现有的应用加个新功能,它能自动调整整体视觉效果,这样开发起来就简单多了。

而且呢,这个模型还能很快把想法变成又好看又有用的应用。比如,在谷歌DeepMind的研究员Ali Eslami发的一个演示里,用Gemini 2.5 Pro的“氛围编程”功能搞了个芝加哥艺术学院收藏品的3D导览,特别酷!

Gemini 2.5 Pro I/O版助力企业级开发

图源:微博

最后呢,说到企业级开发那些让人头疼的问题,Gemini 2.5 Pro I/O版真的表现得特别棒,在代码维护这方面特别牛!

先说一个方面吧,它能支持不同框架之间的迁移,比如把React换成Vue这种操作,还能自动帮你更新相关的依赖项,解决兼容性问题。举个例子啊,有个团队把10万行代码从Angular迁移到Next.js,结果错误率才0.3%,简直低到让人不敢相信!

再说另一个方面,针对开发者一直被“AI幻觉”折磨的问题,新版模型用强化学习的方式把API调用出错的概率降到了40%。比如说在做支付功能的时候,系统会很聪明地避开那些假接口的陷阱,直接去调用像Stripe这样的官方认证SDK,这样就能避免很多代码上的坑。

再深入点讲,Gemini 2.5 Pro I/O版还有一个超厉害的地方,就是它的注释优化功能。它能自动生成符合JSDoc标准的注释,还能一键去掉那些多余的解释,这样一来,技术审查的工作效率直接提高了三倍多!

总之啊,这次Gemini 2.5 Pro I/O版的更新,不仅可以根据简单的提示生成代码,还能把图片和视频变成交互式的网页。

换句话说呢,现在的AI已经不只是给用户提供答案的搜索引擎了,它都能直接当创作者了,可以搞创作、数据分析、编程啥的,所以呢,工具和创造者之间的界限就被慢慢淡化了。

AI时代的社会经济挑战与机遇

虽然在抽象思维方面还没完全突破人类的上限,但在实际应用里,它的表现已经够震撼了,直接把传统的开发流程给颠覆了。

对普通人来说,现在不用学编程语言了,只要有点子、有想法,就能用AI来搞创作。全民用AI的前景,那是一下子就变得特别清晰了。

而且啊,效率一提高,这种变化肯定不会只停留在个人创作上,慢慢就会扩展到团队合作里,再进一步影响到公司的发展战略。到最后,整个社会都会被它改变,成为一种新的生产力。

这也说明,这次谷歌的新版本发布,不只是秀肌肉那么简单,更是在告诉我们,人类在使用AI工具的时候,角色正在发生根本性的变化。

不过呢,也有人觉得这事不太好,说这会让那些没什么特别技能的人在社会经济中的优势变得更小,简单说就是,以后可能不光是干重复活的人会被取代,其他人也可能要面临挑战。

也许吧,Gemini 2.5 Pro这么火,可能只是个开始。随着这些科技巨头不断推出新东西,一个靠AI驱动、人和机器一起创造的新时代正在快速到来,咱们就等着瞧吧!

—— 出品:科技头版