新闻动态

新闻动态

新闻动态

你的位置：尊龙凯时是真网吗 > 新闻动态 >

谷歌AI突然登顶！震惊全球，人类未来或将巨变

AI领域的老大突然换人了，那些科技巨头之间的竞争真是越来越激烈了。

谷歌发布Gemini 2.5 Pro，拿下多个冠军

谷歌AI又出大招了！最近在AI圈子里掀起了一场大风暴。

前几天，谷歌提前发布了全新升级的Gemini 2.5 Pro Preview（也就是I/O版本）。这个新模型一亮相就直接拿了三个冠军，成功登顶LMeana排行榜。

而且，它还是第一个在文本、视觉和Web开发这些基准测试里都达到顶尖水平的模型。

简单来说，这是从2022年底ChatGPT火起来之后，谷歌第一次在代码生成这块的关键评估中全面超过对手，把其他竞争者都甩在了后面。

图片来源：Google

图片来源：Google

谷歌Gemini 2.5 Pro全面升级

图源：Google

这次发布的版本是今年3月份推出的多模态大语言模型Gemini 2.5 Pro的一个超级重磅升级版。

谷歌那边说，原本打算在谷歌I/O大会上发布这个更新，但看到大家对这个模型的热情这么高，就干脆提前放出来了，让大家都能早点用上，赶紧去开发一些新东西。

现在呢，这个模型已经面向Google AI Studio里的独立开发者、Vertex AI云平台上的企业用户，还有Gemini应用的普通用户开放了。

谷歌还说了，他们没调价也没改速率限制。也就是说，现在用Gemini 2.5 Pro的用户会自动换成新模型，价格还是老样子：每百万个输入token收1.25美元，每百万个输出token收10美元，最多支持20万个token的上下文窗口。

跟Claude 3.7 Sonnet的15美元比起来，谷歌的这个模型明显更划算。而且企业用户还能通过Canvas工具来实现低代码开发，方便又省事。

谷歌新模型编码能力高出Claude 3.7 Sonnet

图源：Google

数据显示，谷歌的新模型得分是1499.95，这可比Sonnet 3.7的1377.10高多了，编码能力直接把Claude 3.7 Sonnet按在地上摩擦。

Gemini 2.5 Pro升级版来了

图源：微博

之前，旧版的Gemini 2.5 Pro（03-25）得分是1278.96，排在第三名。这也就说明新版进步超级大，提升了整整221分！

另外，DeepMind的CEO德米斯·哈萨比斯也说：“特别开心跟大家介绍我们做过的最好的编程模型！今天，我们推出了Gemini 2.5 Pro Preview I/O版，编程能力提升了不少。这个版本在LMArena编程分类里排名第一，在WebDev Arena榜单上也是领先的。”

图源来自微博哦。可以说，头把交椅被取代这件事，真的能看得出谷歌的实力和它的野心有多大。

Gemini 2.5 Pro：从提示到可交互网页应用

当然啦，从谷歌放出的各种初步测试成绩来看，大家对这个新模型的夸奖还真不是空穴来风。那咱们就来说说，它到底有哪些让人眼前一亮的地方。

首先呢，Gemini 2.5 Pro Preview（也就是I/O版本）最大的亮点就是——只要给它一个提示，就能生成一个完整的、能互动的网页应用或者模拟程序。

谷歌还说了，用户要是输入一些视觉风格或者主题相关的提示，它就能直接把这些想法变成能用的代码。这样一来啊，那些想搞设计的开发者或者创意团队，就更容易上手了，门槛也低了不少。

无代码也能打造复杂应用

图源：Google

简单来说，就算你完全不会编程，只要是个普通用户，也能用Gemini 2.5 Pro Preview（也就是I/O版）轻松做出很复杂的应用。

比如，你只需要用平常说话的方式告诉它想要什么功能，或者直接上传一张自己随手画的设计草图，这个Gemini 2.5 Pro I/O版就能自动看懂你的草图，然后生成可以正常工作的代码。要是你在草图里画了个麦克风图标，它不仅能给你做个录音按钮，还会加上动态的波浪效果，还能让暂停功能也正常运作。最后呢，它会直接帮你整出一个完整的网页应用，直接就能用了！

Gemini 2.5 Pro让AI开发更高效

图源来自微博哈。

另外呢，当用户往项目里加新功能的时候，这个模型还能把现有的视觉风格继承下来，不会显得像是东拼西凑的，比如在已经有的React项目里新增组件的时候，CSS类名和动画效果啥的都会自动对齐。

对于这个功能啊，AI艺术工具EverArt的CEO彼得罗·斯基拉诺试了一下，直接就说新版的Gemini 2.5 Pro I/O太厉害了，只要给它一句话提示，就能生成一个互动模拟小游戏，把这个“一只大猩猩打一百个人”的社交媒体梗给整得特别还原，简直就像真的一样。

Hyperbolic CTO力挺Gemini 2.5 Pro

图源来自微博哈。

对了，Hyperbolic公司的联合创始人兼首席技术官（CTO）金宇辰也在自己的账号上写到：“Gemini 2.5 Pro Preview（05-06）现在已经成为我最爱用的编程工具了。在好多高难度的任务测试里，它都比o3（也就是GPT-4o）和Claude 3.7 Sonnet强多了。比如说，让我试试用它来生成一个模拟水桶晃动时水波动画的效果，结果它做得特别棒，把那两个模型远远甩在后面。谷歌啊，我觉得这完全可以叫Gemini 3了！”

Gemini 2.5 Pro：从文字到应用

图源来自微博。

另外呢，有个叫“RameshR”的网友（@rezmeram），他试了一下这个模型，然后不到一分钟就生成了一个类似俄罗斯方块的互动小游戏，还带真实的音效。他在帖子里面调侃说：“这下休闲游戏行业要遭殃啦！”

除了能用一条文字提示就生成完整应用这个亮点之外，Gemini 2.5 Pro I/O版本还在理解视频方面有了更大的进步。

Gemini 2.5 Pro：互动学习与智能开发的新纪元

图源：微博

Gemini 2.5 Pro这个家伙可厉害了！在VideoMME这些基准测试里，它的视频理解能力达到了84.8%，是目前最先进的水平。这就让它可以轻松地把视频内容变成互动学习的应用程序，像是给教育和产品展示这些领域打开了新大门。

在前端开发这块，Gemini 2.5 Pro也在努力让“设计稿转代码”变得更智能。它能更懂设计风格，自己生成对应的CSS代码。比如说你给现有的应用加个新功能，它能自动调整整体视觉效果，这样开发起来就简单多了。

而且呢，这个模型还能很快把想法变成又好看又有用的应用。比如，在谷歌DeepMind的研究员Ali Eslami发的一个演示里，用Gemini 2.5 Pro的“氛围编程”功能搞了个芝加哥艺术学院收藏品的3D导览，特别酷！

Gemini 2.5 Pro I/O版助力企业级开发

图源：微博

最后呢，说到企业级开发那些让人头疼的问题，Gemini 2.5 Pro I/O版真的表现得特别棒，在代码维护这方面特别牛！

先说一个方面吧，它能支持不同框架之间的迁移，比如把React换成Vue这种操作，还能自动帮你更新相关的依赖项，解决兼容性问题。举个例子啊，有个团队把10万行代码从Angular迁移到Next.js，结果错误率才0.3%，简直低到让人不敢相信！

再说另一个方面，针对开发者一直被“AI幻觉”折磨的问题，新版模型用强化学习的方式把API调用出错的概率降到了40%。比如说在做支付功能的时候，系统会很聪明地避开那些假接口的陷阱，直接去调用像Stripe这样的官方认证SDK，这样就能避免很多代码上的坑。

再深入点讲，Gemini 2.5 Pro I/O版还有一个超厉害的地方，就是它的注释优化功能。它能自动生成符合JSDoc标准的注释，还能一键去掉那些多余的解释，这样一来，技术审查的工作效率直接提高了三倍多！

总之啊，这次Gemini 2.5 Pro I/O版的更新，不仅可以根据简单的提示生成代码，还能把图片和视频变成交互式的网页。

换句话说呢，现在的AI已经不只是给用户提供答案的搜索引擎了，它都能直接当创作者了，可以搞创作、数据分析、编程啥的，所以呢，工具和创造者之间的界限就被慢慢淡化了。

AI时代的社会经济挑战与机遇

虽然在抽象思维方面还没完全突破人类的上限，但在实际应用里，它的表现已经够震撼了，直接把传统的开发流程给颠覆了。

对普通人来说，现在不用学编程语言了，只要有点子、有想法，就能用AI来搞创作。全民用AI的前景，那是一下子就变得特别清晰了。

而且啊，效率一提高，这种变化肯定不会只停留在个人创作上，慢慢就会扩展到团队合作里，再进一步影响到公司的发展战略。到最后，整个社会都会被它改变，成为一种新的生产力。

这也说明，这次谷歌的新版本发布，不只是秀肌肉那么简单，更是在告诉我们，人类在使用AI工具的时候，角色正在发生根本性的变化。

不过呢，也有人觉得这事不太好，说这会让那些没什么特别技能的人在社会经济中的优势变得更小，简单说就是，以后可能不光是干重复活的人会被取代，其他人也可能要面临挑战。

也许吧，Gemini 2.5 Pro这么火，可能只是个开始。随着这些科技巨头不断推出新东西，一个靠AI驱动、人和机器一起创造的新时代正在快速到来，咱们就等着瞧吧！

—— 出品：科技头版

下一篇：纪录片《妻子离世他信守诺言，独居数年再未娶，身边一只狗一群牛羊作伴》上一篇：掌趣科技第一大股东刘惠城拟减持不超2720万股