Gemini 2.5 Pro通关宝可梦蓝 谷歌创造首个AI冠军

资讯科技5月3日消息,就在刚刚,Gemini 2.5 Pro 在直播中通关了《宝可梦蓝》。

谷歌CEO皮查伊第一时间兴奋官宣,放出通关时刻珍贵影像:

Gemini 2.5 Pro通关宝可梦蓝 谷歌创造首个AI冠军

后续,Gemini的介绍里可能会多一条:“首个成为宝可梦联盟冠军、登入《宝可梦蓝》名人堂的AI大模型”。

此次直播是由一位名为Joel Z的软件工程师运行,他做这个实验,是因为Gemini 2.5Pro出了个实验版,大家好奇它玩游戏怎么样。

而Gemini 2.5Pro实验版则是受“ClaudePlaysPokemon”项目的启发,两个项目类似,区别是Claude的项目玩的是宝可梦红,而Gemini 2.5Pro的项目玩的是宝可梦蓝。

两款都是比较经典的宝可梦游戏,虽然放到现在游戏有那么点无聊,甚至大家会觉得这游戏太简单,但让大模型去玩这个游戏甚至自己通关可不是个容易的事情。

Claude这边,一年前旧模Claude3.5 只能勉强走出新手村到达常磐森林;2个月前,Claude 3.7 倒是终于能击败道馆主了,但也并未通关宝可梦。

目前,大模型的表现明显不如人类,参照“Claude Plays Pokémon”项目研究人员的说法,这主要是因为大模型“视力不佳”。

以Claude为例,模型很难像人类一样去解读屏幕里展现出的低分辨率、像素化的世界;同时,游戏中的二维地图看上去对未经专门训练的大模型而言也充满挑战性。

通俗点讲就是人物经常会迷路,穿不过建筑物。

Joel Z表示,这个项目不是简单地让AI瞎点,而是构建了一套自主决策系统,对比Claude还有个自动导航工具,而Gemini 2.5Pro则让他自主决定目的地,然后自己规划路线。

现在,谷歌的Gemini 2.5Pro率先实现了新的突破,并表示还将在这个有趣的挑战中进行更多探索。

或许真的像网友所说:以后测试大模型的基准要变成谁能更快通关宝可梦了。