谷歌推出全新AI模型Genie，以一张图形式打造交互式游戏世界。

DeGao 2025-09-06 19:19:27

当红炸子鸡Sora 热尚未褪去，谷歌Genie又来，

一张图，便可召唤一個交互式世界，谷歌这次出手又是一個王炸，直杠Open AI，

日前，谷歌发布110亿参数全新AI基石世界模型——Genie〔生成式交互环境，Genie 中文意为“精灵”〕，

与之前仅Follow世界生成模型不同样是：Genie 允许运用者与创建环境实行交互，它可以经由文本、合成图像、照片甚至草图生成可玩交互式环境、可控虚拟世界，

谷歌表达，Genie开启“图/文生成交互世界”阶段，还将变成实行通用AI Agent催化剂，

值得一提是，Genie问世代表生成式人工智能一個重大进步，也让人工智能在虚拟世界散发出无限大概性，

据谷歌介绍，Genie AI 是一個相对较小模型，持有 110 亿個参数，

它由时空影像分词器、自回归动力学模型、简单且可扩展潜在动作模型组成，

Genie 在大量公开互联网影像数据集上实行没有任何动作标签训练，可以将任何图像〔任凭是现实世界照片、草图、人工智能生成图像还是绘画〕转换为简单 2D 平台游戏，

最大前无古人后无来者之处是，它可以经由无监督学习来理解游戏世界中角色移动、控制、行动，并根据运用者操作占卜后世帧，于是创建功能性、可玩性体验，

简而言之，Genie能“自学成才”，

谷歌DeepMind团队指出，它用途广泛，适用于各個领域，且可以扩展到更大互联网数据集，

另外谷歌还着重，这种新模型为后世人工智能打开大门，让他们可以“在新、生成世界永无止境课程中”接受培训，

与Sora相比，Genie进步在哪？

不久之后前，OpenAI发布最先個文生影像模型，Sora一出，就震惊四座，

它不光能生成逼真人工智能影像，还能够创建持久角色、风格、环境，Open AI更是将称其为“世界模拟器”，

于是，也有网友称，Genie是谷歌对Sora不痛不痒回击，

但是，谷歌Genie团队掌门人Tim Rocktäschel则称，无法否认，OpenAI Sora 确实让人印象透彻，视觉上让人惊叹，但世界模型须要“行动”，

Genie 是一個动作可控世界模型，但百分之百不受影像监督训练，这是迈向AGI通用世界模型充盈希望一步，

英伟达科学家Jim Fan也表达，与Sora各异是，Genie实际上是一個由行动驱动世界模型，具有推断行动本事，2024年也将是基石世界模型之年，

“Sora很好，但是Genie将会是具身智能体主干之作”，

作为一個基石世界模型，可以说，Genie 处于可以生成、管理虚拟环境人工智能系统最前沿，

它发展地标着基石世界模型向前迈出要紧一步，这不光是游戏技术进步，也地标着人工智能系统本事更广泛转变，

眼下，AI大模型战场正“烽烟四起”，硅谷巨头们厮杀甚是激烈，前几天，谷歌才刚刚推出开源大模型——Gemma，打响AI 开源之战，

但硅谷大厂们，在这轮AI浪潮上也已经卷出新高度，除谷歌一连串“输出”之外，微软也在加大“火力”，

继OpenAI之后，微软刚刚又将法国初创公司Mistral AI纳入麾下，

作为一家成立仅10個月初创公司，Mistral AI发布Mistral Large模型性能已经直逼GPT-4，

据悉，在常用基准测试中，Mistral Large表现仅次于GPT-4，超过GPT-3.5、谷歌Gemini Pro、MetaLLaMA 2 70 B。

这一次，谁会变成“下一個OpenAI”呢？

很高兴你能耐心的读完我的文章，你一定不想在AI时代错过原创、深挖的消息，请关注DeGao的Twitter，不迷路！

相关资讯