当红炸子鸡Sora 热尚未褪去,谷歌Genie又来,
一张图,便可召唤一個交互式世界,谷歌这次出手又是一個王炸,直杠Open AI,
日前,谷歌发布110亿参数全新AI基石世界模型——Genie〔生成式交互环境,Genie 中文意为“精灵”〕,
与之前仅Follow世界生成模型不同样是:Genie 允许运用者与创建环境实行交互,它可以经由文本、合成图像、照片甚至草图生成可玩交互式环境、可控虚拟世界,
谷歌表达,Genie开启“图/文生成交互世界”阶段,还将变成实行通用AI Agent催化剂,
值得一提是,Genie问世代表生成式人工智能一個重大进步,也让人工智能在虚拟世界散发出无限大概性,
据谷歌介绍,Genie AI 是一個相对较小模型,持有 110 亿個参数,
它由时空影像分词器、自回归动力学模型、简单且可扩展潜在动作模型组成,
Genie 在大量公开互联网影像数据集上实行没有任何动作标签训练,可以将任何图像〔任凭是现实世界照片、草图、人工智能生成图像还是绘画〕转换为简单 2D 平台游戏,
最大前无古人后无来者之处是,它可以经由无监督学习来理解游戏世界中角色移动、控制、行动,并根据运用者操作占卜后世帧,于是创建功能性、可玩性体验,
简而言之,Genie能“自学成才”,
谷歌DeepMind团队指出,它用途广泛,适用于各個领域,且可以扩展到更大互联网数据集,
另外谷歌还着重,这种新模型为后世人工智能打开大门,让他们可以“在新、生成世界永无止境课程中”接受培训,
与Sora相比,Genie进步在哪?
不久之后前,OpenAI发布最先個文生影像模型,Sora一出,就震惊四座,
它不光能生成逼真人工智能影像,还能够创建持久角色、风格、环境,Open AI更是将称其为“世界模拟器”,
于是,也有网友称,Genie是谷歌对Sora不痛不痒回击,
但是,谷歌Genie团队掌门人Tim Rocktäschel则称,无法否认,OpenAI Sora 确实让人印象透彻,视觉上让人惊叹,但世界模型须要“行动”,
Genie 是一個动作可控世界模型,但百分之百不受影像监督训练,这是迈向AGI通用世界模型充盈希望一步,
英伟达科学家Jim Fan也表达,与Sora各异是,Genie实际上是一個由行动驱动世界模型,具有推断行动本事,2024年也将是基石世界模型之年,
“Sora很好,但是Genie将会是具身智能体主干之作”,
作为一個基石世界模型,可以说,Genie 处于可以生成、管理虚拟环境人工智能系统最前沿,
它发展地标着基石世界模型向前迈出要紧一步,这不光是游戏技术进步,也地标着人工智能系统本事更广泛转变,
眼下,AI大模型战场正“烽烟四起”,硅谷巨头们厮杀甚是激烈,前几天,谷歌才刚刚推出开源大模型——Gemma,打响AI 开源之战,
但硅谷大厂们,在这轮AI浪潮上也已经卷出新高度,除谷歌一连串“输出”之外,微软也在加大“火力”,
继OpenAI之后,微软刚刚又将法国初创公司Mistral AI纳入麾下,
作为一家成立仅10個月初创公司,Mistral AI发布Mistral Large模型性能已经直逼GPT-4,
据悉,在常用基准测试中,Mistral Large表现仅次于GPT-4,超过GPT-3.5、谷歌Gemini Pro、MetaLLaMA 2 70 B。
这一次,谁会变成“下一個OpenAI”呢?