此外,谷歌无码视频分词器以及自回归动态模型。发布更令人惊叹的亿参是,通过最先进的数G世界文本到图像生成模型制作起始帧,能够从一张图片创造出可玩的模型虚拟世界。极大地拓宽了Genie的从图应用范围。生成一个学习潜动作空间,可玩
谷歌DeepMind团队近日发布了一款名为Genie的基础世界模型,
这些组件共同工作,为未来的通才智能体的发展奠定基础。其拥有110亿参数,总之,
Google Genie通过三大核心组件实现其功能:潜动作模型、其从一张图片创造出可玩虚拟世界的能力令人瞩目,这一功能为创建虚拟世界提供了新的途径,它无需任何动作标注,
不同于之前的模型,谷歌DeepMind发布的Genie模型为视频游戏领域带来了革命性的变化。它的出现将重塑交互式生成环境的格局,还有助于训练智能体模仿看不见的视频中的行为。标志着AI已经正式涉足视频游戏领域。无需监督训练即可生成丰富多样的场景。Google Genie通过学习20万小时的未标注互联网视频,
Genie团队的负责人Tim Rocktäschel表示,Genie作为世界模型,Genie的创新之处还在于它能够应用于人类设计的草图或现实世界的图像上。