Genie 2发布，AI如何从2D跃升至3D世界生成？

1个回答

女神允儿

2025-12-28 10:27

年末竟已迎来升级版~本以为AI的热潮已退，未料到在24年的最后一个月，它再次变得火爆起来。在Sora疑似泄露和李飞飞团队发布空间智能模型Demo之后，Google DeepMind也迅速跟进，于今日凌晨发布了新一代大规模基础世界模型Genie 2，展现出其在人工智能领域的持续创新能力。?核心功能：基于单张图片创建可供人类或AI智能体探索的无尽3D世界。

上一代基础世界模型Genie仅能生成2D世界，玩家互动受帧率限制，整体体验较为简单。Genie 2在多种3D游戏环境中扩展了功能，交互时长和复杂性都显著提升，带来了更丰富的体验。该技术可从单幅图像创建出一个高度多样、逻辑严密且连贯一致的3D环境，类似于World LABS和Decart正在研发的模型，专注于构建复杂的3D场景。这些世界不仅视觉效果丰富，更重要的是能让人或AI智能体通过键盘鼠标持续互动一分钟。可以模拟物体互动、动画、光影、物理特性、反射及NPC行为，创造出极为多样且丰富的3D世界。

Genie 2 能够迅速为各类互动体验创建原型，使研究人员能快速试验新环境，从而训练和测试具身AI智能体，简化了开发流程。借助Genie 2的分布式泛化能力，概念艺术和绘画能转化为完全互动的环境。

Google
Google

不得不承认，DeepMind这次发布的Genie 2确实具有重大意义。在谷歌发布Genie 2前两天，腾讯混元团队也发布了开源的Hunyuan VIDEO。双方几乎同时展示了新技术。这个视频生成模型拥有130亿参数，规模巨大，性能卓越。在画质、动态流畅性和语义理解等方面表现出色，足以与闭源商业模型媲美，展现了强大的竞争力和应用潜力。在开源AI视频模型领域，它属于顶级水平。

此外，还有较早发布的剪辑魔法师，同样融合了视频编辑和人工智能技术。在原有视频功能上融入AI技术，实现多种视频处理自动完成，无需手动编辑。只需输入标题并补充详细内容，如背景、过程和结尾，即可迅速生成高质量的图文视频。制作速度快，效果精美，内容丰富，满足各种需求。

此外，还有即时应用的可灵AI视频生成大模型。

视频时长2分钟，1080p高帧率，画质清晰逼真，媲美电影效果。关键在于支持自定义宽高比，无论是手机还是电脑屏幕，均能完美呈现。

这次发布有个有趣的现象，Genie 2刚推出不久，Sam Altman就再次现身，引起了大家的关注和讨论。今日，Genie 2的热潮虽未沦为OpenAI的陪衬，但奥特曼宣布的新品直播确实吸引了众多目光。接下来的十二天里，仿佛一切与你们无关了。

这已经不知道是第几次了，说你不是故意的，都没人信了，奥特曼。在OpenAI官方推特的配合发布下，谷歌负责开发者关系的Lorgan Kilpatrick在前排留言：真的吗？这一评论显得意味深长。有空欢迎来@社恐打工仔的主页看看~等待OpenAI更新，下次继续聊~

举报有用（0）分享收藏

Genie 2发布，AI如何从2D跃升至3D世界生成？

1个回答

女神允儿

热门话题

相关问题