Genie 2发布,AI如何从2D跃升至3D世界生成?

AI

1个回答

写回答

女神允儿

2025-12-28 10:27

+ 关注

AI
AI

年末竟已迎来升级版~本以为AI的热潮已退,未料到在24年的最后一个月,它再次变得火爆起来。在Sora疑似泄露和李飞飞团队发布空间智能模型Demo之后,Google DeepMind也迅速跟进,于今日凌晨发布了新一代大规模基础世界模型Genie 2,展现出其在人工智能领域的持续创新能力。?核心功能:基于单张图片创建可供人类AI智能体探索的无尽3D世界。

上一代基础世界模型Genie仅能生成2D世界,玩家互动受帧率限制,整体体验较为简单。Genie 2在多种3D游戏环境中扩展了功能,交互时长和复杂性都显著提升,带来了更丰富的体验。该技术可从单幅图像创建出一个高度多样、逻辑严密且连贯一致的3D环境,类似于World LABS和Decart正在研发的模型,专注于构建复杂的3D场景。这些世界不仅视觉效果丰富,更重要的是能让人或AI智能体通过键盘鼠标持续互动一分钟。可以模拟物体互动、动画、光影、物理特性、反射及NPC行为,创造出极为多样且丰富的3D世界。

Genie 2 能够迅速为各类互动体验创建原型,使研究人员能快速试验新环境,从而训练和测试具身AI智能体,简化了开发流程。借助Genie 2的分布式泛化能力,概念艺术和绘画能转化为完全互动的环境。

Google
Google

不得不承认,DeepMind这次发布的Genie 2确实具有重大意义。在谷歌发布Genie 2前两天,腾讯混元团队也发布了开源的Hunyuan VIDEO。双方几乎同时展示了新技术。这个视频生成模型拥有130亿参数,规模巨大,性能卓越。在画质、动态流畅性和语义理解等方面表现出色,足以与闭源商业模型媲美,展现了强大的竞争力和应用潜力。在开源AI视频模型领域,它属于顶级水平。

此外,还有较早发布的剪辑魔法师,同样融合了视频编辑和人工智能技术。在原有视频功能上融入AI技术,实现多种视频处理自动完成,无需手动编辑。只需输入标题并补充详细内容,如背景、过程和结尾,即可迅速生成高质量的图文视频。制作速度快,效果精美,内容丰富,满足各种需求。

此外,还有即时应用的可灵AI视频生成大模型。

视频时长2分钟,1080p高帧率,画质清晰逼真,媲美电影效果。关键在于支持自定义宽高比,无论是手机还是电脑屏幕,均能完美呈现。

这次发布有个有趣的现象,Genie 2刚推出不久,Sam Altman就再次现身,引起了大家的关注和讨论。今日,Genie 2的热潮虽未沦为OpenAI的陪衬,但奥特曼宣布的新品直播确实吸引了众多目光。接下来的十二天里,仿佛一切与你们无关了。

这已经不知道是第几次了,说你不是故意的,都没人信了,奥特曼。在OpenAI官方推特的配合发布下,谷歌负责开发者关系的Lorgan Kilpatrick在前排留言:真的吗?这一评论显得意味深长。有空欢迎来@社恐打工仔的主页看看~等待OpenAI更新,下次继续聊~

举报有用(0分享收藏

Copyright © 2025 IZhiDa.com All Rights Reserved.

知答 版权所有 粤ICP备2023042255号