
Google
这篇博客中仅有一段提及技术细节,从内容推测,Genie 2相比第一代最明显的改进是放弃了含义模糊的潜在动作,转而定义了几个明确的动作,如前进、后退和攻击等。在所有演示中,均设有一个主体,最终由agent控制其行动。这一变化使操作更加直观和易于理解。
总体控制效果显著,初步思考了几种方法和模型的局限与问题。在神经网络生成的世界中,如何确保其一致性是个问题。例如,同一个房间,离开后再返回,看到的景象是否依旧相同?这种连贯性需要得到保证。关于Genie 2中action标注的来源与精度问题:相较于Genie 1,若Genie 2在训练时需依赖标注的action数据,则这些数据如何获取?其精度和一致性怎样确保?是否能够生成足够量的数据以满足需求?这些问题亟待解决。长序列环境建模和泛化性是World Model的核心问题。近期,师弟主导的一项世界模型研究针对这一难题取得了显著进展,展示了出色的效果,值得推荐。
Copyright © 2025 IZhiDa.com All Rights Reserved.
知答 版权所有 粤ICP备2023042255号