
汽车
Genie系列在当前所有工作中,最接近我心中理想的世界模型,尽管它依然有很长的路要走。当Genie 1问世时,我就表达过类似的看法。现在看来,大部分观点依然有效。Genie系列的价值不仅仅在于生成未来时刻的游戏视频,更在于它赋予了系统一种想象力,这种想象力可以大幅减少在任何环境中训练智能体的成本。我们知道,目前的人工智能算法都依赖于数据驱动的方法。这意味着,为了在一个特定环境中训练一个智能体,必须让这个智能体反复与环境互动,从而收集大量数据来迭代和优化其参数。这种方法在游戏环境中相对容易实现,例如DQN在Atari 2600游戏中的应用、AlphaGo/AlphaZero在围棋上的表现、以及AlphaStar在星际争霸中的成就。它们的共同点是,这些智能体可以不受限制地与游戏环境进行交互。然而,这种方法在现实世界中却难以行得通,因为在实际场景中进行仿真的代价非常高,甚至在很多情况下还会涉及到安全和伦理问题(比如,无法要求自动驾驶
汽车去撞击行人以获取训练数据)。在这种背景下,为模型注入想象力显得尤为重要,而这正是Genie系列的核心价值所在。它使得模型能够通过少量的交互数据来模拟或猜测环境的行为(需要说明的是,虽然Genie模型本身是在大量交互数据上训练出来的,但它能够赋予即将训练的智能体利用少量交互数据的能力)。这样一来,就能显著减少智能体与环境的交互次数,降低训练成本,并缓解安全和伦理问题。这对于在真实世界中训练智能体具有重大意义。我大胆预测,接下来Genie团队可能会探索这样的设定:给定某个游戏环境,限制智能体与环境的交互次数(例如只允许玩100局游戏且不允许读档),并在此基础上最大化智能体的能力。这样,Genie系列模型就可以在训练过程中引入大量的生成(想象)数据,从而提升智能体的表现。这类似于传统意义上结合真实标签和伪标签的训练方法,但更具挑战性,涉及主动学习和强化学习策略问题。考虑到强化学习本身就是DeepMind的强项,我对这条路径的未来发展充满期待。总结Genie系列不仅展示了人工智能在模拟和生成方面的潜力,还为解决现实世界中训练智能体所面临的难题提供了新的思路。尽管这一系列工作还有许多需要改进的地方,但它的出现无疑为我们描绘了一个更加智能化、高效化的未来图景。随着技术的不断进步,我们有理由相信,Genie系列将不断完善自身,在推动人工智能发展方面发挥更大的作用。未来的研究可能会进一步探索如何更好地结合现实与虚拟的数据,以实现更高效的训练和更广泛的应用。无论是在游戏领域还是在更为复杂的现实场景中,Genie系列都有望成为人工智能发展的关键驱动力之一。