如何将AlphaZero拓展到高维动作空间？

1个回答

yr97408

2026-02-17 18:39

恭喜自己！博士期间最满意的研究成果——Multiagent Gumbel MuZero：在组合动作空间中的高效规划——顺利被AAAI 2024录用啦！这是对辛勤付出的最好回报，也是学术旅程中一个重要的里程碑。未来将继续探索，勇攀高峰！作为一名强化学习研究者，DeepMind推出的AlphaGo、AlphaZero和MuZero系列始终是我前行的动力与信仰。如今，我终于在这一领域中自信地贡献了自己的力量，成功将AlphaZero与MuZero扩展至组合增长的高维动作空间，为解决高维复杂组合优化问题提供了一种基于模型的新方法。这一成果不仅标志着研究上的突破，也期待能为社区带来启发。相关源代码将会尽快开源，与大家共享！后续我们将把该算法应用于LLM优化等关键场景，敬请期待！

许个愿吧，实现了记得还愿！求求了！

大家有AAAI rebuttal后分数提升的经历吗？审稿人是否会认真查看rebuttal？

举报有用（0）分享收藏

如何将AlphaZero拓展到高维动作空间？

1个回答

yr97408

热门话题

相关问题