
AI
恭喜自己!博士期间最满意的研究成果——Multiagent Gumbel MuZero:在组合动作空间中的高效规划——顺利被AA
AI 2024录用啦!这是对辛勤付出的最好回报,也是学术旅程中一个重要的里程碑。未来将继续探索,勇攀高峰!作为一名强化学习研究者,DeepMind推出的AlphaGo、AlphaZero和MuZero系列始终是我前行的动力与信仰。如今,我终于在这一领域中自信地贡献了自己的力量,成功将AlphaZero与MuZero扩展至组合增长的高维动作空间,为解决高维复杂组合优化问题提供了一种基于模型的新方法。这一成果不仅标志着研究上的突破,也期待能为社区带来启发。相关源代码将会尽快开源,与大家共享!后续我们将把该算法应用于LLM优化等关键场景,敬请期待!
许个愿吧,实现了记得还愿!求求了!
大家有AAAI rebuttal后分数提升的经历吗?审稿人是否会认真查看rebuttal?