今日RFT热度下降,AGI发展转向有用性?

1个回答

写回答

zuhao91

2025-12-27 22:22

+ 关注

人类
人类

与昨日相比冷清许多,这情形着实有些讽刺。我感到困惑,因为今天的意义远比昨天重要得多。达里奥·阿莫迪有望活到150岁。分享一张我刚才看到的有趣图片——

Bindu是个直爽的大姐,我很欣赏她。他们团队的Livebench排行榜也非常出色,值得称赞。很多人因顾及面子,不愿承认PhD级别的数学题对自己毫无用处。

目前AGI的发展方向已经转变,我们不再只关注它是否聪明,而是更注重它是否有实际用途。这种变化非常明显。我们将依次整理以下概念:通用人工智能:像人类一样实现自动化基于Transformer语言模型,模拟人类的思维、行为和道德框架,实现自动化。这种模式由自然语言模型的基础结构决定,在现阶段的数据条件下,虽然不是最高效的方法,但却是最为适用的路径。一个推理智能体,代码编号o1。

OpenAI
OpenAI

懂得趋利避害是关键——知道哪种思维方式会带来奖励,哪种则会招致惩罚。正如我们之前所讨论的,世界虽瞬息万变,但某些模式却始终如一。例如,发散、反思、逻辑纠错、直觉纠错以及TD期望等思考方式,它们在不同情境下都能展现出其独特的作用和价值。强化学习微调技术简称为RFT。OpenAI推出了一项福利,将他们开发的Agent o1开放给用户使用。通过让o1在接近真实世界的数据中进行学习和训练,使其能够在实际数据中进行推理。OpenAI特别强调了学习这一概念,指出像RAG这样的外挂工具远远达不到真正的学习。o1不仅需要利用数据,还要掌握行业内的规律和技巧。这种深度学习方式使得o1具备更强的实用性和适应性。设想一下,若Perplexity将o1融入搜索体系,我们挖掘互联网信息的能力必将更上一层楼,达到新高度。局限性依然存在。由于数据化过程仍需人工操作,若你的数据存在偏差,无法真实反映情况,最终只会将结果导向错误方向。RFT带来了新的希望,我们看到o1这个智能体已能涉足实验科学领域,它有望成为一种非常有用的通用逻辑处理器,开启更多可能性。通用人工智能的希望尚存,150岁的未来在召唤。

举报有用(0分享收藏

Copyright © 2025 IZhiDa.com All Rights Reserved.

知答 版权所有 粤ICP备2023042255号