
OpenAI
推理时间的长短对解决复杂问题有飞跃性的提升作用。
到这儿,做CoT的同学乐坏了(有活儿干了,就说这方向有前景嘛。其他同学先别着急,OpenAI也提到过的end2end的CoT是怎么做的?

Google
同时,做推理加速的同学也超高兴(毕竟,谁也不想自己的模型好几分钟才给出答案吧)甚至,做agent的同学也极为兴奋,都说单步成功率是最大瓶颈,现在瓶颈没了,我的论文有着落了。实际上,Devin这个agent界新星在正式发布前就已被邀参加内测了。
做攻防的同学也特别高兴,既然你说应对jAIlbreak已经很熟练了,那就给看看你的大模型,你把cot藏哪儿了?Devin团队也提及,o1对prompt的敏感度提升了,并且对prompt质量有了更高的要求。于是,做提示工程师(prompt engineer)的同学也大喜,谁说模型越强大我们就越容易被淘汰?做Synthetic data(合成数据)的同学当然也很高兴啦:选择数理代码当作突破口,不就是因为这些领域的cot数据好合成嘛。工程的同学也极为兴奋,推理成本(inference cost)的规模变化,肯定会引发一次工程方面的适配与改造。投资的同学很兴奋,能再多烧些钱了,之前闲得只能传AI四小龙的八卦。只能讲OpenAI可真是大好人呐,让好多人有饭吃。比如,它的写作能力甚至还有所下降。例如,它数清strawberry里有几个r还得好几秒。
比如,比较9.11和9.8哪个大,它却要绕到重力方面去纠结(换个数字的话,不一定会涉及重力这部分内容)。但这个过程所反映出的问题是,它缺乏对问题复杂程度的准确评估,并且在回答时倾向于引入更多知识和步骤来解题,像数r的时候能列出十几个步骤。
例如,OpenAI依旧很封闭(我觉得这次透露的信息其实算多的了)。但这都不妨碍它开启新篇章的一角。也盼着国内的老伙计们能尽快跟上,别磨蹭,起来做事啦。太困了,先写一点,明早继续补充。
Copyright © 2025 IZhiDa.com All Rights Reserved.
知答 版权所有 粤ICP备2023042255号