OpenAI发布带来哪些东西让各领域同学狂喜?

同学OpenAI

1个回答

写回答

OpenAI
OpenAI

本已打算睡了,又起来写点东西。实际上,在今晚之前,OpenAI的颓势几乎肉眼可见。Sora无限期推迟发布,GPT4o的演示效果也未能很好重现,又有宫斗遗留问题和许多人才流失,Claude、Google、xAI等竞争对手已经从远远落后追赶得似乎近在咫尺。OpenAI凭借一颗芯片证明了它依然实力强劲。这就像在沉闷的夏末炸响一道惊雷,给本就唱衰大模型前景的人以警醒。各位从业者像是续了一命,还不赶紧去买英伟达股票?- 矫情到此为止的分割线 -说点正经的,这次发布究竟带来了什么?

推理时间的长短对解决复杂问题有飞跃性的提升作用。

到这儿,做CoT的同学乐坏了(有活儿干了,就说这方向有前景嘛。其他同学先别着急,OpenAI也提到过的end2end的CoT是怎么做的?

Google
Google

于是做强化学习(RL)的同学欣喜若狂(都快哭了),他们总说PPO/DPO都比不上洗数据,咱RL也有今天啊!同时能够发现,o1的推理时间显著增加,有时会长达十几秒。而且o1的context比4o长了一倍,这也是能够理解的,毕竟引入了大量的反思过程。

同时,做推理加速的同学也超高兴(毕竟,谁也不想自己的模型好几分钟才给出答案吧)甚至,做agent的同学也极为兴奋,都说单步成功率是最大瓶颈,现在瓶颈没了,我的论文有着落了。实际上,Devin这个agent界新星在正式发布前就已被邀参加内测了。

做攻防的同学也特别高兴,既然你说应对jAIlbreak已经很熟练了,那就给看看你的大模型,你把cot藏哪儿了?Devin团队也提及,o1对prompt的敏感度提升了,并且对prompt质量有了更高的要求。于是,做提示工程师(prompt engineer)的同学也大喜,谁说模型越强大我们就越容易被淘汰?做Synthetic data(合成数据)的同学当然也很高兴啦:选择数理代码当作突破口,不就是因为这些领域的cot数据好合成嘛。工程的同学也极为兴奋,推理成本(inference cost)的规模变化,肯定会引发一次工程方面的适配与改造。投资的同学很兴奋,能再多烧些钱了,之前闲得只能传AI四小龙的八卦。只能讲OpenAI可真是大好人呐,让好多人有饭吃。比如,它的写作能力甚至还有所下降。例如,它数清strawberry里有几个r还得好几秒。

比如,比较9.11和9.8哪个大,它却要绕到重力方面去纠结(换个数字的话,不一定会涉及重力这部分内容)。但这个过程所反映出的问题是,它缺乏对问题复杂程度的准确评估,并且在回答时倾向于引入更多知识和步骤来解题,像数r的时候能列出十几个步骤。

例如,OpenAI依旧很封闭(我觉得这次透露的信息其实算多的了)。但这都不妨碍它开启新篇章的一角。也盼着国内的老伙计们能尽快跟上,别磨蹭,起来做事啦。太困了,先写一点,明早继续补充。

举报有用(0分享收藏

Copyright © 2025 IZhiDa.com All Rights Reserved.

知答 版权所有 粤ICP备2023042255号