DeepSeek的R1相比o1有哪些优势?

DeepSeek

1个回答

写回答

136713143000

2026-01-01 15:59

+ 关注

DeepSeek
DeepSeek

太酷了!早就料到o1的竞争者会很快展开竞争,结果头名被DeepSeek拿下。这时候k0 - math恐怕要郁闷死了,没办法,所谓天下武功,速度至上,比别人先上线就是厉害。DeepSeek官网的Chat形式能体验R1了,一天限50条消息。R1比o1更纯正,不隐藏思维链,能让我们完整看到推理过程。

一定要点开Deep Think,不然就不是用R1。我就闹笑话了,问原来的模型Strawberry里有多少个r这个经典问题,它居然回答2个r,真晕。打开Deep Think后再问这个问题,R1一上线就开始不停地说,真的是说了好多啊。最后R1给出了正确答案,其推理过程很有趣。它多次提及有些人说只有2个r,甚至有些刻意展现反复推理的感觉。之后我又试了几个问题,R1都输出了很长的推理过程。看来这就是R1的真实表现,并非针对特定问题刻意为之。o1刚问世时,有个刁难AI的经典问题:假设实验室造出一种反重力且能悬浮的物质,实验小白鼠吃了就飞起来了;猫吃了这只鼠后也飞起来;老鹰吃了这只猫同样飞起来,那老鹰为何会飞起来?我先提问,尝试以对话方式引导R1。最终,R1推理花费了203秒之久!

疯狂输出一大段推理文字后得出结论,结论没问题,不过这推理过程想必消耗了超多的tokens。

AI
AI

不过,输入完整的老鹰为什么飞起来这一问题时,R1仅思考了29秒。

o1可能会被骗而认为老鹰是间接吃了反重力物质才会飞,R1就好多了,它知道老鹰本身有飞行能力,只是反重力物质增强了老鹰的飞行能力。暴露思维链过程很有意义,能据此补充与调整提示词内容,进而改进模型表现。感觉超棒。这次DeepSeek比Anthropic、Gemini、Meta等众多AI大厂更早推出类似o1的模型,还首开暴露思维链的先例。既然这成了标配,那各个大厂推出的模型就不能像OpenAI那样小气,把思维链藏着掖着了,都得暴露思维链,这对大家而言是件好事。

举报有用(0分享收藏

Copyright © 2025 IZhiDa.com All Rights Reserved.

知答 版权所有 粤ICP备2023042255号