DeepSeek V3，为何此次更新让大家感受到变化？

1个回答

橘子嘉人

2026-01-05 07:14

DeepSeek

时间轴上情绪化回答过多，不如放慢节奏，分享些实用内容。DeepSeek V3模型及其论文已发布满一个月，今天却突然涌现众多关注。我想问，为何DeepSeek V3不是在上月推出时就走红，而是今天才受热议？训练仅花费557.6万美元这一信息早在上月就已公开，为何英伟达的股价今天才下跌？持续关注AI产品与社区舆情，我认为DeepSeek的火爆源于多重因素叠加，如技术突破、市场需求及竞争环境等多方面共同推动。

回顾过去一个月，DeepSeek 的火爆既是必然也是偶然。舆论传播往往从几个关键点引爆。梳理其传播路径，关键因素包括：

去年 GPT 走红时，Prompt Engineering 成为焦点，大家热衷于分享指令来优化模型表现。然而，DeepSeek 爆火后，这一概念却鲜有人提及。原因在于，如今的普通用户已无需精心设计提示词，随口一问就能获得理想的回答，使用体验更加便捷自然。楼下 @chengxd 达达认为 DeepSeek V3 学习了 GPT-4o 的输出风格，但我看法不同。这次 DeepSeek 广受关注的回答，并未采用 Bullet notes 式的结构化输出，反而充满想象力与浓厚的文学色彩。这种不受拘束、富有创意的回答，不仅让资深 AI 用户赞叹不已，也让初次接触 AI 的普通用户感到震撼，从而引发广泛共鸣，大家纷纷惊呼其表现非凡。也就是说，若仅模仿 GPT-4o 的输出风格就能走红，那上百种模型早该出名了。这里涉及一个技术细节，模型输出格式 actually 源自 RLHF，这是 ChatGPT 推出时的核心技术。在完成预训练后，通过人类反馈的强化学习，使模型掌握更自然、更优的表达方式，从而提升对话质量。为何其他模型不懂写实之美、浪漫之词，难以迅速吸引普通用户？这是因为它们缺乏对生活的深刻理解和共情能力。R1的能力源于强化学习，而非人类反馈强化学习，这是至关重要的核心差异与变革，也是DeepSeek区别于其他模型的关键所在。这一特点使其在技术路线上独树一帜，值得重点关注。过去一年，模型数量不少，优质模型也有许多，但使用过后会发现，模型同质化现象日益严重。外观与功能大同小异，缺乏新意和惊喜。即便是强大的 OpenAI，也仅能在功能上做些细化优化，比如讲述 Agent 的应用，或者描绘 Sora 学习物理世界的愿景，难以带来真正的突破。当然，O1依然非常强大，其变革也源于自身。我们必须承认，OpenAI率先提出了O1概念，虽未公开训练细节，却在一定程度上带来了新的思路与方法。O1的发展潜力依旧巨大，未来我们仍可借助这一路径获取更强大的模型。建议读到此回答的人去研读R1论文，体会其中的Aha时刻。感受DeepSeek研究员们发现R1能力时的尤里卡瞬间，那将是一段令人振奋的经历，值得每位研究者深入了解与共鸣。

英伟达

因此，我认为 DeepSeek 的研究员们并非着眼于中美竞争，他们胸怀更远大的目标，真正致力于追求通用人工智能的理想，这才忍不住公开了所有技术细节。R1的灵感时刻或许会与能力涌现、RLHF和规模定律一同被铭记，成为AGI发展道路上的重要里程碑。

举报有用（0）分享收藏

DeepSeek V3，为何此次更新让大家感受到变化？

1个回答

橘子嘉人

热门话题

相关问题