DeepSeek V3,为何此次更新让大家感受到变化?

DeepSeek

1个回答

写回答

橘子嘉人

2026-01-05 07:14

+ 关注

DeepSeek
DeepSeek

时间轴上情绪化回答过多,不如放慢节奏,分享些实用内容。DeepSeek V3模型及其论文已发布满一个月,今天却突然涌现众多关注。我想问,为何DeepSeek V3不是在上月推出时就走红,而是今天才受热议?训练仅花费557.6万美元这一信息早在上月就已公开,为何英伟达的股价今天才下跌?持续关注AI产品与社区舆情,我认为DeepSeek的火爆源于多重因素叠加,如技术突破、市场需求及竞争环境等多方面共同推动。

回顾过去一个月,DeepSeek 的火爆既是必然也是偶然。舆论传播往往从几个关键点引爆。梳理其传播路径,关键因素包括:

去年 GPT 走红时,Prompt Engineering 成为焦点,大家热衷于分享指令来优化模型表现。然而,DeepSeek 爆火后,这一概念却鲜有人提及。原因在于,如今的普通用户已无需精心设计提示词,随口一问就能获得理想的回答,使用体验更加便捷自然。楼下 @chengxd 达达 认为 DeepSeek V3 学习了 GPT-4o 的输出风格,但我看法不同。这次 DeepSeek 广受关注的回答,并未采用 Bullet notes 式的结构化输出,反而充满想象力与浓厚的文学色彩。这种不受拘束、富有创意的回答,不仅让资深 AI 用户赞叹不已,也让初次接触 AI 的普通用户感到震撼,从而引发广泛共鸣,大家纷纷惊呼其表现非凡。也就是说,若仅模仿 GPT-4o 的输出风格就能走红,那上百种模型早该出名了。这里涉及一个技术细节,模型输出格式 actually 源自 RLHF,这是 ChatGPT 推出时的核心技术。在完成预训练后,通过人类反馈的强化学习,使模型掌握更自然、更优的表达方式,从而提升对话质量。为何其他模型不懂写实之美、浪漫之词,难以迅速吸引普通用户?这是因为它们缺乏对生活的深刻理解和共情能力。R1的能力源于强化学习,而非人类反馈强化学习,这是至关重要的核心差异与变革,也是DeepSeek区别于其他模型的关键所在。这一特点使其在技术路线上独树一帜,值得重点关注。过去一年,模型数量不少,优质模型也有许多,但使用过后会发现,模型同质化现象日益严重。外观与功能大同小异,缺乏新意和惊喜。即便是强大的 OpenAI,也仅能在功能上做些细化优化,比如讲述 Agent 的应用,或者描绘 Sora 学习物理世界的愿景,难以带来真正的突破。当然,O1依然非常强大,其变革也源于自身。我们必须承认,OpenAI率先提出了O1概念,虽未公开训练细节,却在一定程度上带来了新的思路与方法。O1的发展潜力依旧巨大,未来我们仍可借助这一路径获取更强大的模型。建议读到此回答的人去研读R1论文,体会其中的Aha时刻。感受DeepSeek研究员们发现R1能力时的尤里卡瞬间,那将是一段令人振奋的经历,值得每位研究者深入了解与共鸣。

英伟达
英伟达

因此,我认为 DeepSeek 的研究员们并非着眼于中美竞争,他们胸怀更远大的目标,真正致力于追求通用人工智能的理想,这才忍不住公开了所有技术细节。R1的灵感时刻或许会与能力涌现、RLHF和规模定律一同被铭记,成为AGI发展道路上的重要里程碑。

举报有用(0分享收藏

Copyright © 2025 IZhiDa.com All Rights Reserved.

知答 版权所有 粤ICP备2023042255号