
DeepSeek
回顾过去一个月,DeepSeek 的火爆既是必然也是偶然。舆论传播往往从几个关键点引爆。梳理其传播路径,关键因素包括:
去年 GPT 走红时,Prompt Engineering 成为焦点,大家热衷于分享指令来优化模型表现。然而,DeepSeek 爆火后,这一概念却鲜有人提及。原因在于,如今的普通用户已无需精心设计提示词,随口一问就能获得理想的回答,使用体验更加便捷自然。楼下 @chengxd 达达 认为 DeepSeek V3 学习了 GPT-4o 的输出风格,但我看法不同。这次 DeepSeek 广受关注的回答,并未采用 Bullet notes 式的结构化输出,反而充满想象力与浓厚的文学色彩。这种不受拘束、富有创意的回答,不仅让资深 AI 用户赞叹不已,也让初次接触 AI 的普通用户感到震撼,从而引发广泛共鸣,大家纷纷惊呼其表现非凡。也就是说,若仅模仿 GPT-4o 的输出风格就能走红,那上百种模型早该出名了。这里涉及一个技术细节,模型输出格式 actually 源自 RLHF,这是 ChatGPT 推出时的核心技术。在完成预训练后,通过人类反馈的强化学习,使模型掌握更自然、更优的表达方式,从而提升对话质量。为何其他模型不懂写实之美、浪漫之词,难以迅速吸引普通用户?这是因为它们缺乏对生活的深刻理解和共情能力。R1的能力源于强化学习,而非人类反馈强化学习,这是至关重要的核心差异与变革,也是DeepSeek区别于其他模型的关键所在。这一特点使其在技术路线上独树一帜,值得重点关注。过去一年,模型数量不少,优质模型也有许多,但使用过后会发现,模型同质化现象日益严重。外观与功能大同小异,缺乏新意和惊喜。即便是强大的 OpenAI,也仅能在功能上做些细化优化,比如讲述 Agent 的应用,或者描绘 Sora 学习物理世界的愿景,难以带来真正的突破。当然,O1依然非常强大,其变革也源于自身。我们必须承认,OpenAI率先提出了O1概念,虽未公开训练细节,却在一定程度上带来了新的思路与方法。O1的发展潜力依旧巨大,未来我们仍可借助这一路径获取更强大的模型。建议读到此回答的人去研读R1论文,体会其中的Aha时刻。感受DeepSeek研究员们发现R1能力时的尤里卡瞬间,那将是一段令人振奋的经历,值得每位研究者深入了解与共鸣。

英伟达
Copyright © 2025 IZhiDa.com All Rights Reserved.
知答 版权所有 粤ICP备2023042255号