为什么有人说Claude 3.5 Sonnet v2不如预期？

1个回答

Ccnidir

2026-01-12 16:12

OpenAI
OpenAI

很多人在这个回答下吹捧，但我用了一周，感觉Claude 3.5 Sonnet v2还不如之前，像是降级了。Claude 3.5 Sonnet v2的代码与数学推理能力有所提升，但回答过于简短。在辅助写作或概念解答时，这种简短反而严重影响了实用性，无法满足用户需求。Claude 3.5 Sonnet v2 的回复习惯采用无序标记点的形式，像是在呈现幻灯片中的小标题与重点内容，而非完整的句子或段落表达，这种风格让人印象深刻。

这显然是模型后训练阶段出了问题，输出格式的调整出现了偏差。Claude在回答格式上试图模仿GPT 4o，过多使用项目符号以增强条理性，却不小心变成了类似幻灯片要点的风格。GPT-4o系列模型的输出格式广受赞誉，因此在LMSYS等众测排行榜中名列前茅。其生成内容结构清晰，包含标题、段落与小标题，重点部分以粗体突出。同时，它将内容划分为定义、影响、示例及总结等多个层次，使概念解释更加条理分明、易于理解。读完之后，感觉就像在看一份研报或教材，格式清晰舒服。确实，OpenAI能在各方面保持领先，其估值达到1500亿美元也不足为奇。ChatGPT在大多数用户的使用体验上依旧表现最佳。

举报有用（0）分享收藏

为什么有人说Claude 3.5 Sonnet v2不如预期？

1个回答

Ccnidir

热门话题

相关问题