为什么有人说Claude 3.5 Sonnet v2不如预期?

1个回答

写回答

Ccnidir

2026-01-12 16:12

+ 关注

OpenAI
OpenAI

很多人在这个回答下吹捧,但我用了一周,感觉Claude 3.5 Sonnet v2还不如之前,像是降级了。Claude 3.5 Sonnet v2的代码与数学推理能力有所提升,但回答过于简短。在辅助写作或概念解答时,这种简短反而严重影响了实用性,无法满足用户需求。Claude 3.5 Sonnet v2 的回复习惯采用无序标记点的形式,像是在呈现幻灯片中的小标题与重点内容,而非完整的句子或段落表达,这种风格让人印象深刻。

这显然是模型后训练阶段出了问题,输出格式的调整出现了偏差。Claude在回答格式上试图模仿GPT 4o,过多使用项目符号以增强条理性,却不小心变成了类似幻灯片要点的风格。GPT-4o系列模型的输出格式广受赞誉,因此在LMSYS等众测排行榜中名列前茅。其生成内容结构清晰,包含标题、段落与小标题,重点部分以粗体突出。同时,它将内容划分为定义、影响、示例及总结等多个层次,使概念解释更加条理分明、易于理解。读完之后,感觉就像在看一份研报或教材,格式清晰舒服。确实,OpenAI能在各方面保持领先,其估值达到1500亿美元也不足为奇。ChatGPT在大多数用户的使用体验上依旧表现最佳。

举报有用(0分享收藏

Copyright © 2025 IZhiDa.com All Rights Reserved.

知答 版权所有 粤ICP备2023042255号