语言数据特殊，为何scaling law玩不下去？

1个回答

休闲鞋笑嘻嘻

2026-01-02 01:01

人类

并且缩放定律边际效用递减这种现象也是客观事实，它并非是一种线性关系。不过，语言属于特殊情况，语言数据很可能不太符合缩放定律。辛顿曾说过，人类语言实际上充满了矛盾与谬误，其本身就是一种噪声极大、质量极低的数据。且不说现代互联网中的语言情况，即便在日常交流说话时，也常常会出现很多诸如双重标准之类的错误，而且许多错误人们自身都无法察觉，出于各种各样的心理因素，不经意间就会说错话。这就是说，人们说话、写作的动机原本就不是为了符合逻辑，而是出于各自的小私心、小算计、冲动、潜意识等因素。所以，语言数据质量低下是可以想见的。那么，使用这种数据来训练模型，缩放定律不适用也是很正常的情况。因此，就语言数据而言，是需要一些特殊处理的，例如ChatGPT引入思维链就是一种做法。但是对于视觉和机器人相关的模型来说却不一定如此，因为物理世界是严格遵循物理规律的。相机所拍摄到的内容是确定的，机器人撞到墙了那就是实实在在地撞到墙了，这些反馈不存在矛盾之处，具有严格的时间和空间一致性。所以，OpenAI的语言模型表现不佳，并不意味着在其他领域也不行。毕竟像机器人这样的领域，面临的工作环境太过广泛，数据量又过少，甚至还没有触及到缩放定律的范畴。

举报有用（0）分享收藏

语言数据特殊，为何scaling law玩不下去？

1个回答

休闲鞋笑嘻嘻

热门话题

相关问题