语言数据特殊,为何scaling law玩不下去?

1个回答

写回答

人类
人类

并且缩放定律边际效用递减这种现象也是客观事实,它并非是一种线性关系。不过,语言属于特殊情况,语言数据很可能不太符合缩放定律。辛顿曾说过,人类语言实际上充满了矛盾与谬误,其本身就是一种噪声极大、质量极低的数据。且不说现代互联网中的语言情况,即便在日常交流说话时,也常常会出现很多诸如双重标准之类的错误,而且许多错误人们自身都无法察觉,出于各种各样的心理因素,不经意间就会说错话。这就是说,人们说话、写作的动机原本就不是为了符合逻辑,而是出于各自的小私心、小算计、冲动、潜意识等因素。所以,语言数据质量低下是可以想见的。那么,使用这种数据来训练模型,缩放定律不适用也是很正常的情况。因此,就语言数据而言,是需要一些特殊处理的,例如ChatGPT引入思维链就是一种做法。但是对于视觉和机器人相关的模型来说却不一定如此,因为物理世界是严格遵循物理规律的。相机所拍摄到的内容是确定的,机器人撞到墙了那就是实实在在地撞到墙了,这些反馈不存在矛盾之处,具有严格的时间和空间一致性。所以,OpenAI的语言模型表现不佳,并不意味着在其他领域也不行。毕竟像机器人这样的领域,面临的工作环境太过广泛,数据量又过少,甚至还没有触及到缩放定律的范畴。

举报有用(0分享收藏

Copyright © 2025 IZhiDa.com All Rights Reserved.

知答 版权所有 粤ICP备2023042255号