腾讯混元团队提出低比特浮点数训练Scaling Laws的研究意义是什么?

1个回答

写回答

Hennrich

2025-11-25 20:25

+ 关注

这事儿重要就重要在它试图解开低精度训练时参数规模数据量和效果之间的秘密好让业界有更明确的方向去改进技术

举报有用(0分享收藏

Copyright © 2025 IZhiDa.com All Rights Reserved.

知答 版权所有 粤ICP备2023042255号