BitNet b1.58一个月前已出,它有何特点?

1个回答

写回答

Aries~

2026-02-10 05:10

+ 关注

AI
AI

瞧了瞧,感觉和Binary Neural Network、Ternary Weight Network没太大差别。都是以全精度来存储优化器状态与模型参数,再运用StrAIght Through Estimator解决阶梯函数不可微分的问题。最终还是得看成效怎样,那就等他们把模型权重和代码开源吧。要是效果真的那么出众,DSA会很有发展前景的。在手机上运行GPT3.5也极有可能了。

举报有用(0分享收藏

Copyright © 2025 IZhiDa.com All Rights Reserved.

知答 版权所有 粤ICP备2023042255号