
DeepSeek
DeepSeek - R1 - Distill这个小模型是通过对DeepSeek - R1进行蒸馏而得到的。DeepSeek - R1 - Distill模型是在开源模型基础上微调得到的,所用样本由DeepSeek - R1生成,其配置与分词器有小幅度修改。它们的成绩如下:
从ollama模型库(皆为量化4Bit)能看出他们所用资源的差异。
@北方的郎 专注于模型和代码。喜欢的朋友,欢迎点赞、关注、分享。
Copyright © 2025 IZhiDa.com All Rights Reserved.
知答 版权所有 粤ICP备2023042255号