上海AI实验室开源20B参数大模型有何意义?

上海AI

1个回答

写回答

aixixi101

2026-01-03 22:40

+ 关注

上海
上海

上海AI实验室此次开源了20B参数的大模型。与之前常见的7B、13B等规模相比,其参数量有了进一步提升。经过大规模语料集的充分训练,该模型相较于前代轻量型版本,在理解能力、逻辑推理、数学编程等方面都得到了进一步增强,在多个榜单指标上也有所提高。同时,此次开源还丰富了配套使用工具,像插件、API调用等,这有助于自主智能体的构建。因为此次一并开源了预训练框架InternLM - TrAIn、低成本微调框架XTuner、部署推理框架LMDeploy、评测框架OpenCompass以及面向场景应用的智能体框架Lagent。这为开源社区的使用提供了便利,进一步降低了大模型的开发门槛。仅仅九个月的时间,大模型就从最初看似遥不可及的黑科技,发展到如今有了成熟的模型数据框架,不得不感慨开源强大的创新能力。这个模型的开源发布于阿里云魔搭社区,这里集成了一站式的训练、部署、调用工具链,这也进一步充实了魔搭生态。国内逐渐形成能够与huggingface这类模型共享平台相匹敌的平台,期待魔搭社区未来能有更大的发展。

举报有用(0分享收藏

Copyright © 2025 IZhiDa.com All Rights Reserved.

知答 版权所有 粤ICP备2023042255号