为什么说大模型未来的发展方向是开源？

1个回答

1498977640

2025-12-06 18:41

蛋糕

只有一条路可走。重要的是开源，始终围绕开源，毫不动摇地坚持开源。这样做的一大优势在于，你将制作蛋糕的方法公开共享。作为该方法的首位发布者，后续使用者若认可你的方法，便会在此基础上不断完善。一旦使用人数增多，便会形成一种生态，吸引更多人基于你的方法进行二次创新。国内大模型的发展路径是正确的，例如「书生·浦语」大模型（InternLM-20B与InternLM-Chat-20B）坚持开源。它开放了全部内容，允许免费商用，供人随意使用，这将有力推动技术普及与创新。

其实很多人仍不太明白为何要开源。按理说，独创菜谱应秘而不宣，自己开店售卖。若有人将其公开，任由他人学习，这种做法实在让人难以理解。实际上，选择保密可能让你暂时获利颇丰，但保守秘密也限制了其传播范围。而开源后，作为发起人，你将获得荣誉与更多关注，同时为同行树立榜样。大家会与你共同经营、维护这份菜谱，让独家变成共享。这才是开源的真正意义所在。开源越多，二次开发越活跃，大模型将不再只是巨头的专属领域，而成为中小型企业和个人开发者也能参与的低门槛赛道。对中小企业和个人而言，选择多个现成大模型比从零训练模型更 advantageous。玩家增多后必然产生竞争，最终胜出的必然是某方面表现卓越的，例如大模型推理能力强大、计算资源需求较少，或是多模态支持更优等。大多数中小型企业与个人用户的需求具有鲜明特点，例如写作只需文字处理，音乐制作仅需音频相关功能。因此，专注于特定领域的模型能以更少的资源，在专业方向上取得更优效果。这类个性化需求将推动更多大模型的涌现和发展。对中小企业而言，大模型仍是负担。「书生·浦语」20B参数版在多方面达到了均衡效果。这是一个参数量为200亿的大型模型，介于常见的70亿和700亿参数规模之间，约为7B的3倍，70B的三分之一。相比70B，它对硬件的要求有所降低，但仍高于7B。现在还有云端部署选项，无需本地购置昂贵硬件，避免重资产投入，有助于加快资金周转，降低成本压力。更重要的是其性能，大幅提升，远超13B模型，甚至优于70B的Llama2。在理解与推理能力方面，「书生·浦语」均显著领先于Llama2，展现出更强的实力。

「书生·浦语」性能的显著提升，主要得益于其网络深度不同于Llama等大模型的设计。在人工智能语言模型领域，神经网络的层数是影响模型性能与多功能性的关键因素。新发布的「书生·浦语」InternLM-20B 和 InternLM-Chat-20B 模型，在这一方面实现了重大突破，展现出显著的创新优势。该模型在架构上的一大创新是其网络层数高达60层。而常见的7B和13B模型一般只有32层或40层。在参数量受限的情况下，增加层数可以大幅提升模型的整体表现。也就是说，InternLM-20B凭借60层的设计，成为了一台性能更强大的智能引擎。不仅如此，InternLM-20B采用了一套高质量的预训练数据。该数据集经过严格清洗，新增了高知识密度及强化理解与推理能力的训练样本。这一改进使得模型在多个方面取得了显著提升，包括理解力、推理力、数学能力和编程能力等维度均表现优异。其在标准测试数据集上的表现也可窥见一斑：

音乐

很重要的一点是，书生实际上是一个系列模型。此前，书生·浦语7B大模型已开源，此次依旧如此，并在阿里云魔搭社区全球首发。

开源大模型与开源平台相结合，堪称强强联合。更重要的是，这使更多人能便捷地参与到曾经高不可攀的大模型领域中。让更多中小企业及个人投身大模型应用与创新建设，这才是真正值得实现的愿景。书生·浦语-20B使用很简单，在魔搭平台几行代码就能运行。

他们还在魔搭搭建了品牌馆，方便大家了解书生·浦语-20B的性能与使用方法。大家可以访问这个链接，了解更多相关内容：https://modelscope.cn/brand/view/internlm

举报有用（0）分享收藏

为什么说大模型未来的发展方向是开源？

1个回答

1498977640

热门话题

相关问题