
DeepSeek
不过
DeepSeek好像用的是所谓十三幺散件万卡集群。
雷军最近还招募了来自
DeepSeek的罗福莉。
雷军这人眼光很敏锐,但也有人觉得他有些手段。小米挖走
极氪团队,就好比把
极氪辛苦培养且在烧钱投入上毫不吝啬的团队据为己有了,毕竟我和
极氪的人比较熟,他们的技术和车型研发情况我知道得更多些。现在
雷军又对
DeepSeek下手了,在
中国,大家都知道D、Q这两个团队实力很强,
雷军不会去挖
百度的团队,这是显而易见的。大家不妨猜猜看,小米要多久才能复刻
DeepSeek的V3或者R1?这几天小米大模型的新闻不断。看起来小米是要在大模型领域大干一场了,应该是已经有了比较透彻的考量。小米最初只是做了一个1.3B的多模态小模型,这也很符合
雷军谨慎规划又大胆前行的行事风格。但要知道,做大型模型是非常烧钱的,人才也很稀缺,而且有重复建设的情况,最后很可能是一家独大的局面。我来推测一下
雷军的想法:其一,
手机是
AI Agents落地的绝佳场景。如果智能助手能够记住私人语境,随机应变,还能从错误
中学习,那小爱
同学就能像萨曼莎一样智能。从小米13之后,
手机在功能玩法上就没太多新花样了(或许更早,早在骁龙865时代后期,imx766传感器出现后就缺乏可玩性了)。未来特色Agents会是重要卖点,红魔黑鲨曾推出二次元助理,当时社区热度高涨,但那助理没什么智能。Agents对
手机和
汽车产业都是强有力的推动因素,模型最终必须要和
手机、
汽车场景深度融合与微调,而不是简单挂个API或者弄个
ChatGPT快捷方式,那没什么意义。其二,
苹果被
百度的事情影响,这是行业内的一个教训。大模型既然是未来发展的重点,又能给整个生态赋能,即便不做云计算,只要自身生态够大,就能消化大模型的成果。要是大模型做成功了,云计算也可以涉足,相当于多了一条发展路径。其三,
DeepSeek的技术确实不错,成本低(Ds V3只用600万美元、2个月、2000张卡来训练,据
DeepSeek的人说推理成本也非常低),性能也好。如果能挖到关键人物,也许小米大模型一出场就能惊艳众人,这正是
雷军想要的效果。
雷军就是那种敢做敢为、要做就做出动静的人。要是小米大模型成功了,对小米品牌价值的提升会很大,就像
小米汽车对
小米手机品牌价值的提升一样显著。