美国,Meta(原叫脸书)的一个办公区域内,几个工程师正对着电脑屏幕,陷入了呆滞。
“怎么可能?怎么可能呢?”
“该死的,这个模型的训练成本只有我们的10分之一,可它的逻辑推理能力,竟然比Lma3.1(Meta的模型)要强。”
“噢,我的上帝啊,这到底是怎么做到的?!”
没错,MOSS-550A的模型,不仅仅是放到了【小薇】上,还邀请了一些科研机构和企业进行测试。
这些机构和企业,有国内的,也有国外的。
不仅如此,在类似于GitHub等开发者社区内,也开放了部分技术文档和预训练模型片段,比方说,开放了代码生成模块的开源版本。
实际上,【Deepseek】也经历过这些测试,并且在测试的过程中,震撼了所有同行,这才有了1月份的爆发。
现在,在蓝星,走在了这条路上的是MOSS。
如果训练顺利的话,MOSS会在年底,发布【MOSS-550B】和【Wei-550B】。
听周髀资管的创始人说,届时【MOSS】和【小薇】的能力还将迎来一个提升。
内容未完,下一页继续阅读