美国,Meta(原叫脸书)的一个办公区域内,几个工程师正对着电脑屏幕,陷入了呆滞。

        “怎么可能?怎么可能呢?”

        “该死的,这个模型的训练成本只有我们的10分之一,可它的逻辑推理能力,竟然比Lma3.1(Meta的模型)要强。”

        “噢,我的上帝啊,这到底是怎么做到的?!”

        没错,MOSS-550A的模型,不仅仅是放到了【小薇】上,还邀请了一些科研机构和企业进行测试。

        这些机构和企业,有国内的,也有国外的。

        不仅如此,在类似于GitHub等开发者社区内,也开放了部分技术文档和预训练模型片段,比方说,开放了代码生成模块的开源版本。

        实际上,【Deepseek】也经历过这些测试,并且在测试的过程中,震撼了所有同行,这才有了1月份的爆发。

        现在,在蓝星,走在了这条路上的是MOSS。

        如果训练顺利的话,MOSS会在年底,发布【MOSS-550B】和【Wei-550B】。

        听周髀资管的创始人说,届时【MOSS】和【小薇】的能力还将迎来一个提升。

        内容未完,下一页继续阅读