跳动百科

阿里凌晨开源新模型:性能对标DeepSeek-R1,参数仅为其1/20

从健梵   来源:网易

阿里最新发布了一款新的AI模型,并选择在凌晨时分开源。这款模型的性能与DeepSeek-R1相当,但其参数量仅为DeepSeek-R1的二十分之一,这意味着它在运行效率和资源消耗上具有明显优势。

据阿里官方介绍,该模型采用了先进的压缩和优化技术,这使得模型能够在保持高性能的同时大幅降低参数量。这一成果不仅有助于推动AI技术的普及和应用,还为研究者提供了新的参考和思路。对于需要在边缘设备或资源受限环境中部署AI应用的开发者来说,这一新模型无疑是一个极佳的选择。

此外,阿里选择在凌晨时分进行开源,可能是为了避开日常的工作时间,让开发者们能够更加专注地探索和研究这个新模型。这也体现了阿里对技术创新的重视以及对开源社区的支持。

该模型的具体细节和技术文档已在GitHub上公布,有兴趣的研究者和开发者可以前往查看并尝试使用。随着这一新模型的开源,相信将会引发新一轮的技术讨论和创新热潮。