华泰证券研报指出,DeepSeek发布的R1模型及相关应用,凭借低训练成本达到前沿模型效果,引发市场对算力投资的担忧。
DeepSeek通过预训练阶段加入强化学习,实现训练成本大幅下降,对AI大模型降本做出重要贡献。
另一方面,北美四大AI公司主要通过扩大GPU集群规模研发下一代模型,而DeepSeek的方式在下一代模型中的效果尚待观察。
此次成功显示,在Scaling Law放缓背景下,中美大模型技术差距有望缩小。