DeepSeek,一家专注底层创新的中国大模型企业,在2025年初凭借其在多项性能测试中达到甚至超越OpenAI最新大模型的表现,成为全球科技创新的代表。其成功在于算力成本投入与性能表现的突出对比,以及开源路线的逆袭,尽管后续报道对其算力成本有所澄清,但DeepSeek仍展示了模型架构底层创新的价值。
面对国内大模型行业普遍关注应用开发的共识,DeepSeek反其道而行之,选择回到模型架构底层进行创新与优化。其创始人梁文锋表示,团队目标是通用人工智能(AGI),并在有限资源下实现更强模型能力。DeepSeek的成功证明,坚持长期视角、专注底层创新是突破资源差距、实现“弯道超车”的关键。