中国大模型在包括硅谷在内的全球AI领域掀起热潮。幻方量化旗下的DeepSeek和月之暗面相继发布了最新版推理模型DeepSeek-R1和Kimi k1.5,引发全球AI圈的广泛关注。两家公司发布的模型均为满血版o1,其中Kimi k1.5还具备视觉思考的多模态功能。这一事件透露出业界对大模型技术能尽快取得重大突破的期待。
Kimi k1.5在推理能力上大幅提升,尤其在数学、代码和视觉任务中表现优异,成为OpenAI之外首个多模态类o1模型。其独特的“Long2Short”训练方案在算力与性能平衡方面实现了成功探索,改变了OpenAI o1以时间换空间的做法,成为业界新的研究方向。此外,中国在大模型领域的密集创新迭代和基础设施建设方面已经抢占先机,有望在大模型的“瓦特时刻”赢得话语权。