DeepSeek系列AI模型,由杭州初创团队“深度求索”开发,近期备受全球瞩目。1月24日,《自然》杂志发文称赞DeepSeek-R1,认为其亲民价格和开放性挑战了OpenAI的GPT-o1地位。DeepSeek-R1在化学、数学和编程领域的表现与GPT-o1相当,且采用“开放权重”模式,允许研究者研究并改进算法,展现出超越早期语言模型的能力。
DeepSeek-R1的训练成本低廉,硬件需求仅为Meta的Llama 3.1 405B的十分之一,且表现优于主要竞争者。其成功训练也打破了美国出口管制措施的限制。DeepSeek-R1使用“思维链”方法提高解决复杂任务的能力,并通过强化学习进行微调训练。在基准测试中,DeepSeek-R1与GPT-o1表现相当,并在特定科研领域展现出超越实力。出门问问副总裁李维称赞DeepSeek为“化繁为简的大师”,并强调其开源精神。