阿里云通义千问团队最新推出的Qwen2.5-1M系列包含两个开源模型,分别是Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M。该系列模型首次支持百万Token上下文长度,无需分割处理超长文档,支持更深入的对话,实现更连贯自然的交互体验。同时,Qwen2.5-1M在复杂任务处理方面能力更强。
此外,Qwen2.5-1M的推理框架实现了重大突破,通义千问团队完全开源了基于vLLM的推理框架,集成了稀疏注意力机制,使得处理百万Token输入时速度提升3到7倍,极大地提升了实际应用场景的效率和体验。