您的位置:首页 >科技 > 内容

阿里云通义千问团队开源Qwen2.5-1M:百万上下文长度模型震撼登场

2025-01-27 22:40:20来源:网易  用户:项裕河

阿里云通义千问团队最新推出的Qwen2.5-1M系列包含两个开源模型,分别是Qwen2.5-7B-Instruct-1M和Qwen2.5-14B-Instruct-1M。该系列模型首次支持百万Token上下文长度,无需分割处理超长文档,支持更深入的对话,实现更连贯自然的交互体验。同时,Qwen2.5-1M在复杂任务处理方面能力更强。

此外,Qwen2.5-1M的推理框架实现了重大突破,通义千问团队完全开源了基于vLLM的推理框架,集成了稀疏注意力机制,使得处理百万Token输入时速度提升3到7倍,极大地提升了实际应用场景的效率和体验。

免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

猜你喜欢

最新文章