面壁智能发布了首个端侧多模态模型MiniCPM-o 2.6,该模型仅含8B参数,却取得了实时流式全模态开源模型的顶尖水平(SOTA),性能与全球最高水平的GPT-4o、Claude-3.5-Sonnet相媲美。在语音方面,MiniCPM-o 2.6在理解和生成能力上均获得开源双SOTA,被誉为最强开源语音通用模型。此外,在视觉领域,它也稳固占据了最强端侧视觉通用模型的地位。
(全天候科技报道)