豆包实时语音大模型已在豆包App 7.2.0版本中正式上线,实现了端到端的语音对话功能。该模型具备低时延、可随时打断对话的特性,在语音表现力、控制力和情绪承接方面表现卓越,展现出接近真人的语音表达水准。同时,模型拥有丰富的表现力,能通过学习角色语音和情感特点,生动切换不同角色和状态,增强交互的趣味性和沉浸感。
此外,豆包实时语音大模型支持实时联网功能,能根据问题动态获取最新信息,精准、及时地回应时效问题。虽然现阶段主要支持中文和部分方言的理解与表达,但其在中文语境下的表现已相当出色,对话风格拟人,情感理解深刻。