admin
admin
今天 3 阅读 0 评论

字节跳动发布全双工语音大模型Seeduplex!豆包率先接入:打电话可边听边讲

摘要 快科技4月9日消息,字节跳动正式推出原生全双工语音大模型Seeduplex,基于边听边说”的全新架构,彻底打破传统AI语音交互一问一答”的局限,......

快科技4月9日消息,字节跳动正式推出原生全双工语音大模型Seeduplex,基于边听边说”的全新架构,彻底打破传统AI语音交互一问一答”的局限,实现自然实时对话。

目前Seeduplex已在豆包App全量落地,成为行业内首个规模化应用的全双工语音大模型。

Seeduplex的核心突破的是改变了传统半双工听完再说”的交互模式,真正实现了听与说的同步处理,其中两大核心能力得到重点突破:

精准抗干扰:模型具备持续的倾听”能力,从而能更好地理解用户所处的声学环境,准确忽略背景噪音和无关对话。在复杂场景下,相比半双工模型,其误回复率和误打断率减少了一半。

动态判停:模型能联合语音和语义特征,综合判断用户意图,可实现更自然的对话节奏控制。面对用户的思考犹豫,模型能耐心倾听;在用户说完后,又能快速响应。相比半双工模型,其抢话比例相对下降了40%。

多维度评测显示,Seeduplex在对话的流畅度和节奏感上,均显著优于传统的半双工方案及行业主流App的语音通话功能;在判停表现上,模型相比半双工方案提升了8%,展现出更接近自然对话的分寸感。

对话流畅度MOS分提升12%,整体通话满意度提升8.34%,其打断响应表现已略优于真人对话平均水平,让人机交互更贴近自然交流状态。

工程落地方面,该模型依托字节跳动自研LLM底座,通过架构创新、海量语音预训练、推理优化及稳定性保障,有效解决了高并发场景下的卡顿问题,可支持亿级用户稳定使用。

目前,用户更新至豆包App最新版,在打电话”语音通话界面即可体验该功能。

#综合