天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

豆包语音对话功能升级啦!单音色畅说4种方言还能听懂18种方言

2025-11-29来源:快讯编辑:瑞雪

豆包App近日在语音对话功能上实现重大突破,正式上线方言交互能力。用户现可通过语音或文字指令,体验与AI使用地道方言对话的全新场景,该功能覆盖粤语、四川话、东北话及陕西话四种主流方言。

技术层面,该功能依托豆包自主研发的语音模型方言迁移技术,突破传统多音色方案限制,实现单音色灵活切换多方言的能力。系统可根据用户对话意图,自动识别并切换至指定方言进行回应,同时保持"温柔桃子"升级版音色的自然度与流畅性。测试数据显示,方言切换响应时间控制在0.3秒以内,用户几乎感受不到延迟。

在方言识别方面,豆包已构建覆盖18种方言的语音识别体系,除支持对话输出的四种方言外,还能准确理解上海话、南京话、天津话等地域方言的语音指令。这项突破得益于ASR(自动语音识别)技术的深度优化,通过构建方言语音特征库与神经网络模型,使方言转文本的准确率提升至92%以上,较传统方案效率提升40%。

用户操作流程极简化设计:打开豆包App进入对话界面,输入"用四川话聊天"等指令,系统即刻切换至方言模式。实测显示,在地铁、商场等嘈杂环境中,方言识别率仍能保持87%以上的准确度。技术团队透露,后续将开放方言音色定制功能,允许用户上传方言样本训练专属语音模型。

方言功能的上线标志着AI语音交互进入地域化深度适配阶段。行业分析师指出,方言技术的突破不仅解决中老年用户的使用障碍,更在文化传承层面具有特殊价值。数据显示,我国仍有超4亿人口以方言为主要交流方式,方言语音交互市场的潜在规模达百亿级别。

GPT-5.2强势登场:能力大提升反超谷歌Gemini 3 Pro,北大数学人才成核心力量
要在ChatGPT中使用新的做表格和PPT能力,需要充值Plus、Pro、Business或 Enterprise套餐,选择GPT-5.2Thinking或Pro版本 。 在OpenAI自制的大海捞针MR…

2025-12-13

北京发布全国首个全自主无人化人形机器人导览方案 开启智能服务新篇章
12月11日,北京人形机器人创新中心发布全国首个全自主无人化人形机器人导览解决方案。未来,该方案可广泛应用于展厅导览、商场导购、业务讲解、文旅景区等场景,通过多机协同与全域联动,为用户带来更专业、更生动的…

2025-12-13

岁末AI竞技场:中美科技巨头年末鏖战,共绘智能新蓝图
这也被普遍视为ChatGPT从“单一助手”迈向“多智能体平台”的关键一步,并迅速在全球引发大量讨论。 该模型一经面世,就被多家科技媒体评价为“迄今最完整的一次大模型体系级升级”:不仅在推理能力、多模态理解和…

2025-12-12