天脉资讯
财经快讯 价值公司 财经人物 IPO解读 热门赛道 经济解码 科技业界 文化艺术 消费零售 大燕公益 商业快讯

阿里通义实验室发布Fun-ASR1.5大模型:多语言方言精准识别,古诗词转写无压力

2026-04-21来源:快讯编辑:瑞雪

阿里通义实验室近日宣布,其自主研发的语音识别大模型Fun-ASR1.5已正式面向公众开放使用。这款模型突破了传统语音识别工具在多语言场景下的应用局限,通过统一的底层架构设计,实现了对全球30种语言的广泛支持,同时深度覆盖汉语七大方言体系及超过20种地方口音的精准识别。

在技术验证阶段,Fun-ASR1.5展现出显著的性能优势。实验室测试数据显示,针对方言场景的识别任务中,该模型较前代版本字错误率(CER)降低56.2%,其中5种方言的识别准确率突破90%阈值,另有15种方言的准确率达到80%以上。特别值得关注的是,模型对古诗词吟诵等特殊语音场景的转写能力达到行业领先水平,能够准确捕捉韵律特征与文化语境。

该模型的创新性体现在其跨语言处理机制上。研发团队通过构建多维度语音特征库,使模型能够自动适配不同语言的声学模型与语言模型,无需针对特定语种单独训练。这种设计不仅降低了多语言应用的开发成本,更显著提升了模型在混合语言场景下的识别稳定性。目前,Fun-ASR1.5已支持包括粤语、吴语、闽南语等在内的汉语方言体系,以及英语、法语、阿拉伯语等国际主流语言。

龚宇谈AI变革:爱奇艺拥抱去中心化,打造创作者与用户新社区
据新浪科技报道,龚宇表示,面对 AI 带来的变革,爱奇艺顺势而为的应对方式是去中心化,从传统少数人决定观众喜好的模式,转向创作者与用户社区。龚宇认为,AI 技术将大幅降低内容制作成本与周期,创作者数量和作…

2026-04-20