天脉资讯
产业经济 科学发展 企业动态 科技数码 汽车出行 文化艺术 人物观点 人工智能 大燕公益

OpenAI“语音引擎”小规模试用 AI人声朗读或成新趋势

2024-04-02来源:天脉网编辑:星辉

【天脉网】4月2日消息,OpenAI近日揭晓了一项创新功能的初步测试成果,该功能能够利用高度逼真的人声来朗读文本内容。这一进展不仅标志着人工智能领域的新突破,同时也引发了关于深度伪造技术的潜在担忧。

据OpenAI介绍,他们新推出的“语音引擎”(Voice Engine)文本转语音模型,目前正处于小规模试用阶段。该模型的演示和用例已经分享给了一些合作伙伴,发言人透露,当前约有10家开发商获准使用该模型。尽管OpenAI在3月初就向记者们展示了这一功能,但公司决定暂时不进行大规模发布。

OpenAI的这一决策是在综合了政策制定者、行业专家、教育工作者以及创意人士等多方利益相关者的反馈后作出的。据此前新闻发布会的消息,公司原本计划通过申请流程向最多100家开发商发布这款工具。然而,考虑到技术的敏感性和潜在风险,OpenAI选择了更为审慎的发布策略。

与OpenAI以往生成音频的功能相比,语音引擎的显著特点在于它能够创建出听起来非常接近特定个人的声音,并且能够精准地复制其独特的语调和语气。令人惊讶的是,这款软件仅需一段15秒的录音,就能重现一个人的声音。OpenAI的产品负责人杰夫·哈里斯(Jeff Harris)表示:“只要音频设置得当,基本上就能生成与人类水准相当的声音。”他对这一技术成果的质量赞不绝口,但同时也承认,“准确模仿人类语音的能力显然带来了很多安全上的不确定性。”

在这一技术的众多应用场景中,帮助患者恢复声音尤为引人关注。例如,OpenAI的合作伙伴之一——非营利性医疗系统Lifespan旗下的Norman Prince Neurosciences Institute,正在利用语音引擎为因疾病或损伤而失去说话能力的患者提供帮助。据OpenAI的博客文章介绍,该工具已经成功复制了一位因脑瘤而失去清晰说话能力的年轻患者的声音,方法是利用她此前为学校项目录制的发言。

此外,OpenAI的自定义语音模型还具有将生成的音频翻译成不同语言的能力,这对于音频行业公司来说具有极高的实用价值。比如,Spotify Technology SA就已经在其试点计划中利用该技术来翻译热门主持人的播客节目,从而扩大其内容的受众范围。OpenAI还积极宣传了该技术在其他方面的有益应用,如为儿童教育内容创建更加多样化的声音。

在测试计划中,OpenAI对合作伙伴提出了严格的使用政策要求,包括在使用原始声音前必须征得声音主人的同意,并明确告知听众他们听到的是由AI生成的声音。为了确保其技术的合规使用,OpenAI还在生成的音频中加入了听不见的音频水印,以便追踪和识别由其工具创建的音频内容。

OpenAI表示,在决定是否大范围发布该功能之前,他们正在广泛征求外部专家的反馈意见。公司在博文中写道:“让全球人民了解这项技术的发展方向至关重要,无论我们最终是否亲自广泛部署它。”同时,OpenAI也希望通过这次试用能够“激发增强社会韧性的需求”,以更好地应对未来更先进的AI技术可能带来的挑战。例如,该公司已经呼吁银行逐步停止将语音身份验证作为访问银行账户和敏感信息的唯一安全措施,并寻求开展更多的公众教育活动,帮助大家提高对欺骗性AI内容的识别能力。

QI语精灵:奇富科技打造的智能语音模型 方言识别准确率业界领先
【天脉网】4月1日消息,奇富科技近期发布了其自主研发的新一代智能语音模型——QI语精灵。这款模型不仅具备强大的方言识别能力,能够在金融业务场景中提供高质量的语音识别和转写服务,为金融服务沟通增添了温度。QI语精灵的推出,标志着奇富科技在智能语音技术领域的又一重要突破。该模型以Conformer结构为基础,构建了一

2024-04-01

AI背后的能源巨兽:传统与新能源的博弈
【天脉网】3月29日消息,随着人工智能技术的飞速发展,其对能源的需求也日益凸显。近日,AI教父黄仁勋发出警示,指出如果计算速度没有加快,我们可能需要14个不同的行星来满足AI对能源的巨大需求。这一言论引发了业界对AI与能源关系的深思。据天脉网了解,人工智能的高耗能问题已是不争的事实。数据中心、超级算力中心等设

2024-03-29

摩根大通:苹果AI战略专注小模型 隐私与体验双赢
【天脉网】3月27日消息,据彭博社记者马克・古尔曼(Mark Gurman)发布的博文指出,苹果公司在其即将推出的iOS 18系统中,并未计划引入自家的生成式AI聊天机器人。相反,苹果正与OpenAI、谷歌、百度等公司进行深入探讨,研究如何将它们的AI技术接入苹果的生态系统中。古尔曼预测,在即将于6月10-14日举办的WWDC开发者大会上,

2024-03-27

苹果加速布局AI领域 WWDC 2024将展示全新AI系统及应用
【天脉网】3月26日消息,随着人工智能技术的日益成熟,苹果公司作为全球科技巨头之一,也在积极布局AI领域,致力于为用户提供更加智能化的产品和服务。近日,有消息称,苹果将在即将到来的WWDC 2024上,展示其全新融入AI元素的系统和软件,这标志着苹果在AI领域的布局将进一步加速。据了解,苹果的AI策略并不仅仅局限于自家

2024-03-26

通义千问升级突破 长文档处理能力傲视全球AI市场
【天脉网】3月23日消息,阿里旗下的通义千问近日迎来重大更新,宣布向公众全面开放其强大的长文档处理功能,允许用户免费处理高达1000万字的文档,这一举动使其一跃成为全球文档处理容量领先的AI应用。此次升级后,无论是金融分析师、法律从业者,还是科研学者、医疗专家和教育工作者,都可以通过通义千问的网站和APP,轻松

2024-03-23

科技巨头联手!苹果计划将谷歌Gemini AI引入iPhone和iPad
【天脉网】3月20日消息,近日科技圈掀起一股AI热潮,苹果公司与谷歌的紧密磋商成为焦点。据彭博社上周末报道,苹果正计划在其iOS和iPadOS系统中引入谷歌的Gemini人工智能模型,为iPhone和iPad用户提供更为先进的AI功能体验。这一消息在科技圈内引起了广泛关注。纽约时报通过内部渠道进一步确认了此消息的真实性,并揭露了更

2024-03-20