近期微软发布的文字转语音工具,让企业,配音输出从此告别冷冰冰的机器音!
微软近期推出的文本转语音(TTS)工具,以其逼真的配音效果,为企业提供了一种全新的语音交互体验。这一技术突破,使得企业能够摒弃传统的机器语音,转而采用更加人性化和富有表现力的声音。
微软此次发布的TTS工具涵盖了超过400种神经语音,支持140多种语言和地区,极大地扩展了应用场景和受众范围。这些语音不仅能够快速为应用程序添加朗读功能,提升无障碍设计,还能为聊天机器人等交互系统赋予更加生动和真实的对话体验。
在中文领域,微软特别增加了10余种主播级语音,并支持多种方言,以满足不同地区用户的需求。"晓晓"作为微软Azure TTS语音库中的一员,以其女性声音角色,提供了两个版本的服务。
中文版"晓晓"支持21种不同的说话风格,适用于有声书、新闻播报、AI客户服务以及多情感表达等多种场景。在多情感表达的演示中,"晓晓"能够根据台词内容,在不同的情绪之间自如切换,精准地匹配相应的语气和语调,展现出自然流畅的语音表现力。
微软的这一创新,不仅提升了TTS技术的专业性和实用性,也为语音交互领域带来了新的可能性和想象空间。
,时长01:14
第二个版本是多语言版本的“晓晓”,支持91种语言的文本到语音转换,但仅提供默认的说话风格选项。
企业如何获取Azure AI语音服务
目前企业需要通过微软官方合作伙伴获取服务,可以合规、稳定地提供企业用户使用Azure AI 语音服务、ChatGPT等的可能,满足国内发票需求。
通过微软官方合作伙伴获取服务,可以合规、稳定地提供企业用户使用ChatGPT的可能,满足国内发票需求,同时也能解决连接不稳定/响应速度慢/并发配额低等问题。
微软Azure AI语音免费试用:
https://azureopenai.cloudallonline.com/?zxwsh28
☍声音的调色板
该软件的语音服务提供了广泛的语言和口音选项,支持多种场景下的配音需求,包括客户服务、教育和娱乐。
☍多场景的配音小能手
该软件的语音服务适用于企业级应用,能够满足大规模的语音识别和合成需求,同时保证了高可靠性和安全性。
由于申请微软Azure账户和部署语音服务的流程较为复杂,在此先附上详细操作步骤,以供参考:
首先,进入微软Azure官网,创建一个账户。
整个注册和使用过程,无需魔法,但需要提供一张VISA、万事达等信用卡或借记卡进行验证。实测中,我们用国内银行发行的VISA信用卡以及国内手机号完成了注册。
验证成功后,跳转到Azure主页,进入控制台,在“AI+机器学习”类别下,找到“语音”点击“Create”,部署语音服务。
进入创建语音服务页面,定价层选择“Free F0(即免费服务)”,区域选择你想使用的TTS语音支持的地区,因为是测试“晓晓”,在这里我们最后选择了“East Asia(东亚)”。
最后,点击页面下方的“审阅并创建”,就完成了部署。
接着转到“有声内容创作”页面,就可以投喂文本,让AI替你生成语音了。
界面布局主要包括中间的文本操作区和右侧的调音编辑工具栏。用户可以一次性编辑整个文本,也可以对单个句子或词语进行微调。
具体编辑功能涵盖朗读角色切换、停顿设置、朗读规则调整以及语调语速控制等,都支持用户根据需要进行自定义修改。
例如,在下面这段文本中,我们将叙事旁白设置成了中文版晓晓的“新闻”说话风格,并在同一个句子中切换朗读角色,营造出小说中的对话感。