当前位置:首页|资讯|微软|ChatGPT|人工智能

微软azure 语音文本转语音服务,开辟智能交互新领域

作者:等保测评办理发布时间:2024-07-18

微软近日推出了一项文本转语音虚拟数字人技术,该技术集成了GPT-4o,利用出色的自然语言处理能力,让数字人能够将文本转换成流畅且自然的语音输出。结合逼真的虚拟形象,为用户带来沉浸式的即时互动体验。

服务特性一览

  • 视频与声音同步:微软的服务能够将文本转化为具有自然声音的数字人视频,实现视觉与听觉的双重享受。
  • 虚拟形象定制:服务提供了多种预设的虚拟形象供用户选择,也支持用户通过录制视频自定义形象,过程简便快捷。
  • 多语言兼容:覆盖英语、中文、西班牙语等多种语言,满足全球化用户群体的需求。
  • 高质量视频合成:支持高达1080p分辨率和每秒25帧的流畅视频输出,提供多种编解码器选项,包括h264/h265/vp9,以适应不同的视频需求。
  • 实时互动:利用Speech Studio的实时聊天虚拟形象工具,用户可以与数字人进行即时对话,适用于在线客服、虚拟导游、教育讲解等场景。
  • 无代码内容创作:即便用户不具备编程技能,也能通过Speech Studio的无代码工具轻松制作视频内容。
  1. 准备工作

a. 微软账号;

企业如何获取Azure AI语音服务

目前企业需要通过微软官方合作伙伴获取服务,可以合规、稳定地提供企业用户使用Azure AI 语音服务、ChatGPT等的可能,满足国内发票需求。

通过微软官方合作伙伴获取服务,可以合规、稳定地提供企业用户使用ChatGPT的可能,满足国内发票需求,同时也能解决连接不稳定/响应速度慢/并发配额低等问题。

软Azure AI语音免费试用:
https://azureopenai.cloudallonline.com/?zxwsh32

b. Visa卡或者虚拟卡(用来注册Azure,如果是找微软的中国合作伙伴开通怎不需要这一步

注册地址:

https://azure.microsoft.com/zh-cn/products/ai-services/text-to-speech

2 注册账号

这里上面点击后,一步一步傻瓜式按系统提示,用微软账号注册就可以了,最后会有一个绑定卡的步骤(这里最简单的是申请Visa卡哈),绑定之后就OK了

可能好多人到了进行不下去了,没有Visa的去办一个或者照淘宝,这个我也没去其他好办法了哈

成功之后,首页是这样的

首页

3开始部署语音服务

展开左上角菜单栏,找到“AI+机器学习”类别,选择语音服务并创建

创建界面的名称随便填,定价层选择“Free F0”,然后点击“审阅并创建;继续点击“创建”

稍等一会语音服务就部署完成了

回到首页点击所有服务

查看自己创建的服务

4 回到首页,依次点击转到Speech Studio

Speech Studio里有很多语音服务,比如“语音转文本”、“文本转语音”“语音转字幕”等等,都可以直接使用。

我们选择文本转语音,语音库

5 进入语音库

目前市面上最全的AI语音库了,每个声音模型也都配置了不同的对话场景和情绪,甚至还有各种方言。一个字“爽”!!

6 选择想用的声音模型,点击转到有声内容创作

我们选择他刚刚发布的 晓晓 多语言

7 复制需转换的文本到网页中,试听后,保存

我们使用他的示例,然后再续写一段,看下效果!

示例文本:我们需要加的是生抽、老抽、料酒、白糖还有一点点的醋、盐,然后把它翻炒均匀就可以了。接下来就是收汁的阶段了哈,我们加入适量的水淀粉翻炒到这个鸡丁上色,而且汤汁呢,稍稍已经比较浓稠,啊不会轻易的滑落。好的,接下来,当我们看到汤汁变得浓稠并且均匀裹在鸡丁上时,这就表示我们的菜肴已经接近完成了。此时,我们可以转至小火,让鸡丁在锅中慢慢吸收汤汁,使其更加入味。同时,我们可以撒上一些葱花和芝麻,为这道菜增添更多的香气和层次感。葱花的清新和芝麻的香脆,将会与鸡丁的鲜美完美融合,让整道菜的味道更加丰富。最后,我们再尝一下味道,根据个人口味适当调整盐度,确保每一口都是满足的享受。完成后,关火,将这道色香味俱佳的鸡丁盛入盘中,热腾腾地上桌,与家人朋友共享这美好的一餐。

影响及未来展望

微软的这项服务可能会对以下方面产生重大影响:用户体验:通过提供更自然的交互体验,这项服务可能会改变用户与品牌和服务的互动方式。成本效益:数字人可以替代一些重复性工作,降低企业的运营成本。技术发展:随着技术的进步,数字人的功能和应用场景将不断扩展,可能会出现更多创新的应用。未来,随着人工智能技术的不断发展和优化,微软的文本转语音虚拟数字人服务有望在各个行业得到广泛应用,为用户提供更加智能、个性化的服务。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1