微软近日推出了一项文本转语音虚拟数字人技术,该技术集成了GPT-4o,利用出色的自然语言处理能力,让数字人能够将文本转换成流畅且自然的语音输出。结合逼真的虚拟形象,为用户带来沉浸式的即时互动体验。
服务特性一览
a. 微软账号;
企业如何获取Azure AI语音服务
目前企业需要通过微软官方合作伙伴获取服务,可以合规、稳定地提供企业用户使用Azure AI 语音服务、ChatGPT等的可能,满足国内发票需求。
通过微软官方合作伙伴获取服务,可以合规、稳定地提供企业用户使用ChatGPT的可能,满足国内发票需求,同时也能解决连接不稳定/响应速度慢/并发配额低等问题。
微软Azure AI语音免费试用:
https://azureopenai.cloudallonline.com/?zxwsh32
b. Visa卡或者虚拟卡(用来注册Azure,如果是找微软的中国合作伙伴开通怎不需要这一步)
注册地址:
https://azure.microsoft.com/zh-cn/products/ai-services/text-to-speech
2 注册账号
这里上面点击后,一步一步傻瓜式按系统提示,用微软账号注册就可以了,最后会有一个绑定卡的步骤(这里最简单的是申请Visa卡哈),绑定之后就OK了
可能好多人到了进行不下去了,没有Visa的去办一个或者照淘宝,这个我也没去其他好办法了哈
成功之后,首页是这样的
首页
3开始部署语音服务
展开左上角菜单栏,找到“AI+机器学习”类别,选择语音服务并创建
创建界面的名称随便填,定价层选择“Free F0”,然后点击“审阅并创建;继续点击“创建”
稍等一会语音服务就部署完成了
回到首页点击所有服务
查看自己创建的服务
4 回到首页,依次点击转到Speech Studio
Speech Studio里有很多语音服务,比如“语音转文本”、“文本转语音”“语音转字幕”等等,都可以直接使用。
我们选择文本转语音,语音库
5 进入语音库
目前市面上最全的AI语音库了,每个声音模型也都配置了不同的对话场景和情绪,甚至还有各种方言。一个字“爽”!!
6 选择想用的声音模型,点击转到有声内容创作
我们选择他刚刚发布的 晓晓 多语言
7 复制需转换的文本到网页中,试听后,保存
我们使用他的示例,然后再续写一段,看下效果!
示例文本:我们需要加的是生抽、老抽、料酒、白糖还有一点点的醋、盐,然后把它翻炒均匀就可以了。接下来就是收汁的阶段了哈,我们加入适量的水淀粉翻炒到这个鸡丁上色,而且汤汁呢,稍稍已经比较浓稠,啊不会轻易的滑落。好的,接下来,当我们看到汤汁变得浓稠并且均匀裹在鸡丁上时,这就表示我们的菜肴已经接近完成了。此时,我们可以转至小火,让鸡丁在锅中慢慢吸收汤汁,使其更加入味。同时,我们可以撒上一些葱花和芝麻,为这道菜增添更多的香气和层次感。葱花的清新和芝麻的香脆,将会与鸡丁的鲜美完美融合,让整道菜的味道更加丰富。最后,我们再尝一下味道,根据个人口味适当调整盐度,确保每一口都是满足的享受。完成后,关火,将这道色香味俱佳的鸡丁盛入盘中,热腾腾地上桌,与家人朋友共享这美好的一餐。
影响及未来展望
微软的这项服务可能会对以下方面产生重大影响:用户体验:通过提供更自然的交互体验,这项服务可能会改变用户与品牌和服务的互动方式。成本效益:数字人可以替代一些重复性工作,降低企业的运营成本。技术发展:随着技术的进步,数字人的功能和应用场景将不断扩展,可能会出现更多创新的应用。未来,随着人工智能技术的不断发展和优化,微软的文本转语音虚拟数字人服务有望在各个行业得到广泛应用,为用户提供更加智能、个性化的服务。