细思极恐，微软最新 AI 技术 3 秒钟即可克隆任何人的声音

作者：傻大个科技发布时间：2023-09-30

微软 OpenAI 人工智能艺术

去年出现了人工智能工具 (AI)，可以根据文本提示创建图像、艺术图像，甚至视频。

人工智能写作也取得了重大进展，OpenAI 的 ChatGPT 引起了人们对写作未来的广泛兴奋和恐惧。

2023 刚过去几天，人工智能的另一个强大用例已经成为人们关注的焦点——一种可以无可挑剔地模仿人的声音的文本转语音工具。

由微软开发的 VALL-E 可以录制任何人的三秒钟声音，并克隆该声音，将书面文字转化为语音，根据文本的上下文，生成的音频具有逼真的语调和情感。

经过 60,000 小时的英语演讲录音训练，它可以在“零镜头情况”下发表演讲。

在康奈尔大学发表的一篇论文中介绍 VALL-E 时，开发人员解释说录音数据由 7,000 多个独特的说话人组成。

人工智能在 2023 年的挑战：ChatGPT 4

该团队表示，他们的文本转语音系统 (TTS) 使用的数据是现有 TTS 系统的数百倍，克服了零样本问题。

该工具目前不供公众使用——但它确实引发了安全问题，因为它可能被用来生成来自任何人声音的任何文本。

微软在 AI 上押下重注

VALL-E 的创建者提供了一个演示，展示了一些三秒的音频样本和文本到语音的演示，并正确地模仿了音频样本。

微软在人工智能方面投入了大量资金，并且是 OpenAI 的支持者之一，OpenAI 是 ChatGPT 和 DALL-E（一种文本到图像或艺术工具）的幕后公司。

这家软件巨头在 2019 年向 OpenAI 投资了 10 亿美元，本周一份报告称它正在考虑向该公司再投资 100 亿美元。

潜在用途

这项技术最明显的用途之一是为在生命中某个时刻失去说话能力的人发声。即使是带有主体声音的超短录音也可以用来重建极其自然的人造声音。有语言障碍的人也可以使用它——他们可以输入他们想说的话，Vall-E 可以将其转换成语音。

相关资讯

3秒复制任何人的嗓音！微软音频版DALL·E细思极恐，环境噪音也能模仿

萧箫发自凹非寺量子位 | 公众号 QbitAI只需3秒钟，一个根本没听过你说话的AI，就能完美模仿出你的声音。是不是细思极恐？这是微软最新AI成果——语音合成模型VALL·E，只需3秒语音，就能随意复制任何人的声音。它脱胎于DALL·E，但专攻音频领域，语音合成效果在网上放出后火了：有网友表示，要是将VALL·E和ChatGPT结合起...

微软 ChatGPT DALL·E

量子位 2023-01-11

AI语音诈骗横行，只需3秒钟的音频就能模仿任何人的声音！

说到AI，很多人都能想到ChatGPT、OpenAI以及文心一言等，如今有很多人都开始用这些大数据集成的科技工具来处理工作、生活中的很多问题。我不会告诉你，平时写方案的时候自己也会跟ChatGPT和文心一言讨…

AI音频 ChatGPT 文心一言 OpenAI

电脑报 2023-05-03

2023-03-26

近期资讯

电脑蓝牙连接指南：轻松实现设备配对与使用技巧

在现代生活中，蓝牙技术已经成了我们日常生活中不可或缺的一部分。无论是耳机、音响，还是打印机、鼠标，蓝牙连接都让我们的设备使用变得更加方便和灵活。那么，电脑怎么连蓝牙呢？可以在设备管理器中查看，方法很简单，右键点击“开始”按钮，选择“设备管理器”，然后找找“蓝牙”这一项。这让我们的生活变得更加便利，享受科技带来的乐趣。

新报观察 2024-12-29

海信将在CES2025发布新型显示技术瞄准QD-OLED

2025年1月7日-10日，被誉为“科技春晚”的CES全球消费电子展将在美国拉斯维加斯举行，海信将以“AIYourLife”为主题亮相，并在开幕前夕举行发布会，对外发布显示技术领域的重大突破。在追求极致观影的今天，高清细腻、色彩丰富且真实的画质已成为用户不可或缺的需求。

中国证券报 2024-12-29

美国22州总检察长请求最高法院维持TikTok封禁

距TikTok“不卖就禁”法案既定生效日期不足一个月，美国22个州总检察长联合请求最高法院持TikTok美国禁令。据福克斯报道，美国弗吉尼亚州和蒙大拿州总检察长提交了一份法庭之友陈述

朝晖 2024-12-29

Win11 24H2用户无法使用Wi-Fi！微软仍未解决DHCP问题

快科技12月29日消息，微软Windows 11 24H2版本遭遇了持续的网络连接问题，部分用户在更新后发现无法使用Wi-Fi连接，导致无法访问互联网。尽管微软已经尝试通过补丁修复，但问题似乎仍未得到彻

黑白 2024-12-29

南京江北新区低空立体交通产业生态大会召开

中新网江苏新闻12月28日电(耿瑞雪王若宇)南京江北新区低空立体交通产业生态大会暨高精度低空立体交通图技术应用推广与赋能场景发布会26日召开。

中国新闻网 2024-12-29

本田全球产量连续四月下滑：中国市场跌幅高达28%

王略 2024-12-29

三星S25 Ultra相机规格全曝光！主镜头三代不变

快科技12月29日消息，据媒体报道，三星即将于2025年1月发布的新一代旗舰手机S25Ultra的相机规格近日被全面曝光。根据爆料者@AssembleDebug在社交平台上分享的消息，S25Ultra在相机配置上的主要升级在于超广角镜头。

快科技 2024-12-29

理想和问界今年都卖爆但明年就没这么好搞了

车圈这闹腾了一年，也差不多到了收尾总结的时刻。这一年各种榜单，各种维度上的比拼，车企们都没少花心思。但要说今年被拿来对比最多的，肯定少不了理想和问界这哥俩。两家的渊源不用脖子哥

2024-12-29

车主在方向盘车标上贴钻石贴片：气囊起爆后贴片刺破车顶

快科技12月29日消息，日前，有网友分享了一条在方向盘车标上贴钻石贴片，气囊起爆后贴片成毁容利器的视频。视频中，这辆五菱汽车的方向盘车标上贴有钻石样式的贴片，该车遭遇事故后气囊起爆。

若风 2024-12-29

雷军宣布12月31日举行围炉跨年直播：一起许愿聊天

【环球网科技综合报道】12月29日消息，小米集团的创办人、董事长兼CEO雷军今日宣布，将在12月31日晚8点举行一场特别的围炉跨年直播活动，邀请广大网友一同回顾过去一年的点点滴滴。在这次直播中，雷军将与观众分享2024年的有趣和难忘经历，并鼓励大家在直播间许下新年愿望，共同迎接新的一年。

环球网科技 2024-12-29

细思极恐，微软最新 AI 技术 3 秒钟即可克隆任何人的声音

微软在 AI 上押下重注

推荐体验

相关资讯

3秒复制任何人的嗓音！微软音频版DALL·E细思极恐，环境噪音也能模仿

AI语音诈骗横行，只需3秒钟的音频就能模仿任何人的声音！

细思极恐！他都这样说了

细思极恐：用AI出的图训练AI模型

这是微软搞的天网？ChatGPT已能操控机器人：细思极恐

近期资讯

电脑蓝牙连接指南：轻松实现设备配对与使用技巧

海信将在CES2025发布新型显示技术瞄准QD-OLED

美国22州总检察长请求最高法院维持TikTok封禁

Win11 24H2用户无法使用Wi-Fi！微软仍未解决DHCP问题

南京江北新区低空立体交通产业生态大会召开

本田全球产量连续四月下滑：中国市场跌幅高达28%

三星S25 Ultra相机规格全曝光！主镜头三代不变

理想和问界今年都卖爆但明年就没这么好搞了

车主在方向盘车标上贴钻石贴片：气囊起爆后贴片刺破车顶

雷军宣布12月31日举行围炉跨年直播：一起许愿聊天

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响