现实版本柯南的“变声蝴蝶结”—AudioGPT大模型应用

作者：千与编程发布时间：2023-11-17

编程 AIGC GitHub

大家好，我是千与编程，目前在程序员鱼皮的编程导航知识星球里担任知识分享嘉宾，负责干货技术的分享。

相信大家都看过名侦探柯南，我以前就特别羡慕柯南的“蝴蝶结型变声器”，可以自由的变换想要发出的声音。

而今天和大家介绍的大模型应用是AudioGPT模型应用，那效果简直就是现实版本柯南的“变声蝴蝶结”！

AudioGPT的应用是针对于语音算法的领域的大模型应用。以下是AudioGPT程序的Github社区地址:

https://github.com/AIGC-Audio/AudioGPT

以下跟大家演示一下如何在自己的Windows电脑上去运行AudioGPT的代码程序，以及如何学会正确运用AudioGPT实现对应的功能？

首先需要实现搭建模型运行环境，然后安装requirements文件列表里面的这安装依赖项，以及怎么实现在我们本地的客户端去运行AudioGPT的程序。

1. 创建运行程序新的conda环境

2. 安装环境运行所需依赖

3. 下载模型文件

4. 开始运行AudioGPT程序

至此我们可以实际检验AudioGPT的实际功能。

以上的操作步骤还是似乎还是偏向于极客，可以直接使用Hugging Face社区，调用实际的API接口，使用更加方便。

以下是Hugging Face社区的代码地址:

https://huggingface.co/spaces/AIGC-Audio/AudioGPT

AudioGPT效果如下图所示：

实践环节演示

AudioGPT包括以下几种功能，由于AudioGPT的模型属于语音音频方向的大模型。其功能包括以下的内容分类。

第一、实现根据输入文本转换为语音文件的语音合成

例如：生成带有文本“here we go”的语音音频

第二、实现将单通道语音转换为双通道语音

第三、根据语言的文本描述生成对应语音

例如：生成狗叫声的音频

第四，根据音频输出指定文字的描述

例如：给我这个生成音频的语言描述

第五、根据输入语音信号转换输出其对应的频谱图

第六、说明音频内部所包含的事件以及起止时间

例如：这段音频中的雷声是什么时候发生的？

不仅如此，AudioGPT也集成了图像识别的功能，根据图片输入的上传图片生成对应的内容描述音频

例如：上传下图的江南水乡的图片

然后通过江南水乡的图片，生成的雨水声音

怎么样感觉效果如何？不过其实告诉大家一个秘密，音频信号的处理，相对来说，比较占用内存，处理音频的时间较长，可以选择不同的加速硬件GPU，如下图所示

原始使用的T4显卡是免费的，其实理论上计算性能也还不错，免费的，还要啥自行车，赶快动手试试吧！

我是千与编程，一个只讲干货的码农，我们下期见~

相关资讯

RVC语音变声器入门使用（AI大模型）

RVC本身就是一个AI大模型整合而来，所以本质仍然是一个AI语音模型,但效果实际上比MORPHVOX还要好，效果完全可以做到像柯南那样蝴蝶结变声器吊打各种配音软件，好的模型每一段都可以作为大厂（某讯）配音典范一、AI变声器推荐配置：独立显卡2G以上显存（580左右以上） 4G以上内存 16G以上预留空间二、下载软件及AI模型配置文件获取数据文件（123盘）:https://www.123pan.com/s/MPyA-ilSgv.html 获取数据文件（夸克盘）:https://pan.quark

AI大模型 AI音频

真柒柒 2024-06-30

【AI绘画】飞蝴蝶的蝴蝶女孩

[图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] [图片] ?

AI绘画

反迷你世界联合国 2023-11-29

DeepMind的ChatGPT：大型语言模型的现实应用与未来挑战

最近，DeepMind再次引发了广泛关注，因为他们的大型语言模型成功进入现实世界，为人工智能领域带来了一次重量级的突破。此外，DeepMind还积极探索医疗领域的应用，通过人工智能技术对医学图像进行分析和诊断…

ChatGPT 大语言模型人工智能医疗

林森森林 2023-07-30

OpenAI在虚拟现实和增强现实领域的应用

当谈到OpenAI在虚拟现实（VR）和增强现实（AR）领域的应用时，我们可以看到人工智能技术与这些领域的结合正在创造出全新的体验和可能性。让我们一起探讨一下OpenAI在VR和AR领域的一些潜在应用。模拟与虚拟体验：OpenAI的技术可以用于创造逼真的虚拟环境和体验。通过机器学习和计算机图形学，OpenAI可以生成高质量的虚拟场景、人物和物体，使用户能够身临其境地体验各种情境。示例：OpenAI的模型可以生成逼真的虚拟城市，用户可以在其中自由探索和与虚拟居民进行交互。个性化虚拟助手：OpenAI的技术可以

OpenAI 人工智能机器学习

人工智能小智Ai 2023-05-18

探索ChatGPT在虚拟现实和增强现实中的应用

虚拟现实（Virtual Reality，简称VR）和增强现实（Augmented Reality，简称AR）是近年来备受关注的技术领域。这两种技术可以提供身临其境的感觉和强烈的沉浸感，成为了游戏、教育、医疗、军事等领域的重要工具。作为一名聊天机器人，ChatGPT也可以在虚拟现实和增强现实中发挥作用，为用户带来更好的体验和服务。本文将探讨ChatGPT在虚拟现实和增强现实中的应用。一、ChatGPT在虚拟现实中的应用虚拟现实是一种模拟真实环境的技术，它通过头戴式显示器、手柄、定位追踪器等设备，让用户身临

ChatGPT 教育医疗

人工智能小智Ai 2023-05-02

近期资讯

秋妍科技 2024-12-26

统一石化在“第九届汽车服务连锁发展论坛”分享品牌成长经验

近日，“第九届汽车服务连锁发展论坛暨汽车后市场连锁百强&TOP品牌颁奖典礼”在上海隆重举行。作为以逆势增长推动行业发展的产业链企业，统一股份总经理、统一石化CEO李嘉先生代表企业与AC汽车创始人陈海生先生、罗兰贝格大中华区副总裁吴钊先生中国汽车流通协会副秘书长郎学红女士等齐聚一堂，共同聚焦行业剧变与持续增长。回顾统一这30余年的发展，企业始终以持续增长为核心。对此，统一总结包括平台结网合作、“爆品开门” 提升成交效率、切入新能源赛道、拓展传统产品新场景、推广绿色零溢价产品、抓住国货成交 KA 机会、利用

江江的科技生活 2024-12-26

OPPO开启“清仓模式”，满级防水+四年耐用电池，如今才卖1282元

“新机型发布，老机型让路”。这是手机行业一直以来的规律。对于老机型来说，最好的结局就是再刺激一波销量功成身退。为了给OPPO A5 Pro全面让路，上一代机型OPPO A3 Pro的价格跌至清仓价。其中，8GB+256GB版本到手仅需1282元，可以说性价比非常高。那么，和市面上同价位机型相比，OPPO A3 Pro是否更加值得我们消费者入手呢？虽然OPPO A3 Pro是一款标准的千元机，但是它拥有着媲美高端手机的外观设计，而且它的核心配置表现同样很给力。它配备了一块6.7英寸的曲面全面屏，拥有120H

小愚测评 2024-12-26

统一石化打造“绿色算力”液冷解决方案，推动算力产业发展

作为润滑油领域的知名品牌，统一石化不仅在低碳润滑领域积累了丰富的技术经验，还长期致力于液冷技术领域的创新与研究，为新能源汽车领域和数据中心领域打造了一系列低碳能效的液冷技术方案，所取得的成果也受到了行业的认可。面对数据中心的高速发展，统一凭借着在液冷领域积淀的深厚技术实力和对行业发展的敏锐观察力，推出了统一“绿色算力”液冷解决方案，通过采用液冷技术、提升服务器效率、利用可再生能源及优化能效比（PUE）四大途径实现降碳减排目标，助力算力产业跨越基础满足走向价值满足，成为用户和地球都喜爱的冷却液产品方案。目

来聊科技 2024-12-26

亚远景-ISO 21434标准下的汽车网络安全测试：全面要求与实施策略

ISO 21434标准在安全测试方面有着详细且全面的要求，以确保车辆网络系统的安全性能得到有效验证和确认。以下是该标准在安全测试方面的主要要求：一、安全测试计划的制定与执行要求：制造商需要制定并执行详细的安全测试计划，该计划应明确定义测试范围、测试目标、测试方法和流程，以确保全面覆盖车辆系统的安全功能和特性。二、静态安全测试内容：ISO 21434鼓励进行静态安全测试，即对车辆系统的设计文档、架构、代码等进行分析和评估，以发现潜在的安全漏洞和设计缺陷。目的：通过深入分析系统的各个组成部分，识别潜

亚远景科技 2024-12-26

宏电出席第十五届物联网产业与智慧城市发展年会

12月20日，由中国通信工业协会指导，中国通信工业协会物联网应用分会主办，中国智慧城市规划与建设推进联盟、北京新型智慧城市工程技术研究院协办的第十五届物联网产业与智慧城市发展年会成功召开。本届年会以“科技创新·数智未来”为主题，汇聚了百余名知名专家学者、企业家、投资者等，探讨深化智慧城市发展，推进城市全域数字化转型路径与策略，更好推进中国式现代化城市建设。作为物联网产业领跑者，宏电股份受邀出席，宏电感知技术总监涂松龄发表《城市内涝立体监测与预警指挥系统分享》主题报告。在城市化进程不断推进和极端降雨事件频

深圳宏电 2024-12-26

经销商集团|二手车业务为经销商集团发展提供更多可能性

　　近三十年，国内二手车行业经营从最开始的无序生长过渡到当前的规模化发展，机遇与挑战并存。2023促进二手车商品化、规模化、专业化经营，2024置换补贴、以旧换新政策措施全面落地实施，多年来，制约二手车行业发展的堵点痛点被破除，且行业政策环境在逐步放松。但汽车经销商集团盈利状况不佳，市场竞争激烈，亟需转型求变，迎接二手车行业发展的全新机遇和挑战。　　二手车市场分析　　2024年，国内二手车市场呈现出强劲复苏的势头。根据中国汽车流通协会的数据，2024年11月，全国二手车市场交易量达178.56万辆，环比增

上海丰车 2024-12-26

现实版本柯南的“变声蝴蝶结”—AudioGPT大模型应用

推荐体验

相关资讯

RVC语音变声器入门使用（AI大模型）

【AI绘画】飞蝴蝶的蝴蝶女孩

DeepMind的ChatGPT：大型语言模型的现实应用与未来挑战

OpenAI在虚拟现实和增强现实领域的应用

探索ChatGPT在虚拟现实和增强现实中的应用

近期资讯

为什么400G光模块和800G光模块如此火爆？

EMG伺服阀SV1-10系列SV1-10/16/210/6

iwork8安装64位linux

如何选择录音器材

统一石化在“第九届汽车服务连锁发展论坛”分享品牌成长经验

OPPO开启“清仓模式”，满级防水+四年耐用电池，如今才卖1282元

统一石化打造“绿色算力”液冷解决方案，推动算力产业发展

亚远景-ISO 21434标准下的汽车网络安全测试：全面要求与实施策略

宏电出席第十五届物联网产业与智慧城市发展年会

经销商集团|二手车业务为经销商集团发展提供更多可能性

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响