当前位置：首页|资讯|ChatGPT|编程

语音与文字的转换

作者：生信小院发布时间：2023-04-16

一起因

ChatGPT的大火，让许多人意识到或许我们能够与AI直接进行交互，而不会出现之前那种答非所问的画面。因此，笔者再想，是否能够将我们的语音和文字实现无缝切换呢？如果可以的话，那是不是以后借助ChatGPT的API，我们也能实现个人的语音版本贾维斯呢？

一番搜寻之后，发现python的确是有文字转语音的包，因此，我们就尝试自制一个吧。
二正文

下面，我们就将用一段代码展示如何读文本与收音。

通过上述代码，我们能够实现将‘this is a good question’这句话从电脑上读出来，也能够通过myrecording实现麦克风语音的实时录入与保存。不过嘛，缺点感情。

看来得自己训练一个语音库了。

不得不说，除了吃穿用，其他的都能在python上实现了。

三惯例小结

其实，笔者演示的只是一个非常简单的例子。对于那些互联网大厂而言，这种类型的应用可能已经在做了。不久的将来，我们每个人或许都能够拥有各自的语音小助手了。
不过，不建议读者在这个方向尝试太多时间，毕竟我们仅仅实现最简单的部分，其余的包括语音转文字，还需要借助深度学习和语料库，这些都是本文未展示的，并且这些也是需要消耗计算资源的。

本推文主要是给大家一个简单的示例，让读者知道语音技术的细节，仅此而已。

四公众号其他资源（方便读者使用）

本公众号开发的相关软件，Multi-omics Hammer软件和Multi-omics Visual软件欢迎大家使用。

Multi-omics Hammer软件下载地址：

https://github.com/wangjun258/Multi-omics-Hammer

Multi-omics Visual软件下载地址：https://github.com/wangjun258/Multi_omics_Visual/releases/tag/Multi_omics_Visual_v1.03

PS：因为本软件是用python脚本撰写，调用了部分依赖包，用户首次使用需要安装python以及对应的包，安装之后便可永久使用。

下面是本号在其他平台的账户，也欢迎大家关注并多提意见。

简书：WJ的生信小院

公众号：生信小院

博客园：生信小院

最后，也欢迎各位大佬能够在本平台上：1传播和讲解自己发表的论文；2：发表对某一科研领域的看法；3：想要达成的合作或者相应的招聘信息；4：展示自己以寻找博后工作或者博士就读的机会;5:博导提供博后工作或者博士攻读机会，都可以后台给笔者留言。希望本平台在进行生信知识分享的同时，能够成为生信分析者的交流平台，能够实现相应的利益互补和双赢（不一定能实现，但是梦想总得是有的吧）。

五封面图

推荐体验

相关资讯

ChatGPT 和语音识别：从语音信号到文字转换的技术原理

在实现这一技术的过程中，需要考虑到语音信号的多样性和噪声干扰等问题，同时需要使用大规模的数据集进行训练。在使用ChatGPT进行自然语言处理时，需要使用预训练的模型，并且可以结合基于知识库的方法，提高系统的准…

小智未来Ai 2023-05-13

从文字到数据：ChatGPT与DataFocus的数据转换之旅

在大数据时代，非结构化数据与结构化数据的界限逐渐模糊。对于企业而言，从海量数据中提炼出有价值的信息是至关重要的。在这个过程中，自然语言处理（NLP）与数据可视化技术发挥着关键作用。今天，我们将重点介绍如何通过ChatGPT和DataFocus实现从文字到数据的转换，以提供更深入、更直观的数据分析体验。ChatGPT：将文字转化为数据ChatGPT是一种强大的自然语言处理模型，能够理解和生成人类语言。通过使用ChatGPT，我们可以将自然语言文字转换为数据，从而更好地进行数据分析和应用。具体而言，ChatG

DataFocus 2023-11-20

使用Whisper批量转换视频中的文字-01

因为工作需要把视频中的语音转换成文字，网上找了很多方案，效果不佳不说，大部分都是价格不菲。正好最近在学习OpenAI，于是找到了这款神器，意外的效果好，而且免费，而且本地就能运行。它有一个windows下客户端可以直接使用，但是一次只能处理一个文件，所以就想着如何自动化批量处理，发现原来它有个cli版本。总的来说，它的原理是先通过ffmpeg转换成音频文件，然后再通过whisper转换成文字总的来说，命令行的方式还比较简介1、去哪里下载代码下载https://github.com/openai/whisp

Whisper GitHub OpenAI 编程

iaiuse 2024-03-13

讯飞现场演示大模型40分钟：可语音文字转换，擅长医疗数学

5月6日下午两点，讯飞星火大模型成果发布会在合肥举办。会上，科大讯飞董事长刘庆峰宣布正式推出星火认知大模型，并在现场进行了超过40分钟的实时演示。刘庆峰称，当前星火大模型在中文领域对话能力、数学能力已超过ChatGPT。这是国内继百度、阿里、商汤、昆仑万维之后，第五家正式发布大语言模型的公司。

医疗科大讯飞百度商汤昆仑万维

南方都市报 2023-05-06

Whisper中文语音转换在python上的简单部署

本文讲述本人使用python将文件中的语音转成文本时遇到的一些问题，希望可以帮助到一些人 1 根据github[https://github.com/openai/whisper]在安装whisper中我遇到了一些问题：我通过conda设置了一个名为whisper的虚拟环境，安装了Python 3.9.9 以及 PyTorch 1.10.1，然后直接使用pip install -U openai-whisper直接安装whisper。问题在于numpy的版本太高，导致报错，将numpy的版本由2.0.2下

Whisper GitHub OpenAI

Sesveria 2024-10-11

近期资讯

起飞！AMD锐龙9 9950X3D细节曝光：5.65GHz、128MB L3缓存

快科技12月27日消息，AMD即将发布的最新旗舰处理器锐龙9 9950X3D的CPU-Z截图曝光，我们也得以一见这款处理器的参数。截图显示，这款处理器拥有16核32线程，CPU 的版本号为GNR-B0 ，其中G

黑白 2024-12-27

一款革命性体验PC即将降临！联想官宣CES 2025 PC新品

快科技12月27日消息，联想官方宣布，将在北京时间2025年1月8日的CES 2025现场，发布多款革命性的笔记本电脑，其中预计包括全新的卷轴屏笔记本。联想表示，将在CES 2025发布多款革命性的笔记本

2024-12-27

吃一口噎得脖子抻出二里地！这种酸奶爆火：2类人食用注意

最近，社交媒体刮起一阵“干噎酸奶”风。各种博主纷纷尝试，不断将其搭配花样推陈出新，不过大家的食用体验似乎都不怎么美好，得出了“吃一口脖子抻出二里地”的品尝心得。

2024-12-27

18寸巨无霸游戏本来袭！谁会用双网口啊

快科技12月27日消息，未来人类(TerransForce)官方宣布，即将推出一款18寸的巨型游戏本，会配备4K屏幕、192GB内存。随后，这款笔记本的详细配置被曝出，证实采用了蓝天的新一代公模X580。毫

上方文Q 2024-12-27

小米超级小爱首次开放：新增三大能力支持5种唤醒

快科技12月27日消息，今日，小米宣布澎湃OS 2首次OTA升级，超级小爱首次向正式版用户开放，小米15 系列、小米14 系列、REDMI K80系列、REDMI K70至尊版即日起开始灰度。据了解，超级

拾柒 2024-12-27

超级小爱上线：小米15/REDMI K80系列首发尝鲜

快科技12月27日消息，今天，小米澎湃OS官微宣布，超级小爱首次面向正式版用户开放升级。据悉，超级小爱是小爱同学的超级AI进化版，致力于打造一个全生态的AI智能助手，它采用全新视觉设计，支

振亭 2024-12-27

RTX 5090主板曝光：硕大GPU、功耗可能600W

百度贴吧“nvidia吧”近日有用户曝光了英伟达即将发布的旗舰级游戏显卡“GeForce RTX 5090”主板（PCBA）的谍照。该照片显示的芯片布局与近期Chiphell论坛曝光的RTX 5090显

2024-12-27

科教兴国筑梦未来！比亚迪30亿教育慈善基金启动仪式

比亚迪30亿教育慈善基金启动仪式将于2024年12月30日10:30正式开始。科技兴则民族兴，教育强则国家强，比亚迪将携手众多高校和科技馆、博物馆，助力科教兴国。

振亭 2024-12-27

小米澎湃OS 2首次重磅更新！张国全：坚决不做一锤子买卖

快科技12月27日消息，今日，小米发布小米澎湃OS 2升级公告，这是澎湃OS 2发布后的首次重大版本更新，超级小爱首次向正式版用户开放。小米手机系统软件部总监张国全发文，称今天起，将开启一轮

拾柒 2024-12-27

搭载激光雷达与高阶智驾！比亚迪汉L最新谍照定位更高

快科技12月27日消息，比亚迪汉L的最新伪装实车图近日曝光，揭示了这款定位高于现款汉家族的新车的多项设计细节。据悉，汉L预计将采用全新的内外饰设计，并搭载比亚迪第五代DM混动技术。

王略 2024-12-27

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1