一 起因
ChatGPT的大火,让许多人意识到或许我们能够与AI直接进行交互,而不会出现之前那种答非所问的画面。因此,笔者再想,是否能够将我们的语音和文字实现无缝切换呢?如果可以的话,那是不是以后借助ChatGPT的API,我们也能实现个人的语音版本贾维斯呢?
一番搜寻之后,发现python的确是有文字转语音的包,因此,我们就尝试自制一个吧。
二 正文
下面,我们就将用一段代码展示如何读文本与收音。
通过上述代码,我们能够实现将‘this is a good question’这句话从电脑上读出来,也能够通过myrecording实现麦克风语音的实时录入与保存。不过嘛,缺点感情。
看来得自己训练一个语音库了。
不得不说,除了吃穿用,其他的都能在python上实现了。
三 惯例小结
其实,笔者演示的只是一个非常简单的例子。对于那些互联网大厂而言,这种类型的应用可能已经在做了。不久的将来,我们每个人或许都能够拥有各自的语音小助手了。
不过,不建议读者在这个方向尝试太多时间,毕竟我们仅仅实现最简单的部分,其余的包括语音转文字,还需要借助深度学习和语料库,这些都是本文未展示的,并且这些也是需要消耗计算资源的。
本推文主要是给大家一个简单的示例,让读者知道语音技术的细节,仅此而已。
四 公众号其他资源(方便读者使用)
本公众号开发的相关软件,Multi-omics Hammer软件和Multi-omics Visual软件欢迎大家使用。
Multi-omics Hammer软件下载地址:
https://github.com/wangjun258/Multi-omics-Hammer
Multi-omics Visual软件下载地址:https://github.com/wangjun258/Multi_omics_Visual/releases/tag/Multi_omics_Visual_v1.03
PS:因为本软件是用python脚本撰写,调用了部分依赖包,用户首次使用需要安装python以及对应的包,安装之后便可永久使用。
下面是本号在其他平台的账户,也欢迎大家关注并多提意见。
简书:WJ的生信小院
公众号:生信小院
博客园:生信小院
最后,也欢迎各位大佬能够在本平台上:1传播和讲解自己发表的论文;2:发表对某一科研领域的看法;3:想要达成的合作或者相应的招聘信息;4:展示自己以寻找博后工作或者博士就读的机会;5:博导提供博后工作或者博士攻读机会,都可以后台给笔者留言。希望本平台在进行生信知识分享的同时,能够成为生信分析者的交流平台,能够实现相应的利益互补和双赢(不一定能实现,但是梦想总得是有的吧)。
五 封面图