OpenAI 在 2022 年 9 月推出了一款非常强劲的免费程序,可以让一些有技术水平的人把声音和视频文件变成非常精确的文字。问题是它对于一般用户来说并不是很便利,因为用户需要懂得使用终端应用的指令。
但是有了 MacWhisper (文章末尾获取下载链接),这个问题就解决了。MacWhisper 是一个图形用户界面,基于 OpenAI 的 Whisper 开发,把所有复杂的技术细节藏在后面,让用户只需要拖拽声音文件,就可以很快得到一个文本文件。而且 MacWhisper 非常精确,因为 OpenAI 的 Whisper 已经在网络上的 680,000 小时的声音数据上进行过训练。
MacWhisper 的一个优点是不需要把想要转写的声音或视频文件上传到网络上。这对于任何对上传个人文件到云端有所担心的人来说非常重要。
再次强调,MacWhisper 只是 OpenAI 在去年底推出的一个免费程序的一个 GUI 版本,但它真的会让声音转录效率更高。
使用 OpenAI 官网的 Whisper,以前每次想要转录一个文件,就要在Mac的终端应用程序中输入“whisper audiofilename.mp3 —model tiny.en”。有了 MacWhisper,我只需要拖拽声音文件,它就会自动完成转录,无需多余的输入。
如何使用 MacWhisper 将语音或视频转换为文字
首次打开 MacWhisper 需要选择识别模型,自上而下 Tiny、Base、Small 属于免费模型,后面标有 “PRO” 的属于收费模型。
这些模型体积越大,识别精确率越高。经过测试,在免费的识别模型中,Small 识别率是最精确的,当然体积也是最大的,将近 500 MB 左右。
识别模型下载完成之后,关闭窗口即可看到 MacWhisper 主界面。
在主界面的右上方可以选择识别音频的目标语言和识别模型。
MacWhisper 支持 MP3、WAV、M4A、MP4 和 MOV 格式文件的语音转文字,只需将音频文件拖到窗口中即可开始转录。
转录完成后,将自动显示识别结果,同时上方菜单会发生变化,点击上方选项可以分别查看纯文本或带有时间码的字幕。
如果只需要纯文本,只需要点击上方的“Transcript”按钮,在该界面将会显示一个“Copy”按钮,点击即可完成复制,然后再将复制的文本粘贴到其他文本软件。
如果需要导出带有时间码的字幕文件,点击右上角的“Export”将弹出导出界面。
MacWhisper 免费版支持导出 srt 和 vtt 标准的字幕格式,这些格式可以直接导入 Adobe Premiere 或者 Final Cut Pro。
怎么样?有需求的小伙伴还在等什么?抓紧时间去下载吧。
微信公众号“傻大个黑科技”回复"230620"获取链接
游侠兔兔叽 2023-05-21
AI画师大阳 2023-09-09
半抹灯芯 2023-04-07