当前位置:首页|资讯|人工智能|OpenAI|Whisper

基于人工智能Ai,开源版语音/视频转文本

作者:傻大个科技发布时间:2023-10-15

语音转文本对于媒体行业的人来说是一项非常实用的技术,因为它可以将录音、音频或视频文件转换为可编辑的文本,使用户可以方便地对其进行编辑和存储。

在过去,手拍字幕应该是最快的一种方式了,而现在使用基于人工智能的语音转文本,一段长达一小时的音频也只需要一分钟就可以识别完成。

虽然市面上有很多在线或离线的工具可以完成语音转文本的任务。但是,大多数免费的工具都有一些限制,比如时间、质量或格式。

今天,小妹分享一个免费工具,它可以利用 OpenAI 的 Whisper 技术,把任何音频文件转换成高质量的文本,并且没有任何限制。

这里科普一下,Wisper 是一种开源神经网络,可提供媲美人类水平的准确性以及强大的语音识别,可喜的是它可以完美支持中文。

如果你或朋友是媒体人,亦或者有视频或音频转文本的需求,一定要将这篇文章分享出去,让更多的朋友可以受益。

软件介绍

Buzz 是一款国外软件,基于 OpenAI 的 Whisper 技术。使用 Buzz 可以轻松地将音频自动转录为文本,这只是一项基本功能。

它最强悍的功能是您只需对着麦克风说话, Buzz 可以几乎实时地将其转换为文本甚至完成实时翻译。

关注小妹的朋友都知道,小妹分享的工具免费是前提条件,Buzz 也不例外,它完全免费而且开源,兼容 Windows、macOS 和 Linux。

使用教程

使用 Buzz 非常简单,只需要三个步骤:

打开Buzz应用程序,点击顶部“File”菜单,选择“Import Media File”,导入一个音频或视频文件。

Buzz 支持多种格式,常用的音频格式如 mp3、wav、m4a、ogg,视频格式如常见的 mp4、webm、ogm、mov 都可以完美兼容。

然后按下图的选项,进行设置,设置完成之后点击“Run”。

等待 Buzz 识别音频或视频文件,不需要太长时间,具体取决于文件的时间长短和网络速度。

进度显示 100% 之后,双击可查看转换后的文本,识别后的文本自带时间戳,点击界面右下角的"Export",可以导出 txt、srt、VTT 三种格式。

然后将带时间戳的格式直接导入到视频编辑文件就可以了,比如 Premiere。

上面提到过,Buzz 最强悍的功能是实时翻译,要使用实时翻译,只需要在主界面点击麦克风图标,将 Live Recording 界面的 Task 更改为 “Translate” 即可。

怎么样?今天分享的这款工具够不够强悍呢?下载链接已经奉上。

微 信 公 众 号 “ 傻 大 个 黑 科 技 ”,回 复 信 息 “231015” 获 取 下 载 链 接




Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1