当前位置：首页|资讯|OpenAI|Whisper

macOS 终于迎来免费音频/视频转文字

作者：傻大个科技发布时间：2023-06-20

OpenAI 在 2022 年 9 月推出了一款非常强劲的免费程序，可以让一些有技术水平的人把声音和视频文件变成非常精确的文字。问题是它对于一般用户来说并不是很便利，因为用户需要懂得使用终端应用的指令。

但是有了 MacWhisper （文章末尾获取下载链接），这个问题就解决了。MacWhisper 是一个图形用户界面，基于 OpenAI 的 Whisper 开发，把所有复杂的技术细节藏在后面，让用户只需要拖拽声音文件，就可以很快得到一个文本文件。而且 MacWhisper 非常精确，因为 OpenAI 的 Whisper 已经在网络上的 680,000 小时的声音数据上进行过训练。

MacWhisper 的一个优点是不需要把想要转写的声音或视频文件上传到网络上。这对于任何对上传个人文件到云端有所担心的人来说非常重要。

再次强调，MacWhisper 只是 OpenAI 在去年底推出的一个免费程序的一个 GUI 版本，但它真的会让声音转录效率更高。

使用 OpenAI 官网的 Whisper，以前每次想要转录一个文件，就要在Mac的终端应用程序中输入“whisper audiofilename.mp3 —model tiny.en”。有了 MacWhisper，我只需要拖拽声音文件，它就会自动完成转录，无需多余的输入。

如何使用 MacWhisper 将语音或视频转换为文字

首次打开 MacWhisper 需要选择识别模型，自上而下 Tiny、Base、Small 属于免费模型，后面标有 “PRO” 的属于收费模型。

这些模型体积越大，识别精确率越高。经过测试，在免费的识别模型中，Small 识别率是最精确的，当然体积也是最大的，将近 500 MB 左右。

识别模型下载完成之后，关闭窗口即可看到 MacWhisper 主界面。

在主界面的右上方可以选择识别音频的目标语言和识别模型。

MacWhisper 支持 MP3、WAV、M4A、MP4 和 MOV 格式文件的语音转文字，只需将音频文件拖到窗口中即可开始转录。

转录完成后，将自动显示识别结果，同时上方菜单会发生变化，点击上方选项可以分别查看纯文本或带有时间码的字幕。

如果只需要纯文本，只需要点击上方的“Transcript”按钮，在该界面将会显示一个“Copy”按钮，点击即可完成复制，然后再将复制的文本粘贴到其他文本软件。

如果需要导出带有时间码的字幕文件，点击右上角的“Export”将弹出导出界面。

MacWhisper 免费版支持导出 srt 和 vtt 标准的字幕格式，这些格式可以直接导入 Adobe Premiere 或者 Final Cut Pro。

怎么样？有需求的小伙伴还在等什么？抓紧时间去下载吧。

微信公众号“傻大个黑科技”回复"230620"获取链接

推荐体验

相关资讯

WhisperDesktop 1.8音频转文字软件双向【免费开源】

可实现本地电脑的音频转文字软件！双向转换，完全免费开源！支持 Windows、macOS、Linux（目前界面只有英文的，但支持中文的转换）特征基于 DirectCompute 的供应商不可知的 GPGPU；该技术的另一个名称是“Direct3D 11 中的计算着色器”纯 C++ 实现，除了基本的 OS 组件外没有运行时依赖性比 OpenAI 的实现快得多。混合 F16 / F32 精度：自 D3D 版本 10.0 起，Windows 需要缓冲区的支持 R16_FLOAT内置性能分析器，可测量单个计算

游侠兔兔叽 2023-05-21

语音转文字软件Whisper，实时自动语音识别，音频视频文案提取

很多做录音采访之类的工作，需要实时录音后期还要将谈话内容整理成文字，如果人工去做的话及其耗时，还可以根据音频文件生成srt字幕，非常适合做自媒体视频的人用，还比如看到一些视频非常好很想将里面的文案提取出来，有很多软件就可以实现将语音转成文字，这里就跟大家分享一个免费又好用的软件：Whisper，这是一个免费开源程序，该软件是whisper.cpp实现的Windows 移植，是OpenAI 的 Whisper自动语音识别 (ASR) 模型的 C++ 端口。github项目地址：https://github.

Whisper GitHub OpenAI

AI画师大阳 2023-09-09

7款音频转文字，最简单好用的是哪个

Buzz：离线语音转文字（字幕），实时语音识别，基于 OpenAI Whisper功能实时语音转文字、实时翻译（需麦克风权限）导入音频、视频文件（mp3、wav、m4a、ogg、mp4、webm、ogm），导出逐句字幕或逐词字幕（导出格式：TXT、SRT、VTT）那么已经是下载好了然后打开，啊这比脸还干净试着录一个试试重新下载一下Whisper 是一种通用语音识别模型。Buzz 也相当于是一个 Whisper 的可视化界面版本。好兄弟这并不好用那么有没有简单一点的方式，看看人家剪映这个导入文件识别字母

小良人 2024-07-02

在Java项目中集成OpenAI音频转录API，轻松实现音频转文字功能

音频转录是一种将音频文件转换为文本的技术，它在语音识别、语音合成等领域有着广泛的应用。OpenAI 提供了一款名为 OpenAI API 的音频转录工具，可以通过 HTTP 请求来调用该 API 实现音频文件的转录。在本篇文章中，我们将介绍如何使用 Java 编写程序来调用 OpenAI API 实现音频转录，并且讲解实现思路。程序设计思路在开始编写代码之前，我们需要确定程序的基本思路。OpenAI 音频转录 API 的基本使用流程如下：按照格式要求创建 HTTP 请求；发送 HTTP 请求，并获取响应结

半抹灯芯 2023-04-07

【AI应用】视频/语音自动转文字，并生成概览

AI是知识时代的挖掘机，大幅提升教学与科研生产力。会议”开会，因为它有实时转写会议记录、并生成会议纪要的功能。会议那样，将声音转变为文字、并生成会议纪要呢？“通义千问”中的“通义效率/通义听悟”完全可以实现这一点！大家感兴趣的话都可以试试。它既可以在开会时进行“实时记录”（转文字），再加上还有浏览器插件，

jowa 2024-06-28

近期资讯

开箱评测奢音X9是2024最好的韶音平替吗

前言：奢音X9已经首发上市了，今天我们抢先拿到了新品，给大家揭秘这次产品更新，都有哪些变化呢？奢音X9采用防水机身，经过防水标准检测，达到了IPX8级防水。

砍柴网 2024-12-31

池州市乾峰新材料有限公司取得高性能间位芳纶纤维加工用输送设备专利，有效地达到在收卷同时自动对间位芳纶布进行包裹防护避免运输过程中受到污染

金融界2024年12月31日消息，国家知识产权局信息显示，池州市乾峰新材料有限公司取得一项名为“一种高性能间位芳纶纤维加工用输送设备”的专利，授权公告号CN222225494U，申请日期为2024年3月。

金融界 2024-12-31

“烛龙”被发现，已知最遥远螺旋星系

12月31日消息，国际天文学团队借助詹姆斯・韦伯太空望远镜，通过PANORAMIC巡天项目，观测到“烛龙”（Zhúlóng）和A2744-GDSp-z4两个螺旋星系，这一发现再次革新了我们对早期宇宙星系演化的理解。

IT之家 2024-12-31

无线网卡驱动安装全攻略：确保您的网络连接顺畅无阻

在现代社会，网络已经成为我们生活中不可或缺的一部分，而无线网卡则是连接无线网络的重要工具。今天就跟大家聊聊无线网卡驱动的安装过程，确保你能顺利上网。

新报观察 2024-12-31

外媒评选2024最佳大折叠屏手机 3款国产手机上榜

【CNMO科技消息】2024年，折叠屏手机达到了新的高度，顶级制造商带来了尖端创新。现在，外媒GIZMOCHINA评选出了今年最佳的大折叠智能手机，其中包括3款国产手机，这些设备将未来设计与卓越性能融为一体。在硬件配置方面，该设备配备了5200mAh电池和66W有线充电，是一款吸引技术爱好者和专业人士的高端设备。

手机中国 2024-12-31

联通好服务：创新领航，开启智能服务新程

自2013年加入亳州联通以来，任怀东便以一名智家工程师的身份，默默守护着辖区内超过1000户家庭的数字生活，用实际行动诠释着“服务无小事，用心筑未来”的深刻内涵。作为一名有远见的智家工程师，任怀东深知，随着科技的飞速发展，用户对网络速度和质量的需求将越来越高。

砍柴网 2024-12-31

苹果iPhone SE 4定价超3600元

苹果iPhoneSE4被曝将在明年上半年推出，但是价格涨至499美元（约合人民币3642元），但它在iPhone产品线中依然是最便宜的产品，也是苹果最具性价比的iPhone。相比之下，iPhoneSE3的起售价是429美元，两者相差70美元。

中关村在线 2024-12-31

深圳市华智信息科技取得纸卷装置排出结构专利，能够连续地将卷形片状物从随转夹爪上分离

金融界2024年12月31日消息，国家知识产权局信息显示，深圳市华智信息科技有限公司取得一项名为“纸卷装置排出结构”的专利，授权公告号CN222225498U，申请日期为2024年4月。

金融界 2024-12-31

数字时代新手指南：一步步教你安装电脑与操作系统

很多人可能刚接触电脑，或者想要自己动手安装一台新的电脑，但却不知道从何开始。首先，咱们得明确一下要安装的是什么。根据自己的需要选择安装，通常来说，常见的软件都有自己的官方网站供下载，确保下载时注意安全。

新报观察 2024-12-31

新年新气象，2025华为服务日焕新开启

新年新气象，2025华为服务日焕新开启新年新气象，华为准备再次将温暖传递给每一位消费者——2025年华为服务日活动即将开启。新的一年，华为服务日权益全新升级，不仅延续了一贯的贴心服务，还新增了多项权益。

中关村在线 2024-12-31

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1