当前位置：首页|资讯|OpenAI|Whisper

命令行批量处理OpenAI Whisper语音识别

作者：山风入谷发布时间：2023-08-17

通过批处理脚本.bat实现音视频文件的批量语音识别_(:3」∠)_

功能如下

输入命令行（也可使用预设：令第一个字符为1或2）
使用通配符来选取文件
统计文件数量及类型
文件自动分组（避免命令行超出8191个字符的限制）
运行时间统计（24小时以内，如超出则自行计算天数即可）

OpenAI Whisper运行结果

Whisper-CTranslate2运行结果

上面第二张图片是Whisper-CTranslate2的运行结果，它基于Faster-Whisper项目，与旧OpenAI Whisper命令行兼容。在保证精度的同时，占用内存更少，运行速度更快，且支持用彩色显示单词置信度，非常推荐哦。仓库：https://github.com/Softcatala/whisper-ctranslate2

脚本使用方面，复制代码到文本文档，改后缀为.bat，将其与待处理文件放在同一个目录下，直接运行就可以了

如果嫌要把.bat文件移来移去太麻烦的话，可以把它放在一个固定的位置，比如D:\cmd_AutoRun\Process.bat，然后在cmd中用doskey命令给调用.bat的命令（call）设置一个别名，比如

这样就可以在cmd中输入“wbat”来直接调用脚本文件了，但是这个命令只对当前窗口有效。如果要每次打开cmd都可以使用别名的话，需要修改注册表，具体请搜索“cmd命令别名”
修改成功之后，在文件目录shift+右键，“在此处打开命令窗口”，再输入定义的别名可以调用了。当然，在资源管理器的地址栏输入“cmd”也是同样的效果

Process.bat

一些关于脚本的说明

1.输入命令行

可以直接输入Whisper命令，并用%i来代替文件名，例如

也准备了两种预设，方法是使第一个输入的字符为1或2，脚本会将1或2替换为对应的不完整命令，所以后面还需要补充参数。如“1medium”、“2small -f txt”等等

2.通配符

*表示任意数量的字符，?表示单个字符

如*.wav表示所有的wav文件，??x.ogg表示所有结尾为x的三字符ogg文件

要选取多种文件，只需将表达式用半角逗号或空格隔开。如*.ogg,*.mp4 *.flac

如果当前目录下全部文件都需要处理，只要输入一个*就可以了

更详细的cmd通配符用法请搜索“cmd通配符”

3.临时文件

脚本在运行过程中会创建名为“process_output.txt”的文件来存放信息，并在运行完成后删除

如果当前目录下正好有同名文件，请一定一定要将其转移或备份，否则会被删掉的哦

4.脚本思路

核心思路来源于OpenAI Whisper官网的这句示例

一条whisper命令可以输入多个文件名，只要把他们用空格隔开就好了。脚本所做的事情其实就是将这些文件名整合到形式变量%i中。并且考虑到命令行有8191个字符限制，所以要将过多的文件分组。

看似比较繁琐，不如用for循环遍历所有文件，然后每个文件执行一次命令来得方便
但是经过测试，多文件合并输出的方法相较单文件，处理的速度要快上不少。尤其是在大模型、多个小文件的情况下。推测是每次执行命令就会加载一次模型，而后者将太多时间花在模型的加载上，所以速度较慢。

下面是验证过程

OpenAI Whisper，5样本，medium模型处理结果，时间比1.6344

OpenAI Whisper，5样本，large-v2模型处理结果，时间比1.6768

Whisper-CTranslate2，5样本，large-v2模型处理结果，时间比3.6985

可以看出，在large-v2模型，5个短音频（galgame角色语音）的条件下
OpenAI Whisper合并输出能节省40%左右的时间
Whisper-CTranslate2合并输出甚至能节省73%左右的时间

当然，如果处理长音频，并且样本数量比较少的话，两者的差距并不会有上面这样显著。但无论如何，合并输出的速度都是比单独输出要快的

推荐体验

相关资讯

朴素的命令行版 CHATGPT

自己花了20刀升级了CHATGPT PLUS，谁料现在被封不能访问网页版，只能自己解决。看到网上很多在线CHATGPT，要么收费，要么不稳定，不如花几分钟自己做一个。参考了网上代码，稍微改改，做成命令行下运行的PYTHON脚本。说明：APIKEY需要自己到官网申请后填写每次输入时，1. 输入init重置历史对话信息（减少每次传输的文字数量，当然也没了上下文）2. 输入exit结束会话运行效果代码如下，拿走不谢import openaiopenai.api_key='OPENAI官网申请的API'# 系统信

ChatGPT 编程 OpenAI

chemico 2023-04-18

漂亮的命令行交互工具 clack 与 ChatGPT 集成

clack 被设计成一个类似于时间线的漂亮的 cli 交互工具。本文介绍： clack 的基本用法，以及集成 ChatGPT 的聊天工程 clack 工程化分析整体上，使用 pnpm worksp

进二开物 2023-05-18

用Rust实现免费调用ChatGPT的命令行工具 (二)

用Rust实现免费调用ChatGPT的命令行工具，大家可以看看个效果，希望大家能够给我个star，谢谢

路奇老师 2024-04-20

构建命令行工具以利用大型语言模型生成 README

本周，我正在我的开源开发课程中进行第一次发布。在我的第一个版本中，我构建了一个命令行工具，旨在与 OpenAI 兼容的聊天完成 API 端点进行交互，使开发者能够利用大型语言模型（LLMs）的强大功能

大语言模型 OpenAI

用户076053035438 2024-09-23

ChatGPT 与命令行的完美结合，极大提升开发效率

大家好，又见面了，我是 GitHub 精选君！背景介绍在日常开发中，我们经常会遇到需要查找代码、改进代码库以及对代码进行评审的情况。同时，我们也需要进行代码重构、生成测试代码、执行Shell命令等任务。这些操作往往需要借助浏览器查找相关的信息，存在多个软件的切换，可能会花费大量的时间和精力，降低开发效率。为了解决这些问题，今天要介绍一个多功能命令行工具：auto-copilot-cli。项目介绍auto-copilot-cli 是一个功能丰富的工具，提供了多项功能，包括：• AI代码交互：帮助您快速查找和

ChatGPT GitHub Copilot 编程

GitHub精选 2023-07-11

近期资讯

荣耀股改已完成：将适时启动IPO流程

快科技12月28日消息，根据荣耀官网公告，荣耀终端有限公司已于2024年12月28日依法整体变更为股份有限公司，公司名称变更为“荣耀终端股份有限公司”。这代表着荣耀的股改已经完成，

2024-12-28

小米汽车正式亮相一周年：交付量破13万提前完成全年目标

快科技12月28日消息，去年的今天，小米SU7正式亮相。如今一周年过去，小米汽车官宣：SU7全年交付量已超13万，提前完成全年所有目标。值得注意的是，小米SU7在今年4月3日才开始交付，实际上这

2024-12-28

“实地”感受月球！嫦娥五号月球样品今日向公众开放

快科技12月28日消息，2020年12月，嫦娥五号成功从月球带回月壤样品，我国成为世界上第三个成功带回月球样品的国家，实现了我国及人类探月史上里程碑式的跨越。最重要的是，现在公众也能近距离

2024-12-28

男子22万买车投保29万故意开进湖里：网友直呼蠢到家了！

快科技12月28日消息，据国内媒体报道称，近日一男子将自己22万买的车故意开进湖里引发围观，这到底是什么神操作？报道中提到，唐某报案称其驾车在长沙某钓鱼基地因操作不慎冲入水中致车辆报废

2024-12-28

紫光展锐发布旗舰穿戴芯片W337：首创双核CPU+3D GPU

快科技12月28日消息，近日，紫光展锐正式推出基于RTOS系统的旗舰产品W337，这是一款功能丰富的低功耗智能穿戴芯片。展锐W337拥有超高的集成度，集成了双核CPU、GPU、ISP、Display、Video、Aud

2024-12-28

卢伟冰谈董明珠炮轰小米空调：企业应与时俱进

12月27日晚间，小米中国区总裁卢伟冰举办了2024年度直播总结，回顾了过去一年小米所取得的成绩。同时，卢伟冰也谈到了格力董明珠与小米空调的冲突。今年早些时候，董明珠在格力股东大会上

2024-12-28

支持禁油车吗！专家：油车污染空气严重中国城市靠电动车

12月28日消息，国际欧亚科学院院士，住房和城乡建设部原副部长仇保兴近日公开表示，中国密集城市电动车是优选。城市之间的竞争能够引发技术的合理性和投资的效益，防止错误路线的锁定。&ldq

2024-12-28

首颗已点亮长城汽车成立芯片公司：紫荆半导体落户南京

快科技12月28日消息，近日，南京江北新区与长城汽车股份有限公司战略合作签约活动举行，长城汽车培育的RISC-V车规芯片设计公司紫荆半导体落户新区。南京紫荆半导体有限公司（简称“紫荆半

2024-12-28

欧美怕吗！我国自研600公斤发动机点火：无人机打击更牛

快科技12月28日消息，据国内媒体报道称，中国航发自主研制的600公斤推力级高端涡扇发动机在天府轻动成功点火。报道中提到，中国航发本次集中发布的三个系列产品分别是高端长寿命涡扇发动机系列

2024-12-28

完胜保时捷卡宴：极氪7X成功登顶“中国最具挑战大雪道”

快科技12月28日消息，电动化的迅猛发展，带来了真正意义上的科技平权，让20多万的车也能获得超越百万级的享受。近日，极氪使用一台7X成功登顶了“中国最具挑战雪道”——

2024-12-28

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1