当前位置：首页|资讯|Whisper|GitHub|OpenAI|编程

使用Whisper批量转换视频中的文字-01

作者：iaiuse发布时间：2024-03-13

Whisper GitHub OpenAI 编程

因为工作需要把视频中的语音转换成文字，网上找了很多方案，效果不佳不说，大部分都是价格不菲。正好最近在学习OpenAI，于是找到了这款神器，意外的效果好，而且免费，而且本地就能运行。它有一个windows下客户端可以直接使用，但是一次只能处理一个文件，所以就想着如何自动化批量处理，发现原来它有个cli版本。
总的来说，它的原理是先通过ffmpeg转换成音频文件，然后再通过whisper转换成文字

总的来说，命令行的方式还比较简介

1、去哪里下载

代码下载

https://github.com/openai/whisper/releases
在github上可以下载到最新的版本

这个是官方的地址，有兴趣可以下来看看，主要用到的是下面地址的内容

模型下载（针对命令行方式和客户端方式）

https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main

很好理解，模型越大越慢，也越精准，所以我下载了large。

2、客户端版本

这里说的客户端版本，就是它提供了一个exe文件，里面可以设置一些东西。
https://github.com/Const-me/Whisper/releases

这里的WhisperDesktop就是Windows下的版本了，从这里看应该是没有其他系统的版本了。
客户端版本使用比较简单，但是需要先下载模型文件，下面会用到，它启动就会要求。

2.1 启动

启动很简单，加载模型需要一些时间，还挺久的

这里可以设置选择哪个显卡，在advanced里面可以设置显卡

老实说，也没啥必要调整，就一个简单工具，调整也调不出花来。

2.2 转换

设置一下要转换的文件，还有输出的格式，默认情况，下面的Place that file to the input folder 是没有选中的，选中以后，输出的文件名就和原始文件名一致，但是扩展名不同。
比如图上的，原始文件名是家庭.mp4,结果就是家庭.txt。
设置好了以后，就开始走进度转换了

转换的效果没得说，遗憾的是一次只能搞1个。所以想尝试批量方案。一开始尝试rpa，后来想想有点杀鸡用牛刀了
今天的内容就先分享到这里哦

推荐体验

相关资讯

语音与文字的转换

一起因ChatGPT的大火，让许多人意识到或许我们能够与AI直接进行交互，而不会出现之前那种答非所问的画面。因此，笔者再想，是否能够将我们的语音和文字实现无缝切换呢？如果可以的话，那是不是以后借助ChatGPT的API，我们也能实现个人的语音版本贾维斯呢？一番搜寻之后，发现python的确是有文字转语音的包，因此，我们就尝试自制一个吧。二正文下面，我们就将用一段代码展示如何读文本与收音。from gtts import gTTSfrom playsound import playsoundimport

生信小院 2023-04-16

Whisper中文语音转换在python上的简单部署

本文讲述本人使用python将文件中的语音转成文本时遇到的一些问题，希望可以帮助到一些人 1 根据github[https://github.com/openai/whisper]在安装whisper中我遇到了一些问题：我通过conda设置了一个名为whisper的虚拟环境，安装了Python 3.9.9 以及 PyTorch 1.10.1，然后直接使用pip install -U openai-whisper直接安装whisper。问题在于numpy的版本太高，导致报错，将numpy的版本由2.0.2下

Whisper GitHub OpenAI

Sesveria 2024-10-11

语音转文字的whisper应用部署

# 前言要解决问题: 需要一款开源的语音转文字应用, 用于视频自动转换字幕. 想到的思路: `openai`的`whisper`以及根据这个模型开发的`whisper.cpp`C++应用. 其它的补充: 最好在`linux`下部署, `Windows`下困难太多. --- # 一、部署`whisper` 官方文档要求至少十`python3.8-3.10`, 同时需要`ffmpeg`, 要有`nv`的显卡, 支持`cuda` 直接安装部署: `pip install -U openai-whisper`

不停感叹的老林 2024-01-08

AMD GPU加速openAI whisper音视频转字幕和文字

今天总算搞定了，用amd显卡加速openAI-whisper音视频转字幕和文字。要比用cpu快了很多很多。下面是我的电脑配制第一步：为amd显卡安装完整的rocm到amd官网下载自己对应该的显卡驱动安装脚本https://www.amd.com/zh-hans/support我的显卡是6600xt这是会跳到脚本下载页面默认保存在下载目录来到下载目录下面空白处鼠标右键选择在终端打开分别在终端输入下面的命令sudo vim /etc/os-release按i 用键盘上的上下左右移动键，移到Deepin这里，把

蜂哥笔记 2023-08-14

AI发布文字转换视频人工智能模式 Sora：可以制作一秒的真实视频

此外，用户还能以静态图片为基础生成新的视频，或对现有视频进行补充和扩展，增添视觉上的刺激和趣味。在其博客上展示了Sora的作品，包括描绘加州淘金热时期的空中镜头和仿佛置身东京列车车厢的视频。Sora创作的视频…

人工智能 Sora

雨哥饭碗 2024-03-02

近期资讯

滴滴开展异味车治理，记者体验：不少司机用上了车载香薰

12月23日，滴滴出行平台发布公告，对很多用户打到“臭车”致歉，并响应用户需求，在全国上线“拉黑异味车”功能。司机李师傅说，他在副驾驶放了车载香薰，不过他说香薰只是“治标不治本”，想要车上没有异味，更重要的还在于车辆的日常保养和司机的卫生意识。

北京日报 2024-12-29

以用户体验图为切入点，解决智能猫砂盆的痛点

现有自动式猫砂盆虽然解决一部分自动清洁问题，但存在着清洁效果不彻底以及感应能力弱等问题，在功能和结构上还有改进的空间。结合智能猫砂盆的使用流程进行用户需求调研，利用用户体验图来可视化的分析用户在使用智能猫砂盆过程中的需求或目标、阶段、功能模块、情绪曲线、痛点问题。

人人都是产品经理 2024-12-29

新技术可不受位置限制实现无线充电

这一创新技术使设备在三维空间内不受位置限制实现无线充电，为手机和其他电子设备的充电技术发展铺平了道路。它允许在三维空间内的任何位置为设备充电，无论是通过墙壁、地板还是空气。实验显示，新技术能够在2米距离内以46%的功率传输效率传送高达50瓦的电力，不论设备如何移动，充电效率几乎不变。

央广网 2024-12-29

“科技+文化”双轮驱动，构建人工智能新时代

“比如，我们通过元宇宙，AR、VR的形式提升内容品质，打造元宇宙空间，通过元宇宙做VR党建，将党建文化通过新的方式来观看、传承。”新国脉数字文化有限公司党委委员、总经理助理、总编辑陆玮仑介绍，技术的发展还需要迭代更新商业模式，为消费者创造更多全新的体验，比如，以前是人去学习机器的语言，现在是机器来学习人的表达方式。

东方网 2024-12-29

华为于W49-W51连续三周夺得中国智能手机市场销量市占率第一名

华尔街见闻从供应链获悉，华为于W49-W51（12.8-12.22）连续三周，分别以25%（124.4万台）、20.9%（101.1万台）和20.2%（92.4万台）的销量市占率，夺得中国智能手机市场第一名。12月4日，华为Mate70系列上市开售。

华尔街见闻 2024-12-29

上新！2025蛇年免费微信红包封面（第二波）！

新年马上就要到咯又到了各位大家秀红包的时候了想要自己的发的红包更好看吗？✅发放数量：共4款封面，每款限量12500份。可以搜索LEGO乐高小程序参加活动，也可以扫描下方二维码，跳转【深圳本地宝】公众号，回复【发财】关键词，即可直达红包封面领取入口、查看更多封面。雪中飞x成毅红包封面✅时间：12月28日-12月30日，每天10:17。

深圳本地宝 2024-12-29

普光气田首座高含硫增压站压缩机组完成首保

员王媛12月28日，记者从中原油田普光分公司获悉，普光气田主体湿气增压工程1号增压站3号压缩机组，完成2000小时保养并启机运行。这标志着普光气田首座高含硫增压站压缩机组首保任务完成，该站3台压缩机组已累计平稳运行2000小时。运行期间，该站单台机组最大处理能力为52.5万立方米/天。

环球网科技 2024-12-29

电视哪个品牌好，五款高品质85英寸电视，年度最佳选择

#年货节好物集市#在当今的家电市场中，电视品牌和手机品牌一样，都呈现出高度的竞争性和多样性。市场上并没有绝对的好或坏的品牌，而是每个主流品牌都有其独特的优势和出色的产品线。这款电视不仅支持一级能效标准，还拥有出色的智能互联功能，可以轻松成为智能家居的核心控制设备。

小米地瓜 2024-12-29

苹果从欧盟商店下架iPhone SE和iPhone 14

鞭牛士报道，12月29日消息，据外电报道，那些想要从欧盟公司购买iPhoneSE或iPhone14的苹果粉丝们没有运气了。12月28日星期六，欧盟新规正式生效，该规定将USB-C接口作为智能手机、平板电脑和其他电子设备的充电标准接口。

鞭牛士 2024-12-29

九天揽月星河阔（奋进强国路阔步新征程·重大工程巡礼）

今年6月25日，历经53天的太空旅行，嫦娥六号返回器回到地球，完成世界首次月球背面采样返回之旅。我国建设航天强国、科技强国取得又一标志性成果。

海外网 2024-12-29

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1