当前位置：首页|资讯|Whisper|GitHub|OpenAI

语音转文字软件Whisper，实时自动语音识别，音频视频文案提取

作者：AI画师大阳发布时间：2023-09-09

Whisper GitHub OpenAI

很多做录音采访之类的工作，需要实时录音后期还要将谈话内容整理成文字，如果人工去做的话及其耗时，还可以根据音频文件生成srt字幕，非常适合做自媒体视频的人用，还比如看到一些视频非常好很想将里面的文案提取出来，有很多软件就可以实现将语音转成文字，这里就跟大家分享一个免费又好用的软件：Whisper，这是一个免费开源程序，该软件是whisper.cpp实现的Windows 移植，是OpenAI 的 Whisper自动语音识别 (ASR) 模型的 C++ 端口。github项目地址：https://github.com/Const-me/Whisper

关于模型选择，显卡显存在5G以上的就用ggml-large.bin模型，4G显存就用ggml-medium.bin模型，2G显存就用ggml-small.bin模型，模型越大识别精度越高，语音转文字效果越好。

软件和模型下载到本地电脑上之后，双击运行【WhisperDesktop.exe】，先选择所需要的模型，可以根据自己电脑配置自行选择。然后点击【OK】。

转录本地音频文件

进入下一个操作界面后，你想语音转文字的音频文件是说的什么语言，language后面就选什么语言，如果是英文音频，你选择的语言是中文，那么就会将英文音频识别并翻译成中文后输出文字内容，但是这里要注意的是翻译输出后的中文是繁体的。选择好音频文件和输出路径及输出文件名后，点击按钮【Transcribe】就可以开始转换了

4分37秒的音频用了1分7秒时间就处理完了，速度还算可以的。而且文字识别效果还挺好的。以前的时候做视频字幕，用的是剪映里面的智能字幕，自动识别人声自动生成字幕，整体上都能识别出来，但是总是还有很多地方有错别字，要完整看一遍挨着修改。这个软件也可以生成带时间轴的字幕，而且识别精度更高，需要修改的地方更少，就不需要特意用剪映来生成字幕了，这个软件操作起来更方便快捷。

实时转录

这个软件还有实时转录功能，可以实时将别人讲话的声音立即转换成文字，点击底部中央的按钮【Audio Captuer】，启动实时转录界面。勾选【Save to text file】,然后选择输出路径及文件名，也可以生成带时间轴的文字内容。然后点击按钮【Captuer】就可以开始实时对讲话的内容转成文字了。

实时转录效果相对转录音频文件略差一些，说话发音越标准，转录效果越好。

软件下载地址：链接：https://pan.baidu.com/s/1PyqXOUCPTYfbgEYY2GOw_A?pwd=b8nm
提取码：b8nm

注意：软件只支持Windows 64位系统

原文：https://dyss.top/1190

推荐体验

相关资讯

Buzz:基于 OpenAI Whisper,AI离线语音转文字（字幕）实时语音识别,免费下载

功能实时语音转文字、实时翻译（需麦克风权限）导入音频、视频文件（mp3、wav、m4a、ogg、mp4、webm、ogm），导出逐句字幕或逐词字幕（导出格式：TXT、SRT、VTT）转录和翻译音频离线在您的个人计算机。由OpenAI的Whisper提供动力。可以简单理解为QT的前端界面，python语言构建服务端，使用Whisper语言模型进行计算语音转文字的软件。痛点在于离线，缺点也很明显，模型较大，高质量模型运算依赖于硬件和算法优化应用场景学习，歌曲提取歌词，视频提取字幕，多媒体信息前置数据提取相较于

mayoの自留地 2023-10-20

OpenAI Whisper实时语音识别:实现近乎实时的语音转文本

OpenAI Whisper实时语音识别:实现近乎实时的语音转文本近年来,随着人工智能技术的飞速发展,语音识别领域也取得了突破性进展。OpenAI推出的Whisper模型就是其中的佼佼者,凭借其强大

OpenAI Whisper 人工智能

用户391315911403 2024-09-02

语音转文字的whisper应用部署

# 前言要解决问题: 需要一款开源的语音转文字应用, 用于视频自动转换字幕. 想到的思路: `openai`的`whisper`以及根据这个模型开发的`whisper.cpp`C++应用. 其它的补充: 最好在`linux`下部署, `Windows`下困难太多. --- # 一、部署`whisper` 官方文档要求至少十`python3.8-3.10`, 同时需要`ffmpeg`, 要有`nv`的显卡, 支持`cuda` 直接安装部署: `pip install -U openai-whisper`

不停感叹的老林 2024-01-08

极速进化,光速转录,C++版本人工智能实时语音转文字(字幕/语音识别)Whisper.cpp实践

业界良心OpenAI开源的Whisper模型是开源语音转文字领域的执牛耳者，白璧微瑕之处在于无法通过苹果M芯片优化转录效率，Whisper.cpp 则是 Whisper 模型的 C/C++ 移植版本

人工智能 Whisper OpenAI 苹果

刘悦的技术博客 2023-05-04

【AI应用】视频/语音自动转文字，并生成概览

AI是知识时代的挖掘机，大幅提升教学与科研生产力。会议”开会，因为它有实时转写会议记录、并生成会议纪要的功能。会议那样，将声音转变为文字、并生成会议纪要呢？“通义千问”中的“通义效率/通义听悟”完全可以实现这一点！大家感兴趣的话都可以试试。它既可以在开会时进行“实时记录”（转文字），再加上还有浏览器插件，

jowa 2024-06-28

近期资讯

第四代CS75PLUS Ultra上市搭配最强2.0T发动机

日前，长安汽车在新疆发布了第四代CS75PLUS Ultra新车，共推出两个版本，官方指导价13.19-13.99万元，并同时发布多项重磅购车权益。，包括置换权益：至高置换补贴15000元（本品15000元，非本品14000元）；保养权益：1599元享价值8888元终身免费基础保养；金融权益：享至高7000元金融贴息支持（3年5万0利息，2年6万0利息）；流量权益：基础流量终身免费，娱乐流量3年免费(4G/月)。这是两款款搭载新蓝鲸2.0T高压直喷发动机的版本，加上今年9月发布的两款1.5T版本，目前第四

辣车TV 2024-12-25

中国人民大学管理学硕士徐嘉祥：浅谈企业如何进行差异化营销

网友：您好，非常感谢您抽出时间接受我们的采访。首先，请您简单介绍一下自己在市场营销领域的经历吧。徐嘉祥：你好，我从事市场营销工作已经超过十几年了。最初从基层的市场专员做起，参与过多个品牌的推广活动策划与执行，后来逐步晋升到市场经理、营销总监等职位，涉及的行业包括耐消品、科技、金融等，在不同的市场环境和产品类型中积累了较为丰富的经验。网友：在您看来，当下市场营销环境和过去相比，最大的变化是什么？徐嘉祥：变化非常显著。首先是数字化的全面渗透，互联网和移动技术让信息传播变得前所未有的迅速和广泛，消费者获取

徐嘉祥 2024-12-25

统一精准把握市场，开启绿色发展新征程

在当今时代，绿色发展已成为企业不可忽视的重要课题。统一作为一家具有前瞻性的企业，在过去的五年里，以敏锐的洞察力和精准的市场把握，积极践行低碳战略，全面统筹业务发展，开启了绿色发展的新征程。企业低碳战略的实施，不仅有助于减少对环境的影响，还能为企业带来降本增效的实际效益，具有重要的现实意义和长远价值。统一始终保持对行业趋势的敏锐洞察，及时捕捉市场机遇。通过深入研究行业动态和市场需求，明确了低碳发展的方向和目标。为了更好地推动低碳战略的实施，统一筹建了绿色低碳供应联盟。联盟成员包括供应商、合作伙伴等，通过

江江的科技生活 2024-12-25

MTK6765核心板_MT6765安卓核心板参数_联发科MTK模块开发

MTK6765安卓核心板是一款创新的高性能硬件，基于联发科的前沿八核处理平台精心设计而成。该核心板搭载的MTK6765 CPU采用先进的12纳米制造工艺，拥有八个核心，其中四个CORTEX-A53核心的主频可达2.3GHz，另四个CORTEX-A53核心则主频为1.8GHz。这种强大的架构使得其在处理能力上表现尤为突出，适合多种应用需求。 [图片] 在内存和存储方面，MTK6765核心板提供了灵活的配置选项，用户可以选择2GB+16GB、4GB+64GB和6GB+128GB的组合，支持NandFlash和

深圳市智物通讯科技 2024-12-25

中国太保产险与用友举行战略合作协议签署仪式

2024年12月20日，中国太保产险与用友在北京举行战略合作协议签署仪式。双方将充分发挥资源及产业优势，在产业数字金融、数智化转型、信创业务、保险业务、战略互信及探索合作领域深度融合，为双方转型升级发展注入新动能。中国太保产险党委书记、总经理陈辉、总经理助理、北京分公司总经理武博，用友网络总裁陈强兵、友太安总裁张谦共同出席仪式并见证协议签署，中国太保产险总经理助理叶明满与用友金融董事兼总裁郑海伟代表双方签署了战略合作协议。此次战略合作标志着双方在数字化时代迈出重要一步，双方将充分发挥各自专长，形

用友 2024-12-25

精密空调—怎么知道精密空调制冷剂是否充足？

为确保精密空调系统的正常运行及高效制冷效果，定期检测精密空调制冷剂是否充足至关重要。下面简单聊一下如何检测精密空调制冷剂是否充足。检测精密空调制冷剂的准备工作： 1、安全防护：佩戴好个人防护装备，如安全眼镜、手套等，确保操作过程中的安全。 2、工具准备：准备好制冷剂压力表、温度计、制冷剂充注工具等必要设备。 3、系统检查：在检测精密空调制冷剂前，先对精密空调进行全面的外观检查，确保无泄漏点及异常现象。精密空调制冷剂压力检测： 1、连接压力表：将制冷剂压力表连接到精密空调的制冷剂充注口上，确保连接紧密无

汇智天源 2024-12-25

统一「瓶中树」产品的创新与环保特性

土壤，作为农业生产的基础，其重要性不言而喻。它孕育了无数的作物，从根茎到果实，无一不依赖于肥沃的土壤。正是土壤的默默奉献，才保障了我们的粮食安全和农业生产的稳定。可以说，没有健康的土壤，就没有丰收的希望。土壤不仅是我们获取食物的源泉，更是一个重要的“碳汇”或“碳源”。在自然界中，植物通过光合作用吸收二氧化碳并释放氧气，从而维持大气中二氧化碳和氧气的平衡。而土壤中的微生物也参与这一过程，它们分解有机物，释放或吸收二氧化碳。因此，健康的土壤有助于减少温室气体的排放，维护全球的生态平衡。此外，土壤还含有多种矿

来聊科技 2024-12-25

2025医械最大IPO终于要来了？

2024年12月19日，麦朗宣布已向美国证券交易委员会（“SEC”）秘密提交了一份有关S-1表格的注册声明草案，据路透社的报道，此次IPO股票发行的金额将高达50亿美元（折合人民币365亿元），这将使其成为2025年医疗器械潜在的最大IPO之一。作为全球第四大医疗设备公司，麦朗在2024年的医疗设计与外包100强榜单中名列前茅。该公司拥有约38,000名员工，年度销售额超过210亿美元，迄今为止一直保持私有状态。它专注于提供广泛的医疗外科产品和全面的医疗保健供应链解决方案。麦朗的上市计划得益于超

科技创新圈 2024-12-25

佰师网：公务员备考经验分享，成功考生的备考心得

在公务员考试的激烈竞争中，每一位考生都渴望脱颖而出，实现自己的职业梦想。作为一名成功上岸的公务员考生，我愿意分享我的备考经验，希望能为正在备考路上的你提供一些启示和帮助。一、明确目标，制定计划首先，明确自己的目标至关重要。公务员职位众多，不同岗位的考试内容和难度各有差异。因此，在备考初期，我就根据自己的兴趣和职业规划，锁定了目标岗位，并详细了解了该岗位的考试要求、历年真题及分数线等信息。随后，我制定了详细的学习计划，包括每日的学习任务、每周的复习进度以及每月的模拟测试安排，确保每一步都朝着目标稳步前进

佰师网 2024-12-25

畜禽粪污资源化利用方式有哪些?覆膜堆肥技术真的实用吗?

畜禽养殖过程中产生的粪便往往伴随着强烈的异味，并且其直接利用效率相对较低。许多养殖场在未进行适当处理的情况下，将这些粪便直接排放到周边的水渠和土地上，这不仅使得周边环境弥漫着恶臭，还造成了严重的环境污染。对于大型养殖场而言，由于粪便处理不当的问题更为突出，往往导致更为严重的环境污染和资源的极大浪费。我国作为畜牧大国，随着畜禽养殖规模的扩展，有机粪肥利用成为一大难题。①有机肥市场发展潜力巨大，但没有严格明确的条款约束，导致市场混乱且不规范。②畜禽粪污有机肥行业的技术发展相对滞后，核心技术缺乏，使得化肥利用率

中海环境 2024-12-25

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1