当前位置：首页|资讯|OpenAI|Whisper|GitHub

语音识别工具，Constme-Whisper软件体验

作者：果核剥壳发布时间：2023-03-14

OpenAI Whisper GitHub

在隔壁小众软件看到了一款有意思的工具-“Const-me/Whisper”。

原版Whisper是OpenAI做的一个神经网络模型，它可以在本地实时语音转文字，用来翻译和做字幕等等，而Const-me的版本将Whisper做成了Windows的版本，还添加了GPU加速。

在官方的GitHub页面上，可以看到这个工具还有不少特点，比如说项目采用纯C++实现，除了系统基本组件没有运行依赖、内存占用低、支持大多数音频和视频格式、支持大多数音频捕获设备、比OpenAI的实现还快。

主要的使用限制是系统版本，Windows 8.1以下和32位的系统是用不了的。

软件的使用很简单，一个用于启动的界面环境，解压出来1MB不到，一个用于识别的语言模型，模型有多个版本，想要正常使用得用1G以上的模型，下载文件之后，直接运行启动器即可。

打开之后就能看见这朴实无华的界面，软件没有几个按钮，虽然是英文的，但是模型路径和高级设置一看就明白。

在高级设置里面可以设置要调用的GPU，这个保持默认就行。

之后就能看到软件的主界面了，点开选择语言，可以看到支持的语言还是挺多的，这里就先来试试中文。

在测试的时候发现用1.42GB的模型，默认出来的是繁体，用2.88GB模型出来的是简体，这个也可能是系统环境的原因，大家可以自己测试一下。

测试用的显卡是GTX1660，转换速度在可接受范围之内，上面这种简短的句子，用大的识别模型，在某些简单的语境条件下，以及加上最重要的因素——运气好的话，竟然有100%的准确度。

除了音频文件，直接放视频也是可以的，但是只要涉及的内容一广，这个在本地运行的缺点就暴露出来了，生成的文本一言难尽，在有数字的时候会自己转换成阿拉伯数字，有英文混杂的时候也会自己尝试首字母大写，但是在转换效果上，一眼望过去有不少同音字错误，对于中文的前后文联想能力比较差。

支持实时录制音频。

这个比Windows自带的语言输入效果要好一点，同样的音频速度，这个工具不会出现丢字的情况。

官方给出的Whisper识别能力图如下，主要还是用来识别英文。

其他功能上，可以添加时间标记和直接翻译成英文。

想要控制具体的参数，也可以使用控制台的版本，还会展示对应数值的置信度。

输出中文的话会出现一堆问号，这个不是控制台的编码显示问题，但是在输入转换指令后，在对应路径下面的文本生成是没有问题的。

有了这个，就可以配合像是Quicker一类的快捷工具，做到本地一键转换成文本了。

比较遗憾的是，这个小工具目前只支持将转换的音频转换为英文，要是未来可以转换成任意语言的话，那可玩性就很高了。

最后，附上软件的体验地址。

在果核剥壳公众号

回复20230314获取最新链接

推荐体验

相关资讯

Whisper 语音识别模型

Whisper 是一种通用的语音识别模型。它是在包含各种音频的大型数据集上训练的，也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。开源项目地址：https://github.com/openai/whisperWhisper 语音识别模型Transformer 序列到序列模型针对各种语音处理任务进行训练，包括多语言语音识别、语音翻译、口语识别和语音活动检测。这些任务共同表示为由解码器预测的一系列标记，允许单个模型取代传统语音处理管道的多个阶段。多任务训练格式使用一组特殊标记作为任务说明符或

Whisper GitHub OpenAI

CiiLIi西里网 2023-06-09

语音转文字软件Whisper，实时自动语音识别，音频视频文案提取

很多做录音采访之类的工作，需要实时录音后期还要将谈话内容整理成文字，如果人工去做的话及其耗时，还可以根据音频文件生成srt字幕，非常适合做自媒体视频的人用，还比如看到一些视频非常好很想将里面的文案提取出来，有很多软件就可以实现将语音转成文字，这里就跟大家分享一个免费又好用的软件：Whisper，这是一个免费开源程序，该软件是whisper.cpp实现的Windows 移植，是OpenAI 的 Whisper自动语音识别 (ASR) 模型的 C++ 端口。github项目地址：https://github.

Whisper GitHub OpenAI

AI画师大阳 2023-09-09

音频处理工具，faster-whisper-GUI软件体验

现在关于AI的工具是越来越多，随着AI的出现，大家肯定也听到了很多关于某某模型的信息，各厂家之间也是在对比模型之间的性能，把它换种说法，有点类似在软件和系统上，讨论使用哪种内核的味道了。训练模型一般要用到大量的算力，还要放在专门的服务器上，而训练好的成果，就像是炼制好的丹药，在精简和用户的设备上也能跑，今天我们要说的，是在音频识别上面一款融合了众多优点的模型启动器——faster-whisper-GUI。听到Whisper，这个大家可能有点熟悉，这是OpenAI做的一个神经网络模型，可以在本地实时语音转文

果核剥壳 2024-02-22

使用OpenAI的Whisper 模型进行语音识别

点击上方“Deephub Imba”,关注公众号,好文章不错过 !语音识别是人工智能中的一个领域，它允许计算机理解人类语音并将其转换为文本。该技术用于 Alexa 和各种聊天机器人应用程序等设备。而我们最常见的就是语音转录，语音转录可以语音转换为文字记录或字幕。wav2vec2、Conformer 和 Hubert 等最先进模型的最新发展极大地推...

OpenAI 人工智能 Whisper

deephub 2023-01-28

命令行批量处理OpenAI Whisper语音识别

通过批处理脚本.bat实现音视频文件的批量语音识别_(:3」∠)_功能如下输入命令行（也可使用预设：令第一个字符为1或2）使用通配符来选取文件统计文件数量及类型文件自动分组（避免命令行超出8191个字符的限制）运行时间统计（24小时以内，如超出则自行计算天数即可）OpenAI Whisper运行结果Whisper-CTranslate2运行结果上面第二张图片是Whisper-CTranslate2的运行结果，它基于Faster-Whisper项目，与旧OpenAI Whisper命令行兼容。在保证精度的同

山风入谷 2023-08-17

近期资讯

Shell 脚本编程基础：变量

Shell 脚本编程基础：变量，定义一个变量时不需要指定类型，直接赋值即可。变量名由字母、数字或下划线组成，但不能以数字开头。

code_abc 2024-12-25

python打包多个选择：使用soeasypack打包

SoEasyPack 不需要复制嵌入式包，也不必再二次瘦身,一次打包理论上就是最小依赖文件数，用简易的方式复制你的python项目并自动精准匹配环境依赖，并且可以生成一个exe启动项目

用户6243997643404 2024-12-25

GitLab中文版正式发布最新的 17.7 版本

沿袭我们的月度发布传统，极狐GitLab 发布了 17.7 版本，该版本带来了通过特定 MR Label 实现 Mono 场景下多仓 MR 的关联（JH-only）、新的计划者用户角色、在 UI 上

极狐GitLab官方 2024-12-25

zhi乎接口x-zse-96签名的代码环境补全流程

zhi乎接口x-zse-96签名的代码提取和环境补全流程。本文描述了详细的分析流程和补全流程。算是比较常见的补全思路。

徐徐子 2024-12-25

程序员摸鱼小工具，划水的时候也能被统计到在工作

Fake Coding 能够让你在双手完全离开键盘的情况下，依然看起来像是在拼命编码。开启后，它会根据当前的文本内容，从头开始逐字地“模拟输入”，给人一种你还在疯狂敲代码的错觉。

我不叫王小红 2024-12-25

怎么使图片宽度自适应呢？

在现代网页设计中，使图片宽度自适应是一个常见的需求。无论是为了响应式设计，还是为了确保图片在不同设备...

打野赵怀真 2024-12-25

Visual Studio - API调试与测试工具之HTTP文件

VisualStudio2022支持类似RESTClient功能，可通过.http文件便捷调试Api接口，包括创建方式、语法、注释变量、环境文件及身份验证等，功能待完善，测试代码已上传至代码库。

IT规划师 2024-12-25

用js实现最大化和最小化窗口

在现代 Web 开发中，JavaScript 提供了多种方法来与浏览器窗口进行交互，包括最大化和最小...

打野赵怀真 2024-12-25

从零到一：如何快速生成和优化Prompt

本文介绍了如何高效编写和优化Prompt，帮助读者快速从0到1生成有效的Prompt。文章提供了“万能模板”，通过角色设定、问题描述、目标明确和要求补充四个步骤，简化了Prompt的编写流程。

Kan先生 2024-12-25

【教程】第十二章会议室预约管理

NocoBase 系列教程通过循序渐进的功能升级，你将打造一个强大的管理系统，让团队协作更高效、流程更智能。

NocoBase 2024-12-25

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1