whisper 模块基于 whisper.cpp 实现智能语音识别,能帮助用户将音频转为文本,解析音频文件以生成文本文件。...【查看原文】
Whisper 是一种通用的语音识别模型。它是在包含各种音频的大型数据集上训练的,也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。开源项目地址:https://github.com/openai/whisperWhisper 语音识别模型Transformer 序列到序列模型针对各种语音处理任务进行训练,包括多语言语音识别、语音翻译、口语识别和语音活动检测。这些任务共同表示为由解码器预测的一系列标记,允许单个模型取代传统语音处理管道的多个阶段。多任务训练格式使用一组特殊标记作为任务说明符或
WhisperGitHubOpenAI
CiiLIi西里网 2023-06-09
前言 前段时间测试一下OpenAI的语音识别模型 当时发现效率很低,今天发现阿里有一个专注的语音识别大模型FunAsr 看介绍Funasr的中文识别能力应该比Whisper更强大: Funasr的模型
OpenAIWhisper
土圭垚墝 2024-05-29
点击上方“Deephub Imba”,关注公众号,好文章不错过 !语音识别是人工智能中的一个领域,它允许计算机理解人类语音并将其转换为文本。该技术用于 Alexa 和各种聊天机器人应用程序等设备。而我们最常见的就是语音转录,语音转录可以语音转换为文字记录或字幕。wav2vec2、Conformer 和 Hubert 等最先进模型的最新发展极大地推...
OpenAI人工智能Whisper
deephub 2023-01-28
在隔壁小众软件看到了一款有意思的工具-“Const-me/Whisper”。原版Whisper是OpenAI做的一个神经网络模型,它可以在本地实时语音转文字,用来翻译和做字幕等等,而Const-me的版本将Whisper做成了Windows的版本,还添加了GPU加速。在官方的GitHub页面上,可以看到这个工具还有不少特点,比如说项目采用纯C++实现,除了系统基本组件没有运行依赖、内存占用低、支持大多数音频和视频格式、支持大多数音频捕获设备、比OpenAI的实现还快。主要的使用限制是系统版本,Window
OpenAIWhisperGitHub
果核剥壳 2023-03-14
通过批处理脚本.bat实现音视频文件的批量语音识别_(:3」∠)_功能如下输入命令行(也可使用预设:令第一个字符为1或2)使用通配符来选取文件统计文件数量及类型文件自动分组(避免命令行超出8191个字符的限制)运行时间统计(24小时以内,如超出则自行计算天数即可)OpenAI Whisper运行结果Whisper-CTranslate2运行结果上面第二张图片是Whisper-CTranslate2的运行结果,它基于Faster-Whisper项目,与旧OpenAI Whisper命令行兼容。在保证精度的同
山风入谷 2023-08-17
市值3年蒸发7000多亿,雅诗兰黛变革在即。
聚美丽 2024-10-03
中网现场观赛球迷爆满。
时代财经 2024-10-03
11.9元三杯,绝味鸭脖的奶茶能卖得动吗?
Morketing 2024-10-03
动脉网出品
动脉网 2024-10-03
《王者荣耀》又一6元皮肤上线秒杀:抓紧拿下 不再以直售形式返场快科技2024-10-03 11:32发布于河南快科技10月3日消息,《王者荣耀》宣布,60点券“王者亚瑟秒杀皮肤”活动开启!根据活
快科技 2024-10-03
暴跌75%!“预制菜第一股”,崩了!
侃见财经 2024-10-03
国产黄金首饰在海外“卖爆”了。
霞光社 2024-10-03
《星空》DLC“破碎空间”反响不佳:M站 58 分、Steam 好评率 41%IT之家2024-10-03 08:41发布于山东IT之家官方账号IT之家 10 月 3 日消息,B 社《星空》首个
IT之家 2024-10-03
美国监狱历史上最富有的服刑人。
锌财经 2024-10-03
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1