现在关于AI的工具是越来越多,随着AI的出现,大家肯定也听到了很多关于某某模型的信息,各厂家之间也是在对比模型之间的性能,把它换种说法,有点类似在软件和系统上,讨论使用哪种内核的味道了。训练模型一般要用到大量的算力,还要放在专门的服务器上,而训练好的成果,就像是炼制好的丹药,在精简和用户的设备上也能跑,今天我们要说的,是在音频识别上面一款融合了众多优点的模型启动器——faster-whisper-GUI。听到Whisper,这个大家可能有点熟悉,这是OpenAI做的一个神经网络模型,可以在本地实时语音转文
WhisperOpenAI
果核剥壳 2024-02-22
从文本生成模型GPT-3、GPT-4,到文生图模型DALL·E、音频转文本模型Whisper,再到最新发布的文生视频模型Sora,OpenAI在大模型这条路上一骑绝尘,引得无数人惊羡不已。
OpenAIGPT-4DALL·EWhisper
CSDN 2024-02-21
动机OpenAI的模型比较多,更新也比较频繁,用户不知道如何选择。本文系统地整理了模型,可以快速地选择模型。截止时间本文章的数据,截止到2024年2月1日。模型分类模型名称说明GPT-4GPT-3.5DALL·E文生图TTS生成语音Whisper识别语音EmbeddingsModeration审核内容模型的选择分类需求选择的模型名称GPT-4gpt-4-turbo-preview需要有视觉能力gpt-4-vision-previewGPT-3.54Kgpt-3.5-turbo-110616Kgpt-3.5
OpenAIWhisperGPT-4
HB888 2024-02-01
ChatGPT大家很熟悉,引起人工智能热潮的生成式人工智能。 刚开始版本主要以文字作为交互方式,到4.0版本时候已经初具多模态能力,到4.0 Turbo版本多模态功能已经较为成熟并开放大众使用。 也就是识图图文对话、文档分析和语音对话。 语音对话功能最基本,应该是语音输入以及语音输出,所以会涉及OPENAI另外两个模型:TTS和whisper。 whisper,英语翻译“耳语”,是作为语音输入模型; TTS,TEXT TO SPEECH,是作为语音输出模型。 [图片] 过往的语音对话功能虽然不常见,但技术
ChatGPTWhisperOpenAI人工智能
沃卡chatgpt 2024-01-31
1月30日,科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5,七大核心能力全面提升,数学、语言理解、语音交互能力超GPT-4 Turbo,重磅升级星火智慧黑板;正式发布星火语音大模型,首批37个主流语种效果超过OpenAI Whisper V3,赋能讯飞翻译机迎来全新升级助力更自由沟通,推动万物互联时代下客服、汽车、机器人等场景人机交互变革。大模型应用加速落地,星火开发者超35万生态增长迅猛,打造个人应用赋能亿万用户;讯飞星
科大讯飞OpenAIGPT-4Whisper客服
锌刻度 2024-01-30
正式发布星火语音大模型,首批37个主流语种效果超过OpenAI Whisper V3,赋能讯飞翻译机迎来全新升级助力更自由沟通,推动万物互联时代下客服、汽车、机器人等场景人机交互变革。
编程客服汽车OpenAIWhisper
Lucien 2024-01-30
飞首次发布星火语音大模型,在首批37个主流语种上已整体超越OpenAI公司推出的WhisperV3。星火语音大模型超拟人合声MOS分达到4.5,拟人度超83%,保持在智能语音技术的国际领先水平。
科大讯飞OpenAIWhisper
证券时报 2024-01-30
引言 最近正在进行一项大工程:给Kimberly Akimbo这部音乐剧做全场字幕。由于精力有限,故研究了一下利用AI工具减少工作量的方法。于是找到了OpenAI(开发ChatGPT的那家公司)开源的语音识别模型whisper。该模型可以直接由音频文件识别生成包括srt字幕格式在内的多种文字稿。本教程主要提供基于官方的命令行工具的操作方法,如果嫌麻烦也可以用一些打包好的图形界面软件(B站有人投稿过相关的教程)。 下面是配置要求及步骤(项目仓库链接见文末): 运行环境 硬件 NVIDIA GeForce 3
WhisperChatGPTOpenAI
T_MA 2024-01-10
君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的
刘悦的技术博客 2024-01-10
# 前言 要解决问题: 需要一款开源的语音转文字应用, 用于视频自动转换字幕. 想到的思路: `openai`的`whisper`以及根据这个模型开发的`whisper.cpp`C++应用. 其它的补充: 最好在`linux`下部署, `Windows`下困难太多. --- # 一、部署`whisper` 官方文档要求至少十`python3.8-3.10`, 同时需要`ffmpeg`, 要有`nv`的显卡, 支持`cuda` 直接安装部署: `pip install -U openai-whisper`
不停感叹的老林 2024-01-08
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1