AIGC资讯 - Whisper - AIGC观察

AIGC资讯 - Whisper

音频处理工具，faster-whisper-GUI软件体验

现在关于AI的工具是越来越多，随着AI的出现，大家肯定也听到了很多关于某某模型的信息，各厂家之间也是在对比模型之间的性能，把它换种说法，有点类似在软件和系统上，讨论使用哪种内核的味道了。训练模型一般要用到大量的算力，还要放在专门的服务器上，而训练好的成果，就像是炼制好的丹药，在精简和用户的设备上也能跑，今天我们要说的，是在音频识别上面一款融合了众多优点的模型启动器——faster-whisper-GUI。听到Whisper，这个大家可能有点熟悉，这是OpenAI做的一个神经网络模型，可以在本地实时语音转文

果核剥壳 2024-02-22

OpenAI研究员的一天：向优化之神祈祷、展开头脑风暴后放弃改进模型算法，最后默念压缩一切！

从文本生成模型GPT-3、GPT-4，到文生图模型DALL·E、音频转文本模型Whisper，再到最新发布的文生视频模型Sora，OpenAI在大模型这条路上一骑绝尘，引得无数人惊羡不已。

OpenAI GPT-4 DALL·E Whisper

CSDN 2024-02-21

如何选择OpenAI的模型

动机OpenAI的模型比较多，更新也比较频繁，用户不知道如何选择。本文系统地整理了模型，可以快速地选择模型。截止时间本文章的数据，截止到2024年2月1日。模型分类模型名称说明GPT-4GPT-3.5DALL·E文生图TTS生成语音Whisper识别语音EmbeddingsModeration审核内容模型的选择分类需求选择的模型名称GPT-4gpt-4-turbo-preview需要有视觉能力gpt-4-vision-previewGPT-3.54Kgpt-3.5-turbo-110616Kgpt-3.5

OpenAI Whisper GPT-4

HB888 2024-02-01

ChatGPT的TTS语音对话功能有什么好的用法？openai语音对话功能

ChatGPT大家很熟悉，引起人工智能热潮的生成式人工智能。刚开始版本主要以文字作为交互方式，到4.0版本时候已经初具多模态能力，到4.0 Turbo版本多模态功能已经较为成熟并开放大众使用。也就是识图图文对话、文档分析和语音对话。语音对话功能最基本，应该是语音输入以及语音输出，所以会涉及OPENAI另外两个模型：TTS和whisper。 whisper，英语翻译“耳语”，是作为语音输入模型； TTS，TEXT TO SPEECH,是作为语音输出模型。 [图片] 过往的语音对话功能虽然不常见，但技术

ChatGPT Whisper OpenAI 人工智能

沃卡chatgpt 2024-01-31

全国产算力平台“飞星一号”的首个成果发布：讯飞星火V3.5来了

1月30日，科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5，七大核心能力全面提升，数学、语言理解、语音交互能力超GPT-4 Turbo，重磅升级星火智慧黑板；正式发布星火语音大模型，首批37个主流语种效果超过OpenAI Whisper V3，赋能讯飞翻译机迎来全新升级助力更自由沟通，推动万物互联时代下客服、汽车、机器人等场景人机交互变革。大模型应用加速落地，星火开发者超35万生态增长迅猛，打造个人应用赋能亿万用户；讯飞星

科大讯飞 OpenAI GPT-4 Whisper 客服

锌刻度 2024-01-30

讯飞星火正式发布语音大模型V3.5，数学、语义理解、代码能力持续提升

正式发布星火语音大模型，首批37个主流语种效果超过OpenAI Whisper V3，赋能讯飞翻译机迎来全新升级助力更自由沟通，推动万物互联时代下客服、汽车、机器人等场景人机交互变革。

编程客服汽车 OpenAI Whisper

Lucien 2024-01-30

科大讯飞发布星火语音大模型首批37个主流语种超越OpenAI Whisper V3

飞首次发布星火语音大模型，在首批37个主流语种上已整体超越OpenAI公司推出的WhisperV3。星火语音大模型超拟人合声MOS分达到4.5，拟人度超83%，保持在智能语音技术的国际领先水平。

科大讯飞 OpenAI Whisper

证券时报 2024-01-30

【教程】利用whisper模型自动生成英文粗字幕

引言最近正在进行一项大工程：给Kimberly Akimbo这部音乐剧做全场字幕。由于精力有限，故研究了一下利用AI工具减少工作量的方法。于是找到了OpenAI（开发ChatGPT的那家公司）开源的语音识别模型whisper。该模型可以直接由音频文件识别生成包括srt字幕格式在内的多种文字稿。本教程主要提供基于官方的命令行工具的操作方法，如果嫌麻烦也可以用一些打包好的图形界面软件（B站有人投稿过相关的教程）。下面是配置要求及步骤（项目仓库链接见文末）: 运行环境硬件 NVIDIA GeForce 3

Whisper ChatGPT OpenAI

T_MA 2024-01-10

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

君不言语音识别技术则已，言则必称Whisper，没错，OpenAi开源的Whisper确实是世界主流语音识别技术的魁首，但在中文领域，有一个足以和Whisper相颉顽的项目，那就是阿里达摩院自研的

刘悦的技术博客 2024-01-10

语音转文字的whisper应用部署

# 前言要解决问题: 需要一款开源的语音转文字应用, 用于视频自动转换字幕. 想到的思路: `openai`的`whisper`以及根据这个模型开发的`whisper.cpp`C++应用. 其它的补充: 最好在`linux`下部署, `Windows`下困难太多. --- # 一、部署`whisper` 官方文档要求至少十`python3.8-3.10`, 同时需要`ffmpeg`, 要有`nv`的显卡, 支持`cuda` 直接安装部署: `pip install -U openai-whisper`

不停感叹的老林 2024-01-08

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1