AIGC资讯 - Whisper

初探之基于 openai/whisper 模型实现语音转文本

大家好，欢迎来到前端研习圈。前言本期的主题是通过 OpenAi 的语言识别模型 whisper 来实践一个语音转文本的功能。

木木剑光 2024-02-27

centos7下安装文生图AI工具Stable-Diffusion

前一篇文章在centos7环境下安装了音频/视频转文字工具whisper这次想安装个文生图工具SD，看了下安装过程，基本步骤是一致的，先N卡驱动，然后python，再pytorch，区别很小，我踩了一些坑，把关键地方留文记录下：1，python的版本刚好是3.10系列，所以不用改2，cuda，pytorch可以复用之前的，所以不用改3，先安装较新版的git，yum默认安装的git版本是1系列，这次安装2系列，这步很重要，不然后续肯定报错： 3.1 yum -y install https://packag

Stable Diffusion Whisper

Leo_oc 2024-02-26

音频处理工具，faster-whisper-GUI软件体验

现在关于AI的工具是越来越多，随着AI的出现，大家肯定也听到了很多关于某某模型的信息，各厂家之间也是在对比模型之间的性能，把它换种说法，有点类似在软件和系统上，讨论使用哪种内核的味道了。训练模型一般要用到大量的算力，还要放在专门的服务器上，而训练好的成果，就像是炼制好的丹药，在精简和用户的设备上也能跑，今天我们要说的，是在音频识别上面一款融合了众多优点的模型启动器——faster-whisper-GUI。听到Whisper，这个大家可能有点熟悉，这是OpenAI做的一个神经网络模型，可以在本地实时语音转文

Whisper OpenAI

果核剥壳 2024-02-22

OpenAI研究员的一天：向优化之神祈祷、展开头脑风暴后放弃改进模型算法，最后默念压缩一切！

从文本生成模型GPT-3、GPT-4，到文生图模型DALL·E、音频转文本模型Whisper，再到最新发布的文生视频模型Sora，OpenAI在大模型这条路上一骑绝尘，引得无数人惊羡不已。

OpenAI GPT-4 DALL·E Whisper

CSDN 2024-02-21

如何选择OpenAI的模型

动机OpenAI的模型比较多，更新也比较频繁，用户不知道如何选择。本文系统地整理了模型，可以快速地选择模型。截止时间本文章的数据，截止到2024年2月1日。模型分类模型名称说明GPT-4GPT-3.5DALL·E文生图TTS生成语音Whisper识别语音EmbeddingsModeration审核内容模型的选择分类需求选择的模型名称GPT-4gpt-4-turbo-preview需要有视觉能力gpt-4-vision-previewGPT-3.54Kgpt-3.5-turbo-110616Kgpt-3.5

OpenAI Whisper GPT-4

HB888 2024-02-01

ChatGPT的TTS语音对话功能有什么好的用法？openai语音对话功能

ChatGPT大家很熟悉，引起人工智能热潮的生成式人工智能。刚开始版本主要以文字作为交互方式，到4.0版本时候已经初具多模态能力，到4.0 Turbo版本多模态功能已经较为成熟并开放大众使用。也就是识图图文对话、文档分析和语音对话。语音对话功能最基本，应该是语音输入以及语音输出，所以会涉及OPENAI另外两个模型：TTS和whisper。 whisper，英语翻译“耳语”，是作为语音输入模型； TTS，TEXT TO SPEECH,是作为语音输出模型。 [图片] 过往的语音对话功能虽然不常见，但技术

ChatGPT Whisper OpenAI 人工智能

沃卡chatgpt 2024-01-31

全国产算力平台“飞星一号”的首个成果发布：讯飞星火V3.5来了

1月30日，科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5，七大核心能力全面提升，数学、语言理解、语音交互能力超GPT-4 Turbo，重磅升级星火智慧黑板；正式发布星火语音大模型，首批37个主流语种效果超过OpenAI Whisper V3，赋能讯飞翻译机迎来全新升级助力更自由沟通，推动万物互联时代下客服、汽车、机器人等场景人机交互变革。大模型应用加速落地，星火开发者超35万生态增长迅猛，打造个人应用赋能亿万用户；讯飞星

科大讯飞 OpenAI GPT-4 Whisper 客服

锌刻度 2024-01-30

讯飞星火正式发布语音大模型V3.5，数学、语义理解、代码能力持续提升

正式发布星火语音大模型，首批37个主流语种效果超过OpenAI Whisper V3，赋能讯飞翻译机迎来全新升级助力更自由沟通，推动万物互联时代下客服、汽车、机器人等场景人机交互变革。

编程客服汽车 OpenAI Whisper

Lucien 2024-01-30

科大讯飞发布星火语音大模型首批37个主流语种超越OpenAI Whisper V3

飞首次发布星火语音大模型，在首批37个主流语种上已整体超越OpenAI公司推出的WhisperV3。星火语音大模型超拟人合声MOS分达到4.5，拟人度超83%，保持在智能语音技术的国际领先水平。

科大讯飞 OpenAI Whisper

证券时报 2024-01-30

【教程】利用whisper模型自动生成英文粗字幕

引言最近正在进行一项大工程：给Kimberly Akimbo这部音乐剧做全场字幕。由于精力有限，故研究了一下利用AI工具减少工作量的方法。于是找到了OpenAI（开发ChatGPT的那家公司）开源的语音识别模型whisper。该模型可以直接由音频文件识别生成包括srt字幕格式在内的多种文字稿。本教程主要提供基于官方的命令行工具的操作方法，如果嫌麻烦也可以用一些打包好的图形界面软件（B站有人投稿过相关的教程）。下面是配置要求及步骤（项目仓库链接见文末）: 运行环境硬件 NVIDIA GeForce 3

Whisper ChatGPT OpenAI

T_MA 2024-01-10

AIGC资讯 - Whisper

初探之基于 openai/whisper 模型实现语音转文本

centos7下安装文生图AI工具Stable-Diffusion

音频处理工具，faster-whisper-GUI软件体验

OpenAI研究员的一天：向优化之神祈祷、展开头脑风暴后放弃改进模型算法，最后默念压缩一切！

如何选择OpenAI的模型

ChatGPT的TTS语音对话功能有什么好的用法？openai语音对话功能

全国产算力平台“飞星一号”的首个成果发布：讯飞星火V3.5来了

讯飞星火正式发布语音大模型V3.5，数学、语义理解、代码能力持续提升

科大讯飞发布星火语音大模型首批37个主流语种超越OpenAI Whisper V3

【教程】利用whisper模型自动生成英文粗字幕

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响