环境:Windows模型选用:whisper-large-v3-turbo https://hf-mirror.com/openai/whisper-large-v3-turbo需要安装的包:transformers,ffmpeg在安装ffmpeg时可以在官网下载选择 “Windows builds from gyan.dev”-》“ffmpeg-git-essentials.7z.ver .sha256” 下载好后,添加本地环境变量代码:import torchfrom transformers imp
WhisperOpenAI编程
文涌政泉 2024-10-07
参考github官网:https://github.com/openai/whisper 安装whisper首先需要安装的的软件有 Python(3.8以上版本),PyTorch,ffmpeg,rust。 管理员身份运行 cmd 或者 powershell 或者 anaconda prompt 1. 我之前在电脑上安装了 anaconda,配置好镜像源和环境变量,anaconda他已经给你安装好 python,python --version可以检查更新一下 2. 使用 conda 安装 pytorch:
WhisperGitHubOpenAI
和山无月 2024-10-05
IT之家10月3日消息,OpenAI在10月1日举办的DevDay活动日中,宣布推出了Whisperlarge-v3-turbo语音转录模型,共有8.09亿参数,在质量几乎没有下降的情况下,速度比large-v3快8倍。
OpenAIWhisper
IT之家 2024-10-03
我发现了一种出色的写文章方法,那便是借助 AI。但这里所说的借助 AI 写作,并非单纯依靠 AI 生成整篇文章。 我首先会以聊天的状态,用口语化的方式将自己想要表达的内容表述出来。因为在我的 Mac 电脑上,有一款相当好用的软件,叫做 Whisper Note ,它内置了 OpenAI 出品的 Whisper 语音转文字模型。我可以与它对话,或者把我的录音文件交给它,它就能把我用口语表述的录音或者其他音频文件转换为文字。 好,当我拿到这份文字稿后,我会将其交给一个大语言模型,比如豆包、kimi 或者 ch
WhisperOpenAI大语言模型
海鱼Harry 2024-09-19
OpenAI Whisper实时语音识别:实现近乎实时的语音转文本 近年来,随着人工智能技术的飞速发展,语音识别领域也取得了突破性进展。OpenAI推出的Whisper模型就是其中的佼佼者,凭借其强大
OpenAIWhisper人工智能
用户391315911403 2024-09-02
?【AIGC每日新闻】【硅基流动提供"sencevoice-small"语音识别模型推理服务】该模型支持中文、英语、粤语、日语和韩语的识别,特别在中文和粤语上识别效果有显著提升,性能优于Whisper模型。模型经过超过40万小时的数据训练,具备高效的推理能力,一段10秒的音频识别耗时仅在70-200毫秒之间,大幅优于Whisper-Large模型,展现出极低的推理延迟。参考博客链接:https://docs.siliconflow.cn/reference/createaudiotranscriptio
AIGCClaudeWhisper
二次元的Datawhale 2024-08-17
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1