旧金山(美联社)— 科技巨头 OpenAI 吹捧其人工智能驱动的转录工具 Whisper 具有接近“人类水平的稳健性和准确性”。但 Whisper 有一个重大缺陷:根据对十几位软件工程师、开发人员和学术研究人员的采访,它容易组成大块文本甚至整个句子。这些专家表示,一些虚构的文本——业内称为幻觉——可能包括种族评论、暴力言论,甚至想象中的医疗。专家表示,这种捏造是有问题的,因为 Whisper 正被全球许多行业用于翻译和转录采访,在流行的消费技术中生成文本,并为视频创建字幕。他们说,更令人担忧的是,尽管 O
人工智能OpenAIWhisper
徵千落 2024-10-26
这篇文章是接着上一篇的续作为什么我更推荐使用chatgpt而不是在chatgpt 的帮助下 准确说是chatgpt 4oopenai/whisper 字幕识别工具修复成功了。来看看图。编辑然后说下故障/报错的原因 原因就是我对 Google colab 不熟悉 不了解,也没掌握代码的语法和写作要求。 我上传的文件路径错了(或者说代码错了) 修复方法 使用chatgpt 改写的新代码。 把文件的具体路径加上就好了。 如果您的文件存储在 /content/sample_data/ 目录下,则需要使用完整路径:
WhisperChatGPT编程谷歌
方方上土 2024-10-24
安装Whisper Whisper需要依赖:Nvidia CUDA(NVIDIA开发的并行计算平台和编程模型)Pytorch(开源深度学习框架)FFmpeg(开源的多媒体处理工具库和开发套件) 1. 确定CUDA版本并安装 CUDA的版本取决于两方面:Nvidia显卡驱动所选择的PyTorch版本 打开Nvidia控制面板(一般桌面右键菜单中即包含),查看驱动版本,或在控制台输入nvidia-smi.exe [图片] [图片] 获得版本后打开CUDA发行文档查看当前驱动版本所支持的CUDA版
OpenAIWhisper
巫不可 2024-10-21
如果你正在寻找一个能够将音频和视频文件转换成文本的利器,那么Fast Whisper GUI软件将是你的不二之选。这款软件基于PySide6框架开发,不仅支持将你的媒体文件转录为srt、txt、smi、vtt、lrc等格式的文本文件,还能将在线OpenAI-whisper模型转换为ct2格式。 [图片] 功能亮点 - 全面支持:Fast Whisper GUI支持whisperX、Democs模型以及whisper large-v3模型,满足不同用户的需求。 - 参数自定义:提供VAD模型和whisper
WhisperOpenAI
龙岩二花网络科技 2024-10-17
本文讲述本人使用python将文件中的语音转成文本时遇到的一些问题,希望可以帮助到一些人 1 根据github[https://github.com/openai/whisper]在安装whisper中我遇到了一些问题:我通过conda设置了一个名为whisper的虚拟环境,安装了Python 3.9.9 以及 PyTorch 1.10.1,然后直接使用pip install -U openai-whisper直接安装whisper。问题在于numpy的版本太高,导致报错,将numpy的版本由2.0.2下
WhisperGitHubOpenAI
Sesveria 2024-10-11
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1