我是一名美剧爱好者,经常在网上搜刮最新美剧,但有时国内字幕制作组的更新速度跟不上美剧的上新速度,因此经常吃生肉,无奈英语水平不行,还得去网上搜刮英文字幕并机翻,但有时连英文字幕都更新不及时,那就只能干着急了。 我的法宝就是Whisper+沉浸式翻译 Whisper是OpenAI公司的一款开源语音识别大模型,对英文语音的识别相当准确,国外内其实也有很多的这种语音转换平台或工具,但大多要收费,我就注册过剪映的会员,45元一个月,来使用它的语音识别功能,效果还行,但45元还是可以吃两顿饭了,本着能省则省的原则,
WhisperOpenAI
bili_jjyy 2024-11-09
Parler-TTS 是一个由 Hugging Face 开源的文本生成语音 (Text-to-Speech, TTS) 模型。它的设计目的是生成高质量的语音输出,支持自然的语调和流畅的语音合成。
Hugging Face
中杯可乐多加冰 2024-11-09
11月8日,智谱AI清影迎来升级,发布最新版视频模型CogVideoXv1.5。升级后的清影在复杂提示词理解等方面的能力得到提升,能够生成10秒、4k、60帧超高清画质,同时支持任意比例图像生成视频,可以一次…
提示词
澎湃新闻 2024-11-10
他指出,为促进行业与企业的共同发展,我们迫切需要构建一个涵盖智能座舱、AI大模型、软硬件协同以及数据生态等多个维度的开放、协同、创新、共享的智能网联汽车生态系统。中汽创智首席执行官谈民强作了“开源开放,生态融…
AI大模型汽车
汽车纵横AutoReview 2024-11-07
在生成式AI领域里,Llama一直被广泛宣传为最大的开源AI模型,Llama的使用条款中支持公众下载和使用,但其商业用途受到一定限制(对于拥有超过7亿用户的应用程序),且不提供对训练数据的访问,这导致其不符合…
生成式AILLaMA
机器之心Pro 2024-11-07
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1