1.使用OpenAI的Whisper automatic speech recognition模型进行视频的时间轴抽取及语音转文字(对显卡有一定要求)
需要用到的软件(需要梯子):
https://github.com/Const-me/Whisper
https://huggingface.co/datasets/ggerganov/whisper.cpp/tree/main (下载ggml-medium.bin )
下载后解压并加载model:
选择完毕后,在Transcribe File中选择你想要转换的文件。
Language选择当前视频语言。(勾选Translate仅能翻译成英文)
Output Format(输出格式)有四种:Txt格式,Txt格式(带时间轴),SRT格式,VTT格式。请选择你需要的模式。
在设置完毕后点击Transcribe等待转换完成。
2.使用支持字幕翻译的服务商的免费额度进行翻译
使用软件(需要梯子):
https://github.com/1c7/Translate-Subtitle-File
或者
https://tern.1c7.me/#/
需要申请不同服务商的API Key,在页面查看如何使用。