开源组合llama+langchain助力开发者轻松使用whisper搭建本地环境,进行音视频的字幕生成和翻译,质量超级高,而且需求是转换为英语字幕,速度也是超级快的...【查看原文】
对于观看非母语小电影的人群,字幕能够帮助观众更好地理解对话和情节发展。电影字幕的生成电影字幕的生成,依赖语音转文本(Speech-to-Text,STT)的技术。随着语音技术和机器学习的发展,语音转文本技术也取得了长足的进步。而OpenAI的Whisper是目前识别率较高的模型。下面讲展示如何调用Whisper来得到电影的字幕.Whisper是一种自动语音识别(ASR)系统,它是基于680,000小时的多语言和多任务监督数据进行训练的,使用了大量的多样化音频数据进行训练,并且具有多任务的能力。Whispe
WhisperChatGPT机器学习OpenAI
浪客剑心客栈 2023-10-28
前言 最近一直在炼丹(搞AIGC这块),突然发现业务代码都索然无味了… 上次发了篇AI画图的文章,ChatGPT虽然没法自己部署,但现在开源的LLM还是不少的,只要有一块差不多的显卡,要搞个LLM本地
AIGC编程ChatGPT
程序设计实验室 2023-05-20
[图片] 开发者朋友们大家好: 这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。 本期编辑:@SSN,@鲍勃 01 有话题的新闻 1、曝 OpenAI 高级推理 AI 产品「草莓」秋季推出 路透社曾爆料 OpenAI 正在
OpenAI
RTE开发者社区 2024-08-28
visual-chatgpt可以通过对话让AI对图片进行分析和处理,对图片进行解释、按文字生成或修改图片等操作。本质上其实是ControlNet+ChatGPT,并不是一个能够直接对图片进行处理的多模态语言模型,而是ChatGPT在现有的AI图片处理技术上的一个应用。 完整将模型全部加载要几十G的显存,但其实没有必要,每次只要加载需要用到的部分即可,通过修改代码可以在十几G的显存上运行。原理简介原理图参数介绍User Query,符号Qi,用户第i轮提问,可以是文字或者图片Ouput,符号Ai,模型第i轮
ChatGPT编程
璃花昼 2023-03-13
引言 最近正在进行一项大工程:给Kimberly Akimbo这部音乐剧做全场字幕。由于精力有限,故研究了一下利用AI工具减少工作量的方法。于是找到了OpenAI(开发ChatGPT的那家公司)开源的语音识别模型whisper。该模型可以直接由音频文件识别生成包括srt字幕格式在内的多种文字稿。本教程主要提供基于官方的命令行工具的操作方法,如果嫌麻烦也可以用一些打包好的图形界面软件(B站有人投稿过相关的教程)。 下面是配置要求及步骤(项目仓库链接见文末): 运行环境 硬件 NVIDIA GeForce 3
WhisperChatGPTOpenAI
T_MA 2024-01-10
在汽车售后服务领域,AI智能体的应用正带来一场效率和专业度的革命。本文深度解析了一个AI智能体在To B领域的实际应用案例,介绍了AI智能体如何通过提升服务顾问和维修技师的专业度及维修效率,优化汽车售后服务流程。
陈宇明 2024-11-18
金融界2024年11月18日消息,国家知识产权局信息显示,昆山岦摩机械有限公司取得一项名为“一种用于检测气袋气密性的检测装置”的专利,授权公告号CN222013464U,申请日期为2023年12月。
金融界 2024-11-18
金融界2024年11月18日消息,国家知识产权局信息显示,济南威尔曼智能装备有限公司取得一项名为“一种全自动测漏机”的专利,授权公告号CN222013466U,申请日期为2024年4月。专利摘要显示,本实用新型公开了一种全自动测漏机,涉及自动化机械领域,具体来说是一种全自动测漏机。
金融界2024年11月18日消息,国家知识产权局信息显示,沧州元朝管材有限公司取得一项名为“一种冷却管的90°弯头密封性检测装置”的专利,授权公告号CN222013463U,申请日期为2024年4月。
金融界2024年11月18日消息,国家知识产权局信息显示,西安诺坤流体科技有限公司取得一项名为“一种机械密封件的检测装置”的专利,授权公告号CN222013449U,申请日期为2023年12月。
金融界2024年11月18日消息,国家知识产权局信息显示,上海创洁科技有限公司取得一项名为“一种特种气体输送管道泄漏试验测试平台”的专利,授权公告号CN222013460U,申请日期为2024年3月。
金融界2024年11月18日消息,国家知识产权局信息显示,天津市世泓智能装备有限公司取得一项名为“一种膜电极的气密性检测装置”的专利,授权公告号CN222013453U,申请日期为2024年1月。专利摘要显示,本实用新型公开了一种膜电极的气密性检测装置,涉及膜电极气密性检技术领域。
金融界2024年11月18日消息,国家知识产权局信息显示,河北永良燃气设备有限公司取得一项名为“燃气自闭阀气密性检测装置”的专利,授权公告号CN222013462U,申请日期为2024年4月。
金融界2024年11月18日消息,国家知识产权局信息显示,江苏炎启自动化有限公司取得一项名为“一种气密在线检测仪”的专利,授权公告号CN222013455U,申请日期为2024年4月。
在人工智能的浪潮中,百度以其独特的多模态技术路线,引领行业探索AI的深度应用。本文深入解析了百度在AI领域的战略选择,特别是在面对“百模大战”和视频生成技术风潮时,百度如何坚持其技术理念,通过iRAG技术解决AI领域的“幻觉”问题,并在多模态技术的发展上走出自己的道路。
量子位 2024-11-18
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1