君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的...【查看原文】
# 前言 要解决问题: 需要一款开源的语音转文字应用, 用于视频自动转换字幕. 想到的思路: `openai`的`whisper`以及根据这个模型开发的`whisper.cpp`C++应用. 其它的补充: 最好在`linux`下部署, `Windows`下困难太多. --- # 一、部署`whisper` 官方文档要求至少十`python3.8-3.10`, 同时需要`ffmpeg`, 要有`nv`的显卡, 支持`cuda` 直接安装部署: `pip install -U openai-whisper`
WhisperOpenAI
不停感叹的老林 2024-01-08
前言 前段时间测试一下OpenAI的语音识别模型 当时发现效率很低,今天发现阿里有一个专注的语音识别大模型FunAsr 看介绍Funasr的中文识别能力应该比Whisper更强大: Funasr的模型
OpenAIWhisper
土圭垚墝 2024-05-29
很多做录音采访之类的工作,需要实时录音后期还要将谈话内容整理成文字,如果人工去做的话及其耗时,还可以根据音频文件生成srt字幕,非常适合做自媒体视频的人用,还比如看到一些视频非常好很想将里面的文案提取出来,有很多软件就可以实现将语音转成文字,这里就跟大家分享一个免费又好用的软件:Whisper,这是一个免费开源程序,该软件是whisper.cpp实现的Windows 移植,是OpenAI 的 Whisper自动语音识别 (ASR) 模型的 C++ 端口。github项目地址:https://github.
WhisperGitHubOpenAI
AI画师大阳 2023-09-09
功能实时语音转文字、实时翻译(需麦克风权限)导入音频、视频文件(mp3、wav、m4a、ogg、mp4、webm、ogm),导出逐句字幕或逐词字幕(导出格式:TXT、SRT、VTT)转录和翻译音频离线在您的个人计算机。由OpenAI的Whisper提供动力。可以简单理解为QT的前端界面,python语言构建服务端,使用Whisper语言模型进行计算语音转文字的软件。痛点在于离线,缺点也很明显,模型较大,高质量模型运算依赖于硬件和算法优化应用场景学习,歌曲提取歌词,视频提取字幕,多媒体信息前置数据提取相较于
mayoの自留地 2023-10-20
OpenAI Whisper实时语音识别:实现近乎实时的语音转文本 近年来,随着人工智能技术的飞速发展,语音识别领域也取得了突破性进展。OpenAI推出的Whisper模型就是其中的佼佼者,凭借其强大
OpenAIWhisper人工智能
用户391315911403 2024-09-02
10月30日,神舟十九号载人飞行任务航天员蔡旭哲(右)、宋令东(中)、王浩泽在出征仪式上。凌晨时分,巴丹吉林沙漠尚在夜幕中沉睡,东风航天城已然苏醒。10月30日凌晨1时37分,神舟十九号载人飞行任务航天员乘组出征仪式,在酒泉卫星发射中心问天阁圆梦园广场举行。以问天阁为起点,3名航天员蔡旭哲、宋令东、王浩泽,即将开启为期半年的太空之旅。
央广网 2024-10-31
微软:《使命召唤21:黑色行动6》(CallofDuty:BlackOps6)是历史上最盛大的COD系列发布活动。
华尔街见闻 2024-10-31
10月30日上午,华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东宣布,“见非凡”品牌计划将于31日正式开启。
IT之家 2024-10-31
此外,芯片研发是一个高技术门槛的领域,存在技术失败的风险。据介绍,Alphabet将继续在人工智能方面投入巨资。
每日经济新闻 2024-10-31
以其强大的性能表现和卓越的能效比,安兔兔跑分可达238万,配合独显D1芯片,无论是大型游戏的高帧率畅玩,还是多任务处理的轻松应对,红米K70至尊版都能游刃有余。红米K70至尊版在品质方面几乎可以媲美高端机,不仅使用了金属中框的设计,后盖采用玻璃材质,并有小米龙晶玻璃加持,让它的耐用性大幅提升,抗跌耐摔表现更好。
大话百科天地 2024-10-31
工业和信息化部10月30日消息,工业和信息化部、财政部、国家数据局近日联合印发《新材料大数据中心总体建设方案》,计划到2027年,搭建形成“1+N”(1个中心主平台、N个数据资源节点)的新材料大数据中心架构体系;到2035年,新材料大数据中心体系全面建成并稳定运行,数据规模进入国际第一梯队。
中国证券报 2024-10-31
金融界2024年10月31日消息,国家知识产权局信息显示,深圳市信维通信股份有限公司取得一项名为“一种具有双陷波特性的宽带带通滤波器拓扑结构及滤波器”的专利,授权公告号CN221885343U,申请日期为2024年1月。
金融界 2024-10-31
10月30日,全球领先的智能终端提供商荣耀正式发布荣耀Magic7系列手机,包括荣耀Magic7、荣耀Magic7Pro和荣耀Magic7RSR保时捷设计三款型号。荣耀Magic7系列以AI全面赋能产品,重新定义了AI时代的全新应用场景,为用户带来了颠覆性的体验,引领消费者步入一个前所未有的AI手机时代。
数字尾巴 2024-10-31
10月31日、11月10日、11月11日每天18:00-22:00,ZOL中关村在线双11潮电狂欢直播即将开始!
中关村在线 2024-10-31
10月30日,清华大学新闻学院和人工智能学院双聘教授沈阳在世界中文报业协会第57届年会上作了题为“人工智能生成内容(AIGC)与人机共生”的演讲。
经济日报 2024-10-31
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1