openai-whisper是流行的语音识别解决方案,支持数十种语言,对中文支持效果也不错,不过在使用低于large尺寸的模型时,效果仍是略差。相比而言,国内阿里系专注于中文识别的模型效果就好了不少。...【查看原文】
君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的
WhisperOpenAI
刘悦的技术博客 2024-01-10
Whisper 是一种通用的语音识别模型。它是在包含各种音频的大型数据集上训练的,也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。开源项目地址:https://github.com/openai/whisperWhisper 语音识别模型Transformer 序列到序列模型针对各种语音处理任务进行训练,包括多语言语音识别、语音翻译、口语识别和语音活动检测。这些任务共同表示为由解码器预测的一系列标记,允许单个模型取代传统语音处理管道的多个阶段。多任务训练格式使用一组特殊标记作为任务说明符或
WhisperGitHubOpenAI
CiiLIi西里网 2023-06-09
GPT-4的语音对话功能前段时间在网上火了一把,许多人被其强大的自然语言处理能力和流畅的语音交互所吸引。现在,让我们来看看如何使用类似的技术,即基于百度的ERNIE-Bot,来打造自己的语音对话功能。
GPT-4百度
AI小匠 2024-05-14
前言 前段时间测试一下OpenAI的语音识别模型 当时发现效率很低,今天发现阿里有一个专注的语音识别大模型FunAsr 看介绍Funasr的中文识别能力应该比Whisper更强大: Funasr的模型
OpenAIWhisper
土圭垚墝 2024-05-29
功能实时语音转文字、实时翻译(需麦克风权限)导入音频、视频文件(mp3、wav、m4a、ogg、mp4、webm、ogm),导出逐句字幕或逐词字幕(导出格式:TXT、SRT、VTT)转录和翻译音频离线在您的个人计算机。由OpenAI的Whisper提供动力。可以简单理解为QT的前端界面,python语言构建服务端,使用Whisper语言模型进行计算语音转文字的软件。痛点在于离线,缺点也很明显,模型较大,高质量模型运算依赖于硬件和算法优化应用场景学习,歌曲提取歌词,视频提取字幕,多媒体信息前置数据提取相较于
mayoの自留地 2023-10-20
金融界2024年12月25日消息,国家知识产权局信息显示,中国电信股份有限公司申请一项名为“移动终端的定位方法、装置以及电子设备”的专利,公开号CN119172852A,申请日期为2024年9月。专利摘要显示,本申请公开了一种移动终端的定位方法、装置以及电子设备。涉及通信技术领域。
金融界 2024-12-25
金融界2024年12月25日消息,国家知识产权局信息显示,广东大地之元农业科技有限公司取得一项名为“一种胶合板填料混合装置”的专利,授权公告号CN222196587U,申请日期为2024年4月。专利摘要显示,本实用新型涉及一种混合装置,尤其涉及一种胶合板填料混合装置。
金融界2024年12月25日消息,国家知识产权局信息显示,佐竹机械装备(大连)有限公司取得一项名为“一种通用型升降搅拌机”的专利,授权公告号CN222196592U,申请日期为2024年5月。
金融界2024年12月25日消息,国家知识产权局信息显示,广东品和信息科技有限公司取得一项名为“搅拌机的搅拌头升降调节机构”的专利,授权公告号CN222196590U,申请日期为2024年1月。
金融界2024年12月25日消息,国家知识产权局信息显示,浙江华云清洁能源有限公司申请一项名为“一种适应无网络覆盖区域的无人机巡检方法及系统”的专利,公开号CN119172850A,申请日期为2024年7月。
金融界2024年12月25日消息,国家知识产权局信息显示,先禾新材料(苏州)有限公司取得一项名为“一种用于导热胶生产的原料快速反应装置”的专利,授权公告号CN222196596U,申请日期为2024年4月。将罐体内部的各种原料都翻拌起来,从而保证其内的原料能够。
金融界2024年12月25日消息,国家知识产权局信息显示,江苏正赫通信息科技有限公司申请一项名为“基于深度卷积神经网络指纹定位方法、设备及介质”的专利,公开号CN119172854A,申请日期为2024年11月。
金融界2024年12月25日消息,国家知识产权局信息显示,上海大杉新材料科技有限公司取得一项名为“一种便于同轴定位的分散机”的专利,授权公告号CN222196589U,申请日期为2023年12月。专利摘要显示,本申请公开了一种便于同轴定位的分散机,涉及涂料加工设备技术领域。
金融界2024年12月25日消息,国家知识产权局信息显示,大唐移动通信设备有限公司申请一项名为“消息处理方法、处理装置、第一AMF和存储介质”的专利,公开号CN119172848A,申请日期为2023年6月。专利摘要显示,本申请公开了一种消息处理方法、处理装置、第一AMF和存储介质,涉及无线通信领域。
金融界2024年12月25日消息,国家知识产权局信息显示,华为技术有限公司申请一项名为“通信方法与装置”的专利,公开号CN119172856A,申请日期为2023年6月。专利摘要显示,本申请提供了一种通信方法与装置,该方法提供一种能够有效降低信道质量对数据传输的影响的方案。
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1