openai-whisper是流行的语音识别解决方案,支持数十种语言,对中文支持效果也不错,不过在使用低于large尺寸的模型时,效果仍是略差。相比而言,国内阿里系专注于中文识别的模型效果就好了不少。...【查看原文】
Whisper 是一种通用的语音识别模型。它是在包含各种音频的大型数据集上训练的,也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。开源项目地址:https://github.com/openai/whisperWhisper 语音识别模型Transformer 序列到序列模型针对各种语音处理任务进行训练,包括多语言语音识别、语音翻译、口语识别和语音活动检测。这些任务共同表示为由解码器预测的一系列标记,允许单个模型取代传统语音处理管道的多个阶段。多任务训练格式使用一组特殊标记作为任务说明符或
WhisperGitHubOpenAI
CiiLIi西里网 2023-06-09
君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的
WhisperOpenAI
刘悦的技术博客 2024-01-10
GPT-4的语音对话功能前段时间在网上火了一把,许多人被其强大的自然语言处理能力和流畅的语音交互所吸引。现在,让我们来看看如何使用类似的技术,即基于百度的ERNIE-Bot,来打造自己的语音对话功能。
GPT-4百度
AI小匠 2024-05-14
前言 前段时间测试一下OpenAI的语音识别模型 当时发现效率很低,今天发现阿里有一个专注的语音识别大模型FunAsr 看介绍Funasr的中文识别能力应该比Whisper更强大: Funasr的模型
OpenAIWhisper
土圭垚墝 2024-05-29
功能实时语音转文字、实时翻译(需麦克风权限)导入音频、视频文件(mp3、wav、m4a、ogg、mp4、webm、ogm),导出逐句字幕或逐词字幕(导出格式:TXT、SRT、VTT)转录和翻译音频离线在您的个人计算机。由OpenAI的Whisper提供动力。可以简单理解为QT的前端界面,python语言构建服务端,使用Whisper语言模型进行计算语音转文字的软件。痛点在于离线,缺点也很明显,模型较大,高质量模型运算依赖于硬件和算法优化应用场景学习,歌曲提取歌词,视频提取字幕,多媒体信息前置数据提取相较于
mayoの自留地 2023-10-20
11月16日,由OPPO与浙江大学联合承办的第三届(2024年)中国高校计算机大赛——智能交互创新赛在浙江省杭州市举行了全国总决赛及颁奖典礼。本届竞赛以“交互无界,创意无限”为主题,聚焦人机交互技术,深度挖掘AI智能体的应用潜力,推动智能产业的升级和发展。
量子位 昨天
11月18日,2024大湾区科学论坛特色活动——“科学有Young”科普活动在广东广雅中学举行。巴里·马歇尔因其在幽门螺旋杆菌研究方面的重大贡献,于2005年获得了诺贝尔生理学或医学奖。此前主流学说认为胃溃疡主要是由于压力、刺激性食物和胃酸过多引起的。
南方都市报 昨天
IT之家11月18日消息,日本交易所集团宣布,东京证券交易所联合富士通于11月5日上线了新一代交易系统Arrowhead4.0。东京证券交易所自2010年启用第一代Arrowhead证券交易系统以来分别于2015年和2019年进行了两次升级。
IT之家 昨天
新版下载地址如下:Windows32位:9.9.16版本Windows64位:9.9.16版本。Windowsarm64:9.9.16版本。macOS:6.9.61版本Linux:3.2.13版本。IT之家附具体更新内容如下:截图。新增支持快捷键唤起提取文字(Windows、macOS)。新增支持快捷键唤起屏幕翻译(Windows)。
快科技11月18日消息,小米最新推出了米家多功能电蒸锅N1,首发价199元,政府补贴后更是只要159.2元。性能方面,新系列搭载1500瓦强劲功率,宣称能在不到10分钟内迅速煮沸2升水,高效节能。同时,提供五档精细火力调节,配合NTC精准控温技术,确保食材烹饪得恰到好处。
驱动之家 昨天
:11月18日,苹果公司正在评估进入电视机市场的可能性,考虑推出自有品牌的电视机产品。这一动向并非首次浮出水面,早在几年前,苹果就已对生产电视机有所考量。乔布斯在传记中透露了他的愿景:“我想制造一种易于使用的集成电视机。
金融界 昨天
李开复博士、周志华教授、还有智源研究院王仲远院长都来量子位MEET2025智能未来大会探讨行业破局之道了!今年大会将以「智变千行,慧及百业」为主题,承袭“MEET”系列年度行业观察的视角,邀请到智能科技产业、科研、投资领域真正具有代表性意义的头部企业的直接负责人,共同探讨大模型、空间计算、芯片算力、生物智能、智能汽车等等相关话题。
上月末,VAIO在日本市场推出了旗舰轻薄本SX14-R,并已经上市。SX14-R采用三热管+单风扇的散热方案,板载内存为LPDDR5x16~64GB,并原装提供了512GB~2TB固态硬盘的各种配置版本。
中关村在线 昨天
在最新的Linux内核版本6.12中,LinusTorvalds宣布引入了“PREEMPT_RT”(实时补丁)的主线支持,并引入了新调度程序和适配最新硬件的能力。在安全性方面,LinuxKernel6.12改进了SELinux和AppArmor安全模块,并增强了内核内存保护机制,以减少系统漏洞风险。
国际空间站(ISS)已有26年的历史,如今超期服役了近10年,计划在2030年后退役。NASA专家团队担心情况进一步恶化,将出现灾难性故障,甚至可能导致空间站解体。早在10月底,NASA就在一份报告中承认,国际空间站有50处“令人担忧的隐患”和4处裂缝,每天有超过正常标准2-2.5磅的空气泄漏,可能导致居住在上面的宇航员紧急撤离。
北京日报 23小时前
Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1