openai-whisper是流行的语音识别解决方案,支持数十种语言,对中文支持效果也不错,不过在使用低于large尺寸的模型时,效果仍是略差。相比而言,国内阿里系专注于中文识别的模型效果就好了不少。...【查看原文】
君不言语音识别技术则已,言则必称Whisper,没错,OpenAi开源的Whisper确实是世界主流语音识别技术的魁首,但在中文领域,有一个足以和Whisper相颉顽的项目,那就是阿里达摩院自研的
WhisperOpenAI
刘悦的技术博客 2024-01-10
Whisper 是一种通用的语音识别模型。它是在包含各种音频的大型数据集上训练的,也是一个可以执行多语言语音识别、语音翻译和语言识别的多任务模型。开源项目地址:https://github.com/openai/whisperWhisper 语音识别模型Transformer 序列到序列模型针对各种语音处理任务进行训练,包括多语言语音识别、语音翻译、口语识别和语音活动检测。这些任务共同表示为由解码器预测的一系列标记,允许单个模型取代传统语音处理管道的多个阶段。多任务训练格式使用一组特殊标记作为任务说明符或
WhisperGitHubOpenAI
CiiLIi西里网 2023-06-09
GPT-4的语音对话功能前段时间在网上火了一把,许多人被其强大的自然语言处理能力和流畅的语音交互所吸引。现在,让我们来看看如何使用类似的技术,即基于百度的ERNIE-Bot,来打造自己的语音对话功能。
GPT-4百度
AI小匠 2024-05-14
前言 前段时间测试一下OpenAI的语音识别模型 当时发现效率很低,今天发现阿里有一个专注的语音识别大模型FunAsr 看介绍Funasr的中文识别能力应该比Whisper更强大: Funasr的模型
OpenAIWhisper
土圭垚墝 2024-05-29
功能实时语音转文字、实时翻译(需麦克风权限)导入音频、视频文件(mp3、wav、m4a、ogg、mp4、webm、ogm),导出逐句字幕或逐词字幕(导出格式:TXT、SRT、VTT)转录和翻译音频离线在您的个人计算机。由OpenAI的Whisper提供动力。可以简单理解为QT的前端界面,python语言构建服务端,使用Whisper语言模型进行计算语音转文字的软件。痛点在于离线,缺点也很明显,模型较大,高质量模型运算依赖于硬件和算法优化应用场景学习,歌曲提取歌词,视频提取字幕,多媒体信息前置数据提取相较于
mayoの自留地 2023-10-20
记者从中国国家铁路集团有限公司(以下简称国铁集团)获悉,12月29日,CR450动车组样车在北京发布,这标志着“CR450科技创新工程”取得重大突破,将极大提升我国铁路科技创新水平和科技自立自强能力,进一步巩固扩大我国高铁技术世界领跑优势。
半岛都市报 2024-12-30
近日,成都先导公告披露,公司自主研发的1.1类创新药物HG146胶囊已完成Ⅰ期临床试验,开启治疗复发或转移性腺样囊性癌的Ⅱ期临床研究,并已于日前完成首例受试者入组,这标志着HG146胶囊的临床研究在验证有效性和安全性的道路上迈出了重要的一步。HG146胶囊临床研究的推进,有望为患者群体带来新的治疗选择。
中国证券报 2024-12-30
除却卫视平台和B站,央视也是跨年晚会的重要玩家。12月31日晚,《启航2025——中央广播电视总台跨年晚会》将如约来袭,极目新闻记者了解到,今年央视跨年晚会落地山东泰安录制,情怀、温度、共鸣与陪伴,将是其跨年晚会的情绪底色。结合XR/AR虚拟现实,融入无人机、机器人表演等科技手段,拓展节目表现形式。
极目新闻 2024-12-30
继今年7月推出“碰一下”功能后,12月30日,支付宝推出新一代AI视觉搜索产品“探一下”。“探知识”即,用户遇到不懂的事物或知识,包括花草、昆虫、美食、建筑、展览物品等,可通过“探知识”实现AI随手识图,收获新知。
财经天下WEEKLY 2024-12-30
“目前在‘天河新一代’主机上完成9大类286款基于国产计算设备的应用软件开发、移植和适配,涵盖计算化学、分子动力学、流体力学、人工智能、生物信息、数学等应用领域,初步建立了‘天河新一代’国产软件生态。”
长沙晚报 2024-12-30
12月30日,随着世界最大单机容量、最大尺寸冲击式水轮机转轮在哈电集团哈尔滨电机厂有限责任公司(以下简称哈电电机)焊接制造成功,世界首台单机500兆瓦扎拉水电站冲击式水轮发电机组转轮问世,这标志着我国高水头、大容量冲击式水电机组的研制技术实现了重大突破。
观察者网 2024-12-30
前不久,美国谷歌公司发布最新量子芯片“威洛”(Willow),称其在计算速度和纠错能力方面取得“两个重大进步”,不到5分钟就完成了当今领先的超级计算机需要1025年才能完成的任务,为研制实用的大规模量子计算机奠定了坚实基础。金贤敏介绍:“量子纠缠使量子芯片在处理信息时具有更强的关联性和协同性。”
中国战略新兴产业 2024-12-30
与其说华强北是一个市场,不如说它是中国消费电子的风向标。播放量颇高的短视频中,华强北档口的热销产品变成了AI翻译机、AI吉他、AI耳机、AI手机壳、AI戒指......有不少网友评论,“华强北的下一个风口是AI”“华强北搭上了AI的车”。“可以人机对话的都叫AI”,刘丽介绍该款耳机称,不需要语音唤醒,就可以直接对话。
红星新闻 2024-12-30
双星伴月、象限仪流星雨、金星东大距……2025年天象剧场的大幕即将拉开。新年伊始,金星、土星与月亮在傍晚天空上演一场相互追逐的好戏。1月3日傍晚,一弯蛾眉月位于明亮的金星西南方,好看又容易观测;4日傍晚,月亮来到了金星与土星之间,形成一幅双星伴月的画面。18日前后,金星还将与土星亲密约会。
中国青年网 2024-12-30
2025年,华为服务日活动即将开启第九个年头,权益再升级,为广大用户带来专业且有温度的服务。权益升级一:穿戴设备免费贴膜今年华为发布了WATCHGT5系列、WATCHFIT3等多款智能手表,让更多人可以记录自己的运动、健康等数据,更好地了解自己的身体状况。
ITheat热点科技 2024-12-30
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1