讯飞星火多模态交互大模型上线语音、视觉、数字人交互三合一

作者：站长之家发布时间：2024-12-16

科大讯飞公司近日宣布，其最新研发的讯飞星火多模态交互大模型正式投入运营。这一技术突破标志着科大讯飞从单一的语音交互技术拓展到音视频流实时多模态交互的新阶段。新模型集成了语音、视觉和数字人交互功能，用户可通过一键调用，实现三者的无缝结合。

讯飞星火多模态交互大模型的推出，首次引入了超拟人数字人技术，该技术能够使数字人的躯干和四肢动作与语音内容精准匹配，快速生成表情和动作，极大提升了AI的生动性和真实感。通过整合文本、语音和表情，新模型能够实现跨模态的语义一致性，让情感表达更加真实连贯。

此外，讯飞星火支持超拟人极速交互技术，利用统一神经网络直接实现语音到语音的端到端建模，使得响应速度更快、更流畅。该技术能够敏锐感知情绪变化，并根据指令自由调整声音的节奏、大小和人设，提供更为个性化的交互体验。

在多模态视觉交互方面，讯飞星火能够“听懂世界”“认清万物”，全面感知具体背景场景、物流状态等信息，使得对任务的理解更加精准。通过综合语音、手势、行为、情绪等多种信息，模型能够作出合适的回复，为用户提供更为丰富和精准的交互体验。

相关资讯

讯飞星火首发语音视觉虚拟人交互“三合一” ，亮相多语言大模型

飞星火4.0Turbo全新升级，首发多模态视觉交互，让大模型从语音交互拓展到音视频流的实时多模交互，使得情境感知更全面，任务理解更精准；首发超拟人数字人，业界率先实现语义贯穿的“口唇-表情-动作”的超拟人数字人生成，一张照片就能生成数字人，实现更加立体的个性化多维表达；此外首次发布星火多语言大模型，首批支持中英之外的八个语种，多行业任务场...

数字人

钛媒体快报 2024-10-24

讯飞星火多模态交互大模型上线，数字人/语音/视觉支持一键全调用

IT之家11月14日消息，“讯飞开放平台”公众号今天傍晚宣布，讯飞星火多模态交互大模型正式上线，其实现从语音交互拓展到音视频流实时多模交互，新增“多模态、超拟人和个性化”能力，实现语音、视觉、数字人交互三合一…

数字人

IT之家 2024-11-14

科大讯飞将首发多模态视觉交互及超拟人虚拟人交互

鞭牛士10月10日消息，科大讯飞宣布，第七届世界声博会暨2024科大讯飞全球1024开发者节将于10月24日-27日在合肥举行。届时，讯飞星火大模型底座能力将宣布升级，数学、代码和长文本能力将进一步提升，并首…

科大讯飞编程

鞭牛士 2024-10-11

科大讯飞：将首次发布多模态视觉交互及超拟人虚拟人交互能力

10月15日消息，科大讯飞在互动平台表示，公司将于2024年10月24日举办“2024第七届世界声博会暨科大讯飞全球1024开发者节”，讯飞星火大模型底座能力将再次升级，训练推理效率大幅提升，并将首次发布多模…

科大讯飞

鞭牛士 2024-10-16

科大讯飞星火极速超拟人交互技术上线讯飞星火APP

鞭牛士8月30日消息，科大讯飞星火极速超拟人交互技术正式上线讯飞星火APP。据介绍，这是国内首个对标GPT-4o语音的产品，在响应和打断速度、情绪感知情感共鸣、语音可控表达、人设扮演四个方面实现突破。…

科大讯飞

鞭牛士 2024-08-30

讯飞星火多模态交互大模型上线语音、视觉、数字人交互三合一

推荐体验

相关资讯

讯飞星火首发语音视觉虚拟人交互“三合一” ，亮相多语言大模型

讯飞星火多模态交互大模型上线，数字人/语音/视觉支持一键全调用

科大讯飞将首发多模态视觉交互及超拟人虚拟人交互

科大讯飞：将首次发布多模态视觉交互及超拟人虚拟人交互能力

科大讯飞星火极速超拟人交互技术上线讯飞星火APP

近期资讯

支付相关—支付宝小程序非同一主体下多商户进行收款

分析上位机通信难题：复杂性与应对策略

记一次使用投屏软件scrcpy导致Android设备横竖屏切换的问题

高效搭建Nacos：实现微服务的服务注册与配置中心

java并发系列-ConcurrentHashMap 底层原理（一）

.NET 五个优秀依赖注入框架大盘点

有人吃下海贝后永久失忆这种可怕的事情越来越容易发生了

JavaScript 自定义双击事件，CustomEvent 对象的使用详解

OpenHarmony UI开发-ohos-svg

你牛肉吃到爽没！国内牛肉价格跌倒5年最低：1斤不足30元

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

讯飞星火多模态交互大模型上线 语音、视觉、数字人交互三合一

讯飞星火多模态交互大模型上线语音、视觉、数字人交互三合一