技术为底座，科大讯飞三大AIGC能力赋能多领域应用落地

作者：定焦科技港发布时间：2023-03-31

经过了2022年AIGC元年的“C位出道”，如今AIGC已经稳步进入发展快车道，无论是底层技术还是具体落地应用都更加牢固和丰富，也一次又一次让人类发出赞叹，2023年被称为AIGC大年，有数据显示，今年我国AIGC市场规模可达170亿元，到2030年中国AIGC市场规模将达到1.15万亿元，面对如此前景和实际应用意义，众多公司纷纷入局，其中便有我国头部科技公司——科大讯飞。

在3月29日由量子位主办的中国AIGC产业峰会上，科大讯飞AI研究院常务副院长高建清对讯飞在AIGC领域的整体布局进行了分享。从文本创作到音频创作再到视觉创作，科大讯飞均有涉及，同时创新产出AIGC相关应用和产品。

以往我们在看电子书时，可能会打开系统自带的朗读功能，但总是会被比siri还要“冰冷无情”的机器声音所劝退。在音频创作领域，通过研发虚拟声音自动创造系统，讯飞已经实现了语义可控的声音创造，用户输入一个人设，系统便可以生成该人设声音，除此之外，多风格多情感语音合成系统SMART-TTS是科大讯飞的一大杀手锏，11种情感、20档强弱度不同的调节功能，让合成语音更加真实，停顿、重音、语速等能关键声音元素也能够进行随心调节。

《红楼梦》中，未见其人、先闻其声的王熙凤一出场便让人知道她是一个风风火火的人，声音是人设的特点之一，而后面人物的视觉面貌也让人设更加具体。在视觉创作方面，科大讯飞也同样带来了惊喜。从2018年首发多语种虚拟人口唇驱动，到2021年首发2D真人捏脸系统，目前科大讯飞已形成了从3D虚拟形象口唇表情和动作的AI驱动到AI贯穿3D形象构建的全流程，“徒手捏人”不再是女娲的专属技能，同时讯飞通过对语音节奏、韵律体会和语义理解，让虚拟人可以随时、流畅地切换动作，拥有更加自然的肢体语言，讯飞研究院还打造了个性化3D虚拟人复刻系统，一张人像、一句话便能快速生成个性化3D虚拟形象。

目前科大讯飞在AIGC领域打造了AIGC内容创作基地，包括讯飞智作和讯飞音乐“词曲家”平台等创新产品，讯飞智作可以为用户提供快捷的音视频制作，基于讯飞在虚拟人的技术基础，2D/3D形象可代替真人主播，从文本到视频可以一键转换。讯飞智作的内容生产已经广泛应用于媒体、金融、智慧文旅、企业数字化、智慧政务、IP运营多个领域。词曲家平台则提供了辅助作词、辅助作曲和歌曲试音、质量分析等AI辅助工具，为广大词曲作者和采买方提供一个更加智能、透明和安全的词曲创作交易平台。

高建清在中国AIGC产业峰会上表示，“底座+能力+应用”是科大讯飞AIGC整体布局的三层架构：以文本预训练、多模态预训练、多元异构基础资源构建、异构集群构建及大模型训练套件为技术底座，形成了音频创作、视觉创作、文本创作三大AIGC能力，进而衍生出在教育、医疗、人机交互等领域的丰富应用。

从技术到应用，AIGC不是束之高阁的概念，也不是昙花一现的空谈，其底层技术和产业形态已经形成了新的格局，而科大讯飞对AIGC应用落地的推动让更多人切实感受到了时代发展的最新力量。

技术为底座，科大讯飞三大AIGC能力赋能多领域应用落地

推荐体验

相关资讯

科大讯飞高建清：「底座+能力+应用」是科大讯飞AIGC整体布局的三层架构

科大讯飞高建清：“底座+能力+应用”是AIGC整体布局的三层架构

科大讯飞三季度营收55.25亿元，下周将升级讯飞星火大模型底座能力

科大讯飞发布讯飞星火认知大模型大模型三大能力已超ChatGPT

科大讯飞三季度营收55.25亿元，下周将升级讯飞星火大模型底座能力｜钛媒体AGI

近期资讯

vivo内部MR团队已达500人，原型机体验明年9月上线

人形机器人：2024 年融资超 110 亿前景广阔

年底买电脑应该怎么选？一文讲透华为智慧PC选购攻略

CR450，终于见面了！

华为新年礼遇活动开启鸿蒙加持打造全场景互联生态

山东鲁化森萱新材料取得一种二氧戊环萃取提纯装置专利，大大提高了对萃取罐内部的清洁效果

电脑清理方法：提升性能与使用体验的有效指南

6400mAh 电池、双频 GPS，iQOO Z9 Turbo 长续航版 1 月 3 日开售

中国一项“超级工程”，在海底建发电站，日本感叹中国太牛

详细步骤教你如何顺利安装Windows 10操作系统

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响