当前位置：首页|资讯|华为|科大讯飞|AI大模型

华为与科大讯飞联合打造中国首个超大规模国产算力平台“飞星一号” AI数据湖存储底座

作者：华为中国政企业务发布时间：2024-03-22

华为科大讯飞 AI大模型

科大讯飞作为亚太地区赫赫有名的智能语音和人工智能企业，拥有语音及语言国家工程实验室和认知智能全国重点实验室。面对业界百模大战，谁可以快速部署高性能大模型训练平台，快速训练上线，谁就能先一步抢占市场有利位置。

为此 科大讯飞与华为联合打造存、算、网全栈国产化的AI大模型解决方案，共同建设国内首个支持万亿参数大模型训练的算力平台“飞星一号”。

科大讯飞作为亚太地区赫赫有名的智能语音和人工智能企业，拥有语音及语言国家工程实验室和认知智能全国重点实验室。面对业界百模大战，谁可以快速部署高性能大模型训练平台，快速训练上线，谁就能先一步抢占市场有利位置。

为此科大讯飞与华为联合打造存、算、网全栈国产化的AI大模型解决方案，共同建设国内首个支持万亿参数大模型训练的算力平台“飞星一号”。华为AI数据湖解决方案，基于多套OceanStor专业存储分级建设，提供几十PB超大存储容量。依托智能数据分级与多集群故障隔离、高效数据治理的高性能存储，为客户提供TB级带宽，端到端加速AI模型开发。

大模型建设中遇到了哪些问题？

星火认知大模型从海量数据和大规模知识中持续进化，实现了从提出、规划到解决问题的全流程闭环。人工智能技术从感知理解世界的专用领域向生成创造世界的通用领域进行跨越式演进，这一过程产生了对数据存储的新挑战：

数据治理困难

AI训练集的文件数量有百亿个，当前“烟囱式”存储集群的建设模式，形成多个数据孤岛，数据需要人工迁移，效率低。同时无全局数据可视能力，无法识别冷热数据与高价值数据，数据难以治理。

GPU利用率低

AI大模型训练以多机多卡任务为主，故障频率高，模型加载和断点续训CheckPoint读写时，对存储系统IO和带宽性能要求很高，千卡以上集群平均每天故障1次，断点恢复时间高达15分钟+，每次损失几十万。

集群分散不可靠

多家存储“烟囱式”建设，总容量几十PB，切分成几十个PB级的分散小集群，极大地增加了管理复杂度，并采用软硬分离的方式建设存储集群，降低了存储集群的可靠性同时也降低了带宽能力。

综上可以看到大模型厂商对存储的核心诉求是：

1、高性能的存储底座，以便支撑多机多卡的AI集群极致的训练时长和尽可能快的断点续训能力，降低错误回滚率。

2、统一的AI存储数据湖管理能力，高效可靠的数据治理能力。

优质存储成为大模型时代的“黄金门票”

华为数据存储与科大讯飞联合打造中国首个超大规模算力平台AI数据湖存储底座，针对通用AI大模型训练，科大讯飞采用算、存分离架构，计算侧追求更加极致的算力释放，存储侧部署多套华为OceanStor AI存储，提供可靠高效的几十PB可得容量。

15min->1min，断点续训恢复速度提升15倍，日节省几十万￥

断点续训恢复速度提升15倍：集群最大提供TB级大带宽，缩短CheckPoint读写耗时，断点续训恢复时长从15min缩短到1min，速度提升15倍。

集群管理，99.999%高可靠

存储集群安全可靠：华为OceanStor AI存储单集群多Storage Pool的方案，管理面合一，数据面分离，通过数据面隔离避免AI集群故障扩散；同时通过亚健康管理、大比例EC等进一步提升存储可靠性，单集群可靠性达99.999%。

全生命周期管理TCO降低30%

数据治理成本低：统一数据湖管理，GFS全局文件系统，无损多协议互通，免除数据孤岛，数据全局可视、可管，高效流动，跨域调度效率提升3倍，数据零拷贝，端到端加速AI模型开发；千亿元数据秒级检索，智能识别数据热度，精准分级，实现存储系统性能与容量均衡。

面向未来更大规模算力集群，华为OceanStor AI存储专为AI而生，与科大讯飞联合打造中国首个超大规模算力平台AI数据湖存储底座，借助海量数据和知识加速星火认知大模型持续进化，共建“让机器能听会说，能理解会思考，用AI建设美好世界”的美好愿景！

本文转载自：华为数据存储

报名参与【华为中国合作伙伴大会2024】

你的每一次“在看”，我都看得见！

推荐体验

相关资讯

科大讯飞联合华为打造算力底座「飞星一号」

科大讯飞董事长刘庆峰在 2023 全球 1024 开发者节上宣布，公司已联合华为打造基于昇腾生态的自主可控大模型算力底座「飞星一号」平台，讯飞星火大模型将开启对标 GPT-4 的更大规模训练。刘庆峰表示，中国现有的大模型跟 GPT4 比都还是实实在在有差距的，所以我们必须正视差距并实现超越。

科大讯飞华为 GPT-4

2023-10-24

科大讯飞联合华为打造算力底座“飞星一号” 对标GPT-4开启更大规模训练

证券时报e公司讯，10月24日，科大讯飞董事长刘庆峰在2023全球1024开发者节上表示，公司已联合华为打造基于昇腾生态的自主可控大模型算力底座“飞星一号”平台，在此基础上，讯飞星火大模型将开启对标GPT-4的更大规模训练。

科大讯飞华为 GPT-4

证券时报 2023-10-24

全国产算力平台“飞星一号”的首个成果讯飞星火V3.5发布

启用后的90多天里，讯飞星火步履不停，基于“飞星一号”，启动了对标GPT-4的更大参数规模的大模型训练，带来了这场讯飞星火V3.5升级发布。刘庆峰介绍，奇瑞汽车出口的国家覆盖英语、俄罗斯语、西班牙语、阿拉伯语…

北青网 2024-01-31

全国产算力平台“飞星一号”的首个成果发布：讯飞星火V3.5来了

1月30日，科大讯飞举行星火认知大模型V3.5升级发布会。科大讯飞董事长刘庆峰、研究院院长刘聪正式发布基于首个全国产算力训练的讯飞星火V3.5，七大核心能力全面提升，数学、语言理解、语音交互能力超GPT-4 Turbo，重磅升级星火智慧黑板；正式发布星火语音大模型，首批37个主流语种效果超过OpenAI Whisper V3，赋能讯飞翻译机迎来全新升级助力更自由沟通，推动万物互联时代下客服、汽车、机器人等场景人机交互变革。大模型应用加速落地，星火开发者超35万生态增长迅猛，打造个人应用赋能亿万用户；讯飞星

科大讯飞 OpenAI GPT-4 Whisper 客服

锌刻度 2024-01-30

全国产算力平台“飞星一号”首个成果：对标GPT-4，讯飞星火V3.5发布

科大讯飞董事长刘庆峰、研究院院长刘聪现场展示了七大核心能力的全面提升，数学、语言理解、语音交互能力超GPT-4Turbo；正式发布星火语音大模型，首批37个主流语种效果超过OpenAIWhisperV3；重磅…

GPT-4 科大讯飞

观察者网 2024-01-31

近期资讯

餐饮难做，都怪社区小店太多？

餐饮成功三要素：产品力、单店盈利模型、扩张节奏。

红餐网 2024-12-27

大动作，宁德时代深夜官宣

为进一步推进全球化战略布局，宁德时代宣布赴港上市，或可达到不多于30日的快速审批标准

中国基金报 2024-12-27

SpaceX的商业版图和太空经济的崛起

SpaceX超越字节跳动，成为全球市值最高的私营公司。

硅谷101 2024-12-27

“暗流涌动”，显示行业正在经历变局

巨潮 WAVE 2024-12-27

不只是恋爱，女性向游戏开始洗牌

被低估的女性向游戏，内容比标签更重要

消费纪 2024-12-27

女性向游戏过“男”关

放不放男人进来。

娱乐硬糖 2024-12-27

台湾年轻人，疯抢泡泡玛特

盲盒经济走到哪里都是通的

真故研究室 2024-12-27

15大机构十年研究证明：无约束AI必然超越人类，创造能力也更强

大脑与AI的结合

新智元 2024-12-27

普通人看见普通人：当探店博主走上台前

人民的米其林

远川研究所 2024-12-27

新茶饮11月开店1111家，寒风吹向酸奶、柠檬茶

冬季的新茶饮，开店难。

茶咖观察 2024-12-27

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1