数据标注, 正迎来关键洗牌时刻。近日, 量子位发布《中国 AIGC 数据标注全景报告》, 报告提到大模型从训练到部署应用迭代,AIGC 众多垂直场景落地, 通用智能、具身智能等前沿领域探索, 都与高质量、专业化的场景数据密不可分。
作为基础服务, 数据标注也从未像今天这样受到关注。尤其是作为新兴赛道地合成数据服务, 潜在市场空间巨大。据量子位智库预计, 国内 AI 基础数据服务市场规模将达百亿规模, 约占全球市场 10% 份额。其中合成数据作为衍生出来的新赛道, 存在巨大市场空间, 增速超 40%, 成为增速最快的细分赛道。
所谓合成数据, 即是用计算机视觉以及图形学等技术生成数据而非通过原始数据的采集而产生, 能够用来训练、测试和验证大模型以及各类智能体所需的算法等应用。OpenAI CEO Sam Altman 曾放言:未来所有数据都将变成合成数据。