下载获取报告至公众号--营销人星球,每日更新
核心观点
在AIGC行业的数据服务领域,有11家北京市专精特新企业处于行业领先地位,平均研发强度超20%( 研发投入/营业收入)营收增长率超30%,平均每家企业软件著作权数量超50个
当前,主流数据集多以英文为主,中文数据集紧缺。根据360分析,中文语料数据集占比低于5%。此外,中文预料数据集质量差,数据集种类和内容缺乏多元化,专用领域数据集基本空白,在政府、医学、金融等公共领域的开源数据稀缺。对比之下,美国拥有大量的文本目标检测数据集。因此,中国AIGC产业链的数据集环节存在“堵点”
报告来源