今年年初以来,ChatGPT概念股无疑是A股最牛的板块,板块内企业股价涨幅更是一路狂飚。作为其中的一员,云创数据也迎来了一波高潮。5月17日,云创数据收盘价创历史新高,截至收盘,云创数据上涨15.89%,收盘价为25.46元。
近年来,我国人工智能产业在技术创新、产业生态、融合应用等方面取得积极进展,已进入全球第一梯队。中国信通院测算,2022年我国人工智能核心产业规模达5080亿元,同比增长18%。
然而,云创数据所披露的业绩与股价上涨、市场高速增长表现截然相反。从业绩数据来看,2022年云创数据由盈转亏,亏损1482.41万元,综合毛利率连续三年下降。
因此也引来了监管接连问询,5月12日公告,公司于当日收到北交所下发的关于对公司的年报问询函,被追问涉及公司主营业务及毛利率、客户及供应商、应收款项、预付账款、存货、货币资金及短期借款、固定资产和在建工程处置情况、研发费用、其他收益、新产品情况等方面的多个问题。
云创科技虽在期限内对这些问题进行了回复,但监管仍然没有完全“放心”,于5月30日对其年报进行了二次问询。云创数据是否还能经得住考验?
对于资本市场上的概念炒作,大部分人早已见怪不怪,毕竟随着炒作热情的下降,资金开始缩小概念股炒作的范围,同时资金也开始相对理性,会把一些实在不靠谱的概念股踢出局,选择一些相对纯正的概念股继续炒作。
市场在历经非理性的炒作之后,最终还是会回归到价值投资的轨道上来,毕竟投机客过后,等概念股的投资价值回归到理性价位,真正的价值投资者才会考虑入场。很多真正的概念炒作标的,是真的能随着时间的发展爆发出业绩红利的,这才是那些概念炒作股里的真龙。
以ChatGPT概念股自居的云创数据会是这次风口上的“真龙”吗?
云创数据为政府、教育、工业智能制造等领域客户提供大数据存储与智能处理产品及整体解决方案。截至 2022 年 12 月 31 日,拥有 37 项授权专利,177 项软件著作权、88 项商标等资质。
具体而言,针对爆炸式增长的大数据、人工智能需求,云创数据研发了具有自主知识产权的 “智能存储平台”、“大数据处理平台”和“人工智能云平台”三大平台,并在此基础上以 算法生成模型,由模型验证算法,研发出可以不断自我优化的“核心算法+模型库”智能成长模式,作为企业技术核心能力。最终,构建出面向不同市场领域客户提供完整的大数据存储与智能处理解决方案。
根据其年报披露的信息显示,云创数据业务主要分为大数据存储和大数据智能处理两种。
在大数据存储业务方面,针对上述市场领域中庞大的数据存储需求,云创数据自主开发的 cStor 超低功耗云存储系统,搭载低功耗处理器开发的 64 位超低功耗硬件平台,可为用户提供超低功耗、高密度的云存储服务,单个国标尺寸机柜(42U)最大容纳 5,300TB 存储容量,功耗低于 9,500W,支持万亿级文件规模。
在大数据智能处理业务方面,针对上述市场领域中对大数据智能处理服务的需求,云创数据自主研发人工智能分析系统、工业智能平台、高维向量计算一体机等产品,为客户提供跨平台整合现有各种业务系统数据资源的能力,通过人工智能进行数据理解,通过数据挖掘分析创造数据价值,并提供大量的智能算法,真正实现智能易用。
从上述来看,云创数据确实在大数据及人工智能领域备战多年,但是其作为ChatGPT概念股,究竟能在哪些方面为生成式AI助力呢?是否已有成熟的产品建设?
北交所也在对云创数据的年报二次问询函中表达了对其ChatGPT概念股的质疑。
根据云创数据首次年报问询函回复称,“cVector向量一体机实现的功能与业内‘向量数据库’类似”(以下称“cVector一体机”),但相较于向量数据库是一种采用软件方法实现向量数据管理和计算的数据库,cVector一体机采用硬件加速方式进行向量计算,有助于解决前者在数据入库、检索环节的效率及准确性问题。同时,cVector一体机“主要目标客户群体包括:国内外做语言大模型提供类ChatGPT生成式AI服务的企业、需要通过自然语言搜索文献资料的单位、以及有大规模人脸识别需求的政企单位等”。报告期内,云创数据cVector一体机在部分智慧城市、智慧校园中有实际应用,产生经济效益696.03万元。
对此,监管要求云创数据结合报告期内cVector一体机在智慧园区的实际应用,说明其在各类人工智能场景中的具体应用环节,如何服务于各类生成式AI相关的企业;并说明在年报中披露cVector一体机“能够支持类ChatGPT等人工智能技术对算力要求极高的卡脖子难题”的依据及合理性,相关表述是否准确。
由此来看,云创数据的cVector一体机便是其能够以ChatGPT概念股自居的“宝剑”。据官网中介绍,cVector向量计算一体机是一款自主研发的亿量级人脸特征向量高速比对计算一体机,支持亿级大规模人脸1:N比对场景,采用并行计算架构融合高密度混合服务硬件支撑平台,为用户提供软硬件一体化的高性能大规模人脸比对解决方案。相较传统的基于GPU集群的人脸特征比对技术,具有高集成度、高性能、高兼容性、成本低、性能可弹性分配调度等优势。
目前,向量数据库确实已成为助力AIGC快速发展道路上一条靓丽的风景线。在今年3月的NVIDIA GTC大会,黄仁勋首次提及向量数据库,并强调对于构建专有大型语言模型的组织而言,向量数据库至关重要。向量数据库可以为AI的开发、增强内容生成的准确性提供了重要技术支撑。类似ChatGPT这样的AI模型在训练过程中,需要将输入数据转化为适合处理的特征表示,通常采用向量形式,以捕捉数据的各种属性和特征。
例如,在图像识别中,将图像转化为特征向量,其中每个分量表示图像中的像素值或其他特征;在自然语言处理中,可以使用向量来表示单词或文本的特征,以进行文本分类、情感分析等任务。这与云创数据的cVector向量计算一体机产品不谋而合。
向量数据库可以直接将数据存储为向量形式,其中每个向量代表一个数据对象。向量的维度数取决于数据对象的特征数,例如,一张图片可以表示为由像素值组成的向量,一个文本可以表示为由词频组成的向量。
通过优化的数据结构和索引算法,向量数据库能够更有效地存储和检索大规模向量数据,并支持高维度向量的相似度搜索和匹配。对于像ChatGPT这样的大模型,这意味着提供更精确和高效的查询结果,以及提升问题回答的准确性和响应速度。
但云创数据的cVector向量一体机是否真的有实力达到这种预期效果,还需等待其后续的回复。
当然,在问询函中,涉及最多的还是其业绩表现问题,这也是目前云创数据面临的核心问题。年报显示,云创数据2022年营收为3.75亿元,同比下滑21.38%;净利润出现首次亏损,达0.15亿元,同比下滑122.73%。同时,云创数据2022年综合毛利率为28.35%,同比下降11.02%。
具体来看,云创数据去年前三季度实现营业收入2.60亿元,净利润3539.91万元;第四季度实现营业收入1.15亿元,净利润-5022.32万元,与往年收入确认的季节性特征存在较大差异。
北交所在首次问询函中就曾要求云创数据说明其第四季度出现大幅亏损的原因及合理性,导致业绩下滑的因素是否将持续存在。
云创数据在首轮回复中表示,去年第四季度主要因疫情影响,公司的销售不及预期,收入同比2021年四季度下降48%,导致公司四季度营业利润下降。
然而,北交所在得到回复后,在二次问询函中对于其回复做了追问,要求出具更为详尽的披露,公司应结合市场需求变化、手持订单、主要项目验收进展,以及同行业可比公司等的情况,详细说明公司第四季度营业收入下滑的原因。
与此同时,在二次问询函中,北交所对于云创数据的主要客户、预付款项、委外研发几项也作了追问,要求其在6月13日之前回复相关问题,留给云创数据的时间不多了。
虽然随着大模型的爆火,类ChatGPT技术确实给云创数据带来了增长前景。
但是,向量数据库仍然是一个比较新的数据库领域,市场的认知与供给侧的实践均不够深入与多维。目前整个市场仍处于从 0 到 1 的阶段,主要由初创公司主导,真正的竞争可能尚未到来。
近日,星环科技重磅发布了自研的向量数据库Transwarp Hippo,作为一款企业级云原生分布式向量数据库,星环科技Hippo支持存储、索引以及管理海量的向量式数据集,能够高效地解决向量相似度检索、高密度向量聚类等问题。
星环科技创始人、CEO孙元浩现场演示了知识图谱的构建工具结合向量数据库、图数据库和大模型,所产生的效果。当问及中粮集团今年玉米收储价是多少,普通大模型不知道,再提问“新希望生产猪饲料的主要合作上下游企业有哪些?”仍然告知缺少行业知识,而当补充了农业知识图谱后,它可以告诉你最新的收储价是3元,以及价格的影响。另外,它也能够回答猪饲料的主要供应商是正大集团。
成立于中国上海的Zilliz,于2019年开源了全球首个向量数据库产品 Milvus,同时Zilliz也被官宣是NVIDIA的向量存储的官方合作伙伴。
Zilliz 作为向量数据库领域的拓荒者与奠基者,不仅开创了向量数据库赛道,也提供了世界上最快的向量数据库产品。Zilliz 产品生态丰富,致力于构建开源+云的大模型加强方案,其中开源向量数据库 Milvus 扮演着大模型知识库的角色;Towhee 可以为大模型提供编排服务;GPTCache 则为大模型提供缓存;Zilliz Cloud 可以为用户提供开箱即用的全托管向量检索服务。
就此来看,在这个领域,产品和服务将成为决定性因素。注重技术创新、性能和可扩展性、开发者友好性、安全和数据隐私、合作伙伴关系以及用户反馈,将是建立行业竞争优势的关键。
——END——