最近ChatGPT成为互联网史上最快用户破1亿用户的应用,感觉今年A股市场的人工智能板块要真正起风了。我开始关注人工智能大约是2015年,有个中学同学是人工智能方面的大牛,有着诸如中国国际机器人专家委员会理事会理事等不少牛的头衔,当时听他讲了不少人工智能方面的信息,一晃7年过去了,现在终于等到A股市场上可能要起风了。
现在有人提出ChatGPT之类的人工智能应用将引领数字劳动力时代,它将是生产力的第五次革命,在新的一经济时代,用工模式将会快速演变。目前人员用工模式有全职员工、外包员工、兼职员工三大传统的用工模式。现在出现了第四种用工模式,即数字化的劳动力,打破了人与机器的边界,依托人工智能技术,包括NLP相关技术,自主完成或者协助人类完成各种工作,比如前端对客或者员工文案的工作等,或者中后台运营协同的等工作。在传统劳动力跟数字劳动力的结合下,通过NLP技术赋能,让传统劳动力爆发出更高效增长力。根据麦肯锡相关预测,到2030年数字化劳动力将在中国形成一片价值1.73万亿元人民币的市场。而纵观当下中国,人口红利正在逐渐消失,但数字化浪潮一路高歌猛进。面对人力短缺、成本上升及人效不足等诸多挑战,企业正积极寻求创新,利用数字化技术,打破人机边界,推动用工模式的深度转型。
关于拓尔思,根据自己的思路整理了一些它的相关信息:
一、拓尔思的简要情况
拓尔思目前主要产品包括几大块:人工智能平台、大数据平台、数据安全平台。拓尔思所有的人工智能应用来自于公司对各种算法模型的积累。在A股市场横向比较,其掌握了大量数据资产,2000多台服务器分布在全国的几大数据中心,每天日增1亿条的开源的互联网的数据,公司已经积累了将近1300亿条开源的数据资产。拓尔思已经积累了 350 种以上的算法,并且对每个场景,如知识图谱的展现、知识库的建立档案、包括前期数据采集、数据的标引,关于数据要素的环节,都有自己以完全知识产权的软件平台。自有的搜索引擎是公司自然语言处理的核心应用技术,在全国大量企业级的搜索都在用 ELSG 的设计 spark开源软件的时候,公司完全做到了自主可控,应用到政府、金融,包括媒体等诸多行业。
二、拓尔思在某些垂直细分领域建立了较高壁垒
拓尔思在政府门户网站建设处于头部位置,组成部门80%的部委门户网站是拓尔思承建的,省和直辖市的门户网站50%是拓尔思承建的。而这个赛道上的第二名是开普云,其在部委级政府网站和省级政府网站分别占10%和17%,拓尔思遥遥领先第二名。而其中拓尔思有一个最大的优势就是人民政府整个政策库是拓尔思承建的,拓尔思有全量最完整的政策,并将一个政策打上多维度标签进行分解,从而建立了拓尔思的查询搜索系统,且为未来在信创维度一大潜在增量空间埋下了自主可控的伏笔。
壁垒方面就简单写这些吧,理解的人自然理解,省点篇幅。
顺便说句题外话,拓尔思在整个门户网站建设过程中间,不仅提供大数据和人工智能的平台业务,每年还持续提供推送经过加工过的数据的服务,比如证监会、上交所和深交所都是拓尔思的用户,每年为其创造从几十万到几百万不等的收入。
三、拓尔思某些业务信息整理
1、机器写作及延伸服务方面
由于人民政府的政策库由拓尔思承建的,各级政府部门每天发布的上千条的政策,通过大量的知识图谱进行关联分析,最后就可以辅助做公文写作。全国现在涉及公文写作的有大约400万人,这是很大的需求市场,比如在南京和成都等地拓尔思都有实际应该落地。对于大单位一年的服务费是20万元,对于小单位一年的服务费是1万元。
另外针对全国的媒体单位,拓尔思在全国120个垂直媒体中间的大约40个头部媒体是拓尔思的客户(与拓尔思合作的媒体包括包括新华社、人民日报等),在使用拓尔思的机器写作。如现在媒体重点宣传的主题,用拓尔思的机器的话先合成,再修改,大大节省人力成本。另外举个例子,《中国教育报社集团》有两报四刊,在全国的服务对象是全国所有的教育局,还有28万所中小学校,2800所高校,拓尔思现在已经打造了完整的传媒智库,采用订阅式服务,一个学校一年的收费标准是1万元,拓尔思推送整个教育系统内部数据加工的知识成果,由教育报社集团他们的发行渠道发售,拓尔思和其共同分成。这个模式创新做出来之后,现在还有30多家媒体和拓尔思和拓尔思进行了初步沟通,后续力争逐步开始落地。
2、政府服务方面
比如拓尔思在22年上半年在浙江省完成了一个重大项目——浙江政务运行大平台,里面有一个政策大脑项目非常具有典型意义,这个项目有很多丰硕的成果,后续很多省份去参观了,这些省份接下来在政务打数据应用的过程中将有望形成新的投资项目。
另外,比如拓尔思产业大脑的产品,现在一些地市和区县级的发改委、财政局和税务局,有大量的需求,采用定制服务的方式,每年支付拓尔思2-5万元不等的服务费。
3、专利搜索方面
这项业务潜力比较大,篇幅会比较长一些,如果做得好,足以再造不止现在一个拓尔思的市值。
拓尔思现在正在跟国家知识产权局深度打造专业的咨询服务,整个国家知识产权局现在2万多专利评审人员,80%的时间都在拓尔思的三大平台上进行工作(换句话说拓尔思在此领域建立了很高的壁垒),这就是拓尔思长期积累的知识。国家知识产权局有全国最全的专利库,还有每一年向世界主要的专业大国交换回来的专利,但是这些文本信息都是一篇一篇的专利原作,拓尔思对原作进行语义智能的分区,进行各种各样的标义,接下来在申请专利的过程中间,公司专利申请人员对于整个专利申请的流程包括整个专利检索的这些专业的知识,就能够打造公司专业的技术服务。
拓尔思的产品围绕国家知识产权局的专利大数据应用,拓尔思正在打磨专利检索产品,中国2021年有680万件专利申请案,授予了30万件发明专利,45万件实用型专利,50万件外观专利,整个授予的过程中间它不是针对专利申请人的,全国6800多家专利代理事务所,现在中国最大的专利代理所是贸促会的代理所,每年其整个营收将近百亿元。作为企业端来讲,像华为和国家电网每年要花数十亿元在专利相关事宜上面。针对专利,代理所整个服务的全周期不仅仅包括申请专利,还有专利的部署、维权和诉讼等。在这个过程中间,需要大量的查询服务,需要对科技路径的分析。在这个市场上,美国有一个公司叫做科睿唯安现在市值大约75亿美元。国内有一个公司是苏州的智慧芽(2021年营收大约2亿元人民币),据说其最新的估值大约20亿美元(截止23年2月3日,拓尔思市值136亿元人民币,几乎与目前智慧芽的估值差不多)。拓尔思切入这个市场,与智慧芽相比具有优势,一个是数据,第二个是拓尔思自己的检索平台,背后还有潜在的安全问题,智慧芽因为有着外资投资人的因素,目前进不了所有央企和相关涉及单位。而专利查询检索是一个百亿元规模的服务市场,拓尔思现在开发的第一款产品叫基因专利检索平台,刚在去年底用中英文发布,面向全球用户,包括全球大量生物制药公司和研究院等。另外,围绕着十大新兴产业,包括微电子、新材料等,拓尔思将持续推出相关专利服务。预计到2023年共有4个库能够成型,到24年10个库全部成型。对于营业收入,展望23年计划实现营收5000万元,24年计划实现营收2-3亿元。
4、企业服务方面
金融行业举例:为金融部门的智能风控和智能营销提供服务,比如拓尔思有一个产业大脑,针对全国2万多个开发园打了电子围栏,对围栏里面的所有企业按照整个产业链的维度,进行了多维度的数据关联,并加上了专利分布的科技创新能力,为金融贷款和金融服务提供一些营销工作。拓尔思的金融产品收入增速较快,其中智能风控系统21年收入2000多万,而22年前10月收入已达到5000万;又比如围绕着地方金融监管的一个产品21年收入是2600万,22年前3季度已经做到了4800万。对于产业大脑产品,拓尔思做了分析,全国的几千家金融单位,全国所有2800哥县级单位的招商局、发改委、财政局和税务局都将是拓尔思的潜在客户,成都市已经通过拓尔思的代理商做出了一个样板。
能源行业举例:对于国家电网和南方电网,拓尔思的合作业务围绕着其科技情报查询、智能合同审核、智能风险评估等。拓尔思还参与了国家能源网、能源大数据建设。
制造业举例:整个海尔集团营销平台的大数据应用,包括客户服务和大数据应用也是使用拓尔思的产品。
5、法律咨询方面
在法律咨询市场,根据司法部数据显示,全国年办理各类的法律事务事件大概是1300万件,相当于我们涉及到诉讼或者是非诉讼的大概 1300 万件。按照中国的律师平均费率是大概一个小时2788,每个案件平均服务时长十小时来算,整个法律的咨询的总体市场规模达到 3600 亿元。
拓尔思正通过跟律所合作打造公司的法律的知识库,因为整个法律咨询不可能出现万能的,什么样的法律知识都懂的律师,背后有一系列知识库的连接。拓尔思有自己的知识图谱的研究院,多年以来在开源情报这方面持续实现了一定比例的收获,并且还有很好的增长趋势,基于对整个的开源情报的分析,各种各样的数据的采集加工,不断迭代,形成了公司自己的知识图谱的各种各样的算法。
6、虚拟人和机器人方面
拓尔思做了一些布局(比如虚拟人方面和广东省在新农人样本工程的合作;比如拓尔思与优必选、小米等在两轴机器人方面的合作等等),这篇文章写得已经太长,就不展开写了。
7、搜索信创方面
这是拓尔思一个潜在的发力点。国内很多的搜索引擎数据库是与国外Elasticsearch相关的,且是开源的。国内大量应用软件开发商在开源构建上自己的搜索功能。现在信创来了之后,很多人在讨论开源数据的不可控性,虽然其很好用,但开源一旦给你关门了,它整个架构不再更新了,就可能带来安全隐患,还有数据的泄露,比如战争,Elasticsearch把整个的服务给停了。而在国内Elasticsearch靠什么收费,主要靠几个云平台,在云平台承载过程中是收费的,现在国内有大量企业用到阿里云、腾讯云、百度云,实际上它的内核是用的Elasticsearch设计、进行分装的。这就带来了一个安全可控性的问题。而拓尔思作为信创工委会的成员之一,已经用拓尔思具有自主知识产权的产品实现了一些成功替换的案例。比如信用中国(由国家发改委和人民银行指导)和国家企业信用信息公示系统(国家市场监督管理总局旗下的系统),这两个数据库以前用的也是基于Elasticsearch设计的,现在替换成了拓尔思的产品。
据相关测算,全国如果把Elastic替换掉,全国是百亿级规模的市场空间。不过需后续安可领导小组首先在台账梳理的过程中对这个事情制定相关的目标,因为目前搜索引擎数据库没有拉原来信创数据库的名单。但这同时是拓尔思面临的搜索引擎发展机会,自有的且国产的安全可控搜索引擎数据库代替开源的搜索数据库,这将是拓尔思未来业绩值得期待的重点之一。另外,说明一点:拓尔思的目标市场不是去替代百度这种大搜,而是针对企业级搜索进行替换,即企业内部业务系统的搜索引擎。
总结一下,虽然以拓尔思这样的企业规模,目前无法推出ChatGPT那样大而全的人工智能产品,但它在某些垂直细分领域已经做了很多布局,建立了某些壁垒,具备了一定的核心竞争力。从2021年开始,拓尔思进行战略的转变,在已经获取了1万多家大B和大G的客户基础上,后续将向发力小B和小G的客户,最后到C端(虽然C端目前还没有直接的收入,但已经做了很多有益的尝试)争取向十万级及以上的用户发展。拓尔思未来几年的营销目标是每年保持30%以上的营收增长(最近看的拓尔思的交流纪要里面有提到30%这个目标是保守的估计)。
拓尔思值得投资吗,我没有答案,这里仅仅是希望抛砖引玉而已。我个人目前持有拓尔思,之前的帖子里面写过,我不确定会持有多长时间,故请务必注意风险。作者一起666