近日马斯克等发公开信,呼吁暂停训练比GPT-4更强大的AI系统,至少6个月!原因担心“AI可能杀死全人类”,反正说的挺吓人的。我认为这个消息反而对我们是重大利好,因为欧美如果暂停,我国GPT不就迎头赶上了么!
目前AI领域3大核心是数据、算力、算法,数据将成为如ChatGPT等AI大模型的核心竞争力,高质量的数据资源可让数据变成资产、变成核心生产力,AI模型的生产内容高度依赖源头数据。
而“中国版ChatGPT”的痛点就是目前中文语料学习库少,中文公开语料远不足英文,ChatGPT中文资料比重还不足千分之一,为0.09905%,而英文为92.64708%,“中国版ChatGPT”如果要把中文回答做好,就需要大量高质量的中文语料。国内跟随做类似chatgpt的大厂(百度,360,字节,阿里,腾讯.....),也需要优质中文语料。
针对这个痛点,中国信息通信研究院现启动大模型技术及应用基准构建工作,针对当前主流数据集和评估基准多以英文为主,缺少中文特点、文化以及难以满足关键行业应用选型需求等问题,联合业界主流创新主体共同构建一套涵盖多任务领域、多测评维度的基准及测评工具AISHPerf-LargeModel,推动我国大模型技术及应用的引领创新。
网络文学为最大的内容源头,当前大量优质网文IP尚未被挖掘和开发变现,而AIGC加快发展产能,推动海量IP跨模态变现。AI技术成果可应用在文字辅助创作、实时对话互动、动漫画及影视创作等场景,服务广大内容创作者,打通IP衍生全产业链商业变现。拥有中文语料、专业数据资源及数据处理的公司或将持续受益于AI大模型发展。
掌阅科技
公司第二大股东是字节(约10%股份),且有自己的版权产品(属于中文语料库),公司主营业务为互联网数字阅读服务及增值服务业务,以出版社、版权机构、文学网站、作家为正版图书数字内容来源,对数字图书内容进行编辑制作和聚合管理,面向互联网发行数字阅读产品,同时从事网络原创文学版权运营,电子书阅读器硬件产品研发及销售
平治信息
移动阅读,电信增值业务等,快手元宇宙合作伙伴,近期要推出自己的小说大模型。公司先后推出了超阅小说、知阅小说、花生阅读、三更小说、灵书阅读等多个自有阅读平台。公司作为综合性增值电信服务提供商,集内容、服务、运营支撑于一体,有声阅读产品突出,是咪咕传媒、中国联通阅读基地、天翼阅读最大的内容提供商之一。
每日互动
则是掌握了几亿人的数据入口,是国内拥有个人数据标签最多的公司,专业的数据智能服务商,服务对象包括人民日报、京东等数十万APP
中文在线
是市场上唯二(另一个是阅文)的具有大量文字版权的公司,语料库就是AIGC的“矿产资源”;公司和澜舟科技(做NLP大模型的小独角兽)合作不是今年ChatGPT火起来才开始,去年9月就开始了,一直在用AI录有声书和AI辅助创作。澜舟创始人周明之前就是微软的;
最后一只最具潜力
理由一:旗下子公司具有一定的垄断特性,该子公司中文数据量是国内首屈一指的。如果大量的通过该子公司的数据库来训练,能给“中国版ChatGPT”带来很大的进步。
理由二:公司控股股东是国资委,背靠大树好乘凉。
理由三:技术上主力洗盘充分,处于历史低位10元以下,近期处于上升趋势,成交量堆量,上涨放量下跌缩量,筹码集中且没有松动,说明主力还在收集筹码,准备干一波大的,我也非常看好这股启动一波主升浪,今年至少80CM。