“python的dataframe中如何基于某一条件对列数据做筛选”,刚学习python不久的数据猿一名记者通过ChatGPT问到,不到1s的时间内,ChatGPT给予了非常详细、准确的解答,如下图所示。ChatGPT是美国人工智能研究实验室OpenAI研发的聊天机器人程序,它能够通过理解和学习人类语言来进行对话,还能根据聊天的上下文进行互动,甚至能够完成撰写邮件、视频脚本、文案、翻译、代码、论文等任务。
ChatGPT应用场景展示,来源:数据猿制作
自ChatGPT的问世以来,在全球科技圈、甚至全社会引发了持续的关注和“震荡”,不少人纷纷讨论人工智能未来的发展潜力和对职场人士的挑战。与此同时,AIGC(AI Generated Content,人工智能创作内容)赛道“一夜之间”吸引了不少投资者的关注。
从一级市场的融资信息来看,根据全球早期资金调研机构CB Insight最新报告显示,2022年有110笔创投交易和ChatGPT概念有关,投资资金超过26亿美元。而ChatGPT概念领域中,目前约有250家初创公司,其中33%尚未筹集任何外部股权资金,51%融资进度在A轮募资、或者A轮之前。2023年2月,全球AIGC行业融资总额达35.3亿元,融资次数共计11次。国内AIGC行业融资总额为3.34亿,融资次数共计9次。
二级市场更是“疯狂炒作”。与OpenAI深度绑定的微软自2022年10月31日以来,股价最高上涨了33%(截止到2023年3月28日)。谷歌在3月初发布了同类产品Bard之后,股价最高上涨了近20%。与A/H股相比,美股的资金追捧简直是“小巫见大巫”。百度在1月底宣布发布类似产品之后,短短一个月股价上涨超过50%,昆仑万维在发布即将推出类似产品的消息后,股价在不到两个月的时间上涨208%,而且“一人得道,鸡犬升天”,与人工智能相关的领域,如算力、算法、大数据、芯片等领域,也都受到了资金的大幅追捧和炒作。
尽管ChatGPT和同类产品目前还没有完全放开使用,大部分使用者也都是受邀体验,依然难以抵挡投资者的热情,但是我们不禁要问,AIGC究竟是“昙花一现”还是一场科技变革的开始呢?为什么ChatGPT没有诞生在中国?中国企业究竟还有没有机会呢?……带着这些问题,数据猿联合创始人兼主编张艳飞组织了一场主题为“AIGC带来无限可能”的直播,邀请了网易集团人工智能专家、网易伏羲AIGC平台负责人赵增博士,达观数据CTO纪达麒,百炼智能CTO刘铎,深入探讨AIGC的相关问题。
新技术或者新现象的出现总会引发人们的热议,尤其是针对它可能产生的影响和未来的发展。AIGC同样如此,在热点发生之前,人们似乎没有怎么听过AIGC这个词,它为什么会一夜之间“爆火”呢?张艳飞就这个问题与几位嘉宾进行了深入交流探讨。
其实,对于人工智能领域中的业内人士来说,AIGC并不是一个陌生词汇。赵增博士认为,AIGC并不是突然“火起来”的技术,业内早在几年前就开始做相关的工作了。网易伏羲早在2018年就已经开始跟进AIGC的工作,只不过当时的称呼是“大规模预训练技术”。近期AIGC的“火爆”其实是因为三个方面的原因,产品层面来说,ChatGPT做了一个非常巧妙的举动,它把生成式的应用包装做成了对话式应用,并且免费开放给用户使用,降低了使用门槛的同时,扩大了用户群体。在概念层面,ChatGPT把原来专业的名称——超大规模预训练模型,改成了简单易懂的通俗名称——ChatGPT,降低了传播门槛。技术层面来说,ChatGPT在经历了长期的投入和跟进之后,确实有很好的应用效果,而且这种效果可以好到让普通人为之兴奋。
综合这三点,ChatGPT不仅在业内火爆,也成功吸引了“圈外人”的关注。既然已经成功的实现了“破圈”,不少人也纷纷开始憧憬和担心未来的职业发展。很多人喜欢把ChatGPT的出现和火爆比喻成苹果公司当年发布第一代苹果手机,众所周知,当年苹果手机发布标志着智能手机时代的到来,之后整个手机行业发生了“翻天覆地”的变化,功能机逐渐被智能手机取代……ChatGPT的使用效果反馈也很好,不少人认为,它的智能化水平基本可以替代60%的基础性工作了。那AIGC究竟是“昙花一现”还是科技变革?它的出现是否会带来颠覆性的变化,让很多白领工作者失业呢?
目前来看,让白领失业的可能性很小。AIGC更可能是一次科技变革的开始,刘铎从自身的业务出发,做了相关的介绍。百炼智能的主营业务是做B2B智能营销,用户在营销过程中经常需要写文案、发邮件等等,之前百炼智能也有尝试用人工智能的方式自动生成文案和邮件内容,但效果不够好,很多内容一眼就能看出是机器生成的,而不是人写的,但是从ChatGPT生产出的的内容来看,整体效果提升了不少,与用户对话时显示出的理解能力和语言组织能力也非常优秀。从这个角度可以看出,即便是没有ChatGPT,这个技术也一直处于研发和应用探索的过程中,而ChatGPT出来之后,在此类场景中就可以快速的应用和落地,所以它不会是短暂的“热点”,而更可能是新的方向。
纵观全球经济发展史,人类技术的发展史本质上就是一部效率提升史,虽然新技术的出现确实出现过让劳动者失去工作的情况,比如汽车的出现让车夫失去了工作。但是纪达麒认为,一方面,工作效率的提升使得劳动者的生产力得到了极大的释放,而企业的需求也将得到极大的释放,所以旧工种消失的同时,新岗位也在不断诞生。而且劳动者的工作效率提升之后,就可以有更多的时间去探索新的、有趣的工作,这本身也是技术提升劳动者生活品质的体现。另一方面,由于底层技术原理的限制,目前AIGC的能力还比较有限,它生成的内容还经常出错,甚至会出现常识性错误,只能作为工作的辅助,还不能完全替代人类。
由此来看,AIGC的“破圈”是人工智能技术变革的“开始”,并不会“昙花一现”的随时间消逝,从它的技术发展和实际效果来看,AIGC在未来一段时间内,更多的将扮演“工具”的作用,帮助劳动者提供工作效率,解放更多的时间和精力,同时更多的释放企业的新需求,让大家去做更加有意义的事情。
在看到了AIGC对于社会的重要性之后,近期也有不少网友在讨论一个问题:为什么ChatGPT没有首先出现在中国?于是很多人对照着过去几年来,国内互联网科技公司的业务发展与OpenAI这家公司的发展脉络做对比,含沙射影的批评中国科技企业的“短视”……这其实是一个非常尖锐、非常有“攻击”性的问题。橘生淮南为橘,橘生淮北为枳。ChatGPT没有首先诞生在中国可以从三个方面观察。
首先是国情方面。刘铎认为,像ChatGPT这类通用大数据模型的训练,需要大量的、高质量的数据,而国内目前的状况是,很多科技企业只掌握自己产品积累的数据,因此只能基于本身的数据做开发训练,而其他高质量的、海量的数据都在各种类型的APP中,根本无法获取,也就是说这种“数据孤岛”的现象阻碍了通用大数据模型的训练,因此很多企业难以进入,而且即便是涉足的企业,效果也可能差强人意。
第二是语言体系方面。赵增博士认为,从知识的分布上来看,英文知识的丰富程度要好于中文,比如:中文很难让模型写代码,绝大多数的编程语言还是英文体系。所以中国企业在做类似模型的时候不容易切入,比如:如果从英文开始做,那最终的模型如何在中文的场景中落地?如果从中文开始做,那中文的土壤天生缺少的一些多元知识,所以很多企业都会面临类题的问题,这个问题并不是中英文体系的问题,而是英文体系和其他语种体系的难题,在英文的体系下,有很多人参与到模型的训练过程中,而且训练完成后可以直接应用到它对应的场景中,所以从这个角度看,英文体系具有先发优势。
第三是科技企业的思维。纪达麒认为,中国和美国的商业氛围不一样,中国绝大部分科技互联网企业做的都是商业模式的创新或者应用创新,很少有对技术的崇拜,技术创新的企业非常少,成功的案例就更少。而美国的很多企业,他们在思维上与中国不同,他们会想如何做一些技术突破,然后在此基础上做转化,然后做更多的应用,所以ChatGPT即便已经有了不多的效果,到目前为止还没有在商业上做出亮眼的成绩。中国企业更喜欢考虑商业化,因为这样才更能快速的体现价值,给人成就感。
整体来看,AIGC没有“首发”在中国并不是简单的所谓“企业短视”,这与中国的现状、中文语言体系和科技企业的思维方式有很大关系。而要想解决这些问题,并非一朝一夕之力,也并不是只要企业努力就能能够解决的问题,环境的改善需要每个人的共同努力。
在AIGC的这轮“竞赛”中,中国科技企业虽然没有拿到全球“首发”权,这是不是意味着中国企业没有机会了?中国科技企业是否还有优势呢?张艳飞抛出的这个问题,引发了嘉宾的热烈讨论。
想要回答个问题,还是要回到人工智能的底层架构上。
人工智能核心的部分有三个:一是算力,二是算法,三是数据。在算力方面,中国与其他发达国家的差距并不算大,所以在人工智能的“军备竞赛”中,算力不会给科技企业“拖后腿”。在算法方面,虽然目前的技术暂时落后于某些巨头公司,但是刘铎坚信,没有一家公司在技术上永远一家独大,当这条道路跑通了之后,国内科技企业在技术上的追赶速度会越来越快。像百炼智能的人工智能领域创业公司,其实已经开始运用ChatGPT的部分功能了,而且从用户反馈看效果很好。
在数据方面,由于中美的环境和科技“土壤”的不同,国内更可能在细分领域具有优势。赵增博士认为,像ChatGPT这类通用大模型,国内企业由于获取数据的质量和数量都很难保证,所以短期实现赶超挑战较大,但是对于细分领域则完全不同,不少科技企业在细分领域具有丰富的数据,而且这些数据的质量很高,因此训练的AIGC产品体验更好。根据赵增博士所在团队的实践看,由于网易伏羲团队训练模型使用的数据,有很多艺术家和专业人士参与共建,所以目前模型在艺术图像领域中的辨识度、理解力和审美都有非常好的表现。因此,垂直类的机会更可能成为中国科技企业的优势和机会。
当然,很多时候人们在谈论超越、竞争的时候,往往习惯于忽略标准和定位的问题。比如中国企业的大模型要超过外国企业的大模型,究竟在哪些层面超越对方呢?纪达麒认为,企业需要从战略上做好定位,其实并不一定要在通用大模型上超越,假如针对某个APP、甚至某个APP的具体场景上,痛殴内部训练、内容生成等,做到效果比通用大模型要好,这也是一种超越,而且从这个角度看,其实每个企业都有机会。在纪达麒看来,价值并不是大模型,而是大模型能够解决的问题。所以没必要直接与ChatGPT这种大模型“硬碰硬”,做好战略定位也可以创造价值。
按照战略定位的思路出发,不少新的机会就会重新浮现在眼前。的确,如果站在商业的角度看,中国科技企业的机会和优势依然存在,ChatGPT的赛程才刚刚开始。站在国家安全的角度看,中国市场对于人工智能的需求非常强烈,由于数据安全和数据隐私等原因,中国必须有自己的企业打造出大模型和其他各类应用模型,因此这条道路非常明确。
AIGC的“火爆”并不是一个短暂的热点,这是一场科技变革的开始,变革的“导火索”就是大洋彼岸的ChatGPT产品。虽然国内科技企业失去通用大模型的全球“首发”的机会,但是科技企业的机会和优势依然存在,中国的“土壤”上一定能够生长出更加适应本土的AIGC产品,能够落地更加符合中国市场需求的场景解决方案。
以前AIGC是一层“迷雾”,每个人都看不清未来前进的道路和方向,而现在迷雾消散了,一条跑通的道路展现在所有人眼前,当下正是要坚定信心往前冲的时候。
文:赢家 / 数据猿