目前这个阶段我们谈到“元宇宙”的时候,还是在消费层面,但是不管是过去的PGC还是UGC一直到现在的AIGC,都是从不同的生产方式来讲的,这一点是非常有启发性的。国家文化数字化战略就是从供给侧入手的,我们叫发力供给侧,激活文化资源,推动文化生产体系现代化。
就目前来说,在元宇宙的初级阶段,主要还是从消费层面做,也应是数字化文化消费的新场景,而且是数字化文化体验的一种形式。但再往前走,实际上已经进入到一个比较高的阶段,由实现生产和消费统一来推动文化元宇宙的发展会更好。
从目前非常火的ChatGPT谈起,ChatGPT带来的启示有两点,一个是数据如何保真,这个可能是大家非常关心的问题。数据的保真可能是下一步人工智能发展一个非常重要的充分必要条件。如果说数据不能做到保真,人工智能发展的方向可能就会出现一些不应有的失误。
目前ChatGPT训练的数据集来源大体上分为六类,包括维基百科、书籍、期刊、互联网的网站等等,训练的数据集在GPT-3里面实际上总量应该有3000亿的词汇,有1750亿的参数,如果没有这样一个数据量训练的话,人工智能发展确实有很大制约。
在大家测试聊天机器人水平的过程中,有些人已经提出了一些问题。第一个大家比较关心的问题是互联网上的数据并不都是准确的,当错误的数据量足够大的时候,就会导致得出的结论也是错误的。有一个案例是基于GPT-3的医疗聊天,机器人曾经建议病人自杀。这可能是个案,但如果个案过多,就成了普遍性的问题,归根结底就是数据的保真问题。而且现在所有的人工智能模型的学习都是基于一些历史数据,还有一些社会学学者也在研究,有可能这些数据当中存在不必要的偏见,这种偏见也会导致社会的排斥和歧视。所以,扣好文化元宇宙第一粒扣子非常重要,这是AIGC的充分必要条件,也是开发人工智能非常重要的条件。
来源:文化无字宙专业委员会