写这个专栏是因为很多人前些天与我探讨我转发的那个动态。当时受限于字数没有展开,结果发现在一些人的理解里造成了误解。因此我决定简单展开分享一下我当时的想法。首先先截屏一下当时的转发,原动态准备删掉了。
然后转发的视频也给一个传送门。
我的想法大概分成三点,一点是认为说Ai绘画一定不算是创作,以及为什么它不能够算是一种创作。但与这个点相关的,我同时认为简单的剪辑,尤其是类似于综漫AMV这类的创作,很容易被Ai去做一个替代。(没有人替代的主要原因就是市场不够大,做了也没啥经济效益)
第二点是认为,我们正在见证人工智能大踏步地朝向智慧生命前进,以一种可能大部分人还没有能够意识到的方式。
第三反而简单了,就是见证历史。以及关于见证历史的一点想法。
时间有限,不会展开去做极其严谨的论证,只是分享感受。反正大家善意讨论就好。
一定要注意,我说了,以下的东西只是我的想法,不代表就是事实。
其实上面那个视频基本解释了为什么我个人认为,目前的Ai技术已经可以去完成综漫AMV的剪辑了。实际上人类目前位置最抽象的表达方式就是语言。或者说就是文字本身。文字本身是没有意义的,它需要联系到或是具象或是抽象的(或是物质或是意识的)存在,它才能有意义的。而当文字都可以凭借大数据的投喂给出清晰的逻辑的时候,画面的组接作为远比文字要具象得多的存在,其实难度理论上来说应该是更低的。
正如那个模型解释的那个样子,我们可以其实已经可以基本想象出Ai混剪会是什么样的一个制作逻辑。我这里简单提一种可能:
第一步,提纯。首先把尽可能多的番剧或者影视作品输入Ai。让它先拆分出镜头来(PR的场景编辑检测功能),然后针对景别大小做第一步区分(PS选择主体然后做面积比较),然后根据镜头运动方向、镜头内事物的运动方向,做二级区分(跟踪、摄像机反求)。
第二步,基于提纯的素材库做双镜头之间的拼接。任意选择一个镜头,给到这个Ai,它基于剪辑规则(其实就是类似景别、相同动势)去做一个拼接。如果文字都可以实时想象下一个字,训练一个Ai完美的找到一些镜头,能够跟某个镜头组接在一起,这个一点问题都没有。
第三步,重复第二步的过程,直到组接越来越多的镜头在一起,形成镜头组。
第四步,配乐。加上音乐,然后把音乐的动态和音高,乐器的选用,进行量化,赋值。同样通过大数据投喂去精确识别每一首歌的情感含义。对于已经能写歌的Ai来说,分类简单多了。
第五步,去让镜头组和配乐做匹配。然后对于匹配度赋值。可以把配乐理解成说话的语法。基于语法模型对语言进行修正,在上面分享的视频里,它是通过优质学习材料的投喂实现的。我们同样给它投喂高质量的剪辑,告诉他,基于什么音乐,什么样的镜头组接是对的,是好的。
第六步,其实基于上面的已经可以出成片了。但我们可以鼓励它做创新。就像上面那个视频里,鼓励语言模型创新的方式一样。适当放宽标准允许它放飞自我,然后对它放飞自我的结果进行打分。剩下的交给它自己进化了。
基于我从那个科普视频里收获的理解,我只觉得我上面所想的这一套逻辑,已经没有什么环节是还不成熟的了。目前只是因为这个Ai做出来没啥用,所以没有人开发出自动混剪的Ai罢了。
但由此主要是想深入拓展,讨论为什么这样的过程不能算创作。由此我决定先拿Ai绘画开刀。
创作这个过程中,最重要的是什么呢?我个人认为,应该是创作者的想法表达。哪怕是很多人觉得完全无法理解思路的后现代艺术,它也依然客观存在着,创作者在完成它的时候,所持有的一种想法。
也就是说,创作这个过程,可以被拆分成这样的过程:
step1 创作者有了一个思路
step 2 创作者做了某件事情
step 3 某件事情产生了一个结果
step 4 人们看到了创作者拿出的结果
step 5 人们对于结果有自己的解读
其中前三步是只与创作者有关的,后两步是只与接收者有关的。
前三步非常重要,我想称为叫确定性,或者叫唯一性。诚然,创作作为表达,可以有不同的解读,有不同的发散,但所有的拓展在到第四步开始,才开始发生。
什么意思呢?以绘画为例。创作者选择用了什么笔,选择用了什么颜料,甚至于选择用了什么调色盘,有没有用粗糙的纸,要不要把纸用胶带贴在画板上,最后水粉加多少水,怎么去涂抹,每一笔用多大的力气……等等的每一个操作,在绘画的过程中,是为带来一个确定性的结果的,也是唯一的一个结果。倘若我有一笔画太长了,这一笔的长短会分毫不差地留在画布上。
简单来说,在物理学层面上,在人类正常尺度上的物理学里,我们所做的每一个操作,对于存在在这个世界的我们来说,一定只有一个结果。
即使有些时候创作者都没有想到,诶,我居然一不小心加的这个东西,让画面好看了很多。在这个过程中,也必须是创作者自己执行了这个操作,才有了这个结果,某种意义上也是注定的。这个过程中是没有其他任何非这个作品的创作者的参与的。
这里为了防杠啊,我再多解释一步,创作者的所有想法,一定来自于他所看过的别人的作品和自己的生活经验。这些东西是很丰富的,没错。但是等你进到创作的第一步的时候,你有了一个想法并且开始操作这个想法了,就针对一个画家现在忽然有一种直觉然后在画面上留下了一笔这个动作本身,它就是确定的。因为笔在画下之前的那一刻,他的所有经验就不会再更多变化了,所有之前可能遇到什么的不确定性,在这一刻也确定下来了。
这样做出来的东西,我们才有资格,才有理由说,作品代表了创作者自己的想法,它是有着表达的,是有着被人们去解读的价值的。
但是Ai绘画是不一样的。
Ai比起人类目前为止接触到的所有工具,最不一样的点就在于它的黑箱特性。AI是黑箱模型,机器学习是黑箱模型。它的本质是大数据经过复杂的统计学处理得到结果。而任何一个但凡学过本科级别概率统计的人都知道,统计学是概率的学问。
就像现有的模型,你根本不可能直接理解你的输入是怎么带来它的输出的。你为了得到你想要的输出结果,你唯一能做的事情,就是想尽一切办法去给它投喂你希望它生成的结果的学习材料,最后在理想状态下,你成功影响了它的结果。这是训练的产物。
也就是说,简单来说,对于所有使用Ai绘画的人来说,他们所做的事情,是给Ai模型输入一些关键词,然后模型基于它的数据库,去基于统计学生成一个结果。这个结果根本就不具有一个确定性。即使你输入几百万的关键词,它都可以给你生成不止一幅符合你关键词的画。
我们可以同样拆解出Ai绘画的逻辑:
step 1 输入关键词给Ai
step 2 Ai提供不止一个输出结果
而这个步骤一是没有办法直接到步骤二的,它需要针对Ai的训练:
这个过程中背后发生的事情是:
step 1 技术人员设计Ai的基础模型,设计它的自我学习迭代的方式
step 2 输入学习材料(也就是尽可能多的优质画师的画
step 3 针对模型进行调整并且升级
而Ai绘画的这个结果,是由谁产生的呢?
你觉得是优质画师的画?是Ai的设计者?还是输入关键词的人呢?
(这不是个提问,哥们能这么问,排序都说明我的结论是什么了)
首先,如果没有画师的画,根本就不可能有Ai的结果。
其次,Ai设计者找到了一个方案,可以通过统计学的方式,去基于大量画师的画,得到一个基于这些画的特点,怎么计算出一幅新的画的程序。
最后是一个输入关键词的人,而他们甚至不能控制自己的关键词,在进入这个程序之后,得到一个确定性的结果。任意选择重新生成,都可以得到大量的类似的作品出来。
因此我觉得我已经阐述清楚了,为什么在我眼里,Ai绘画根本没有资格称为创作的原因。如果硬要说的话,程序本身 + 制作Ai程序的一众程序员 + 所有被用来投喂素材的画师 + (假如这个Ai是由某公司制作的产品) + 输入关键词的人 = Ai绘画的创作群体
而这其中,输入关键词只不过是一个导火索,能炸是因为前面已经备好的火药桶。
当然硬纠结这个点是没有多大意义的。对于大部分普通人而言,Ai绘画只是一个低成本的工具,他们只是需要一个结果,一个功能性的供娱乐使用的结果。这个当然是无可厚非的。只是如果硬要谈创作,我抱有上述的观点罢了。
但可怕的是,Ai是存在着迭代和进步的空间的。人工智能凭借着其远超人脑的算力和时间感知力和执行力,它是有办法做穷举的。也就是说,在充分理解了绘画本身是什么之后,(当然Ai的理解和我们的理解是不一样的,)它可以在一张固定大小的画布长,尝试每一种分辨率、尝试每一个像素可以拥有的每一种颜色。最后还有多少空间留给人类慢慢想呢?
而还有一个现实是,我们已经很多年没有出现新的开创性的绘画流派了,很多年也没有出现新的开创性的音乐流派了。在人类艺术的发展史里,由人类大脑能想象到的创作流派/类型已经似乎走到了一个尽头。那么之后的创作究竟是Ai的创作呢?还是人类的创作呢?倘若真的出现了人类无法想象的新的艺术形式或者艺术流派的话?
随着Ai的发展,我们可能可以在有生之年看到,创作这个事情本身,正在成为一项非物质文化遗产。就像是城市里的工场已经可以批量生产花样繁多的好看的轻工业品,但还有一群人执拗着在山里编着竹筐。
但至少相信自己手编的竹筐是有自己的味道的。
这是为什么那天的动态,我说我从未有一刻对人类的创作的未来如此悲观的原因所在。作为创作者,谁不希望手里的破竹笼子多几个人看到呢?但人们已经不需要 你 来做这玩意了。
第二点会更进一步,去探讨在我眼里的Ai的未来。当然我必须强调,以下观点并非我的原创,我深受《生命3.0》这本书的影响。
认为人工智能是工具,这样的观点是绝对错误的。这依然与我所说的确定性原理有关。人类从来就没有遇到过一个工具,是你无法彻底理解它的运行逻辑的。并且这个工具的使用过程中,你只能对它施加影响,不能对它的走向起真正决定性的要求作用。
站在未来的视角上,往回看,我们可能在见证人类创造出一个新的智慧生命体。并且是一个大脑物理能力远超人类的生命体。是下一代的生命体。
书中提到了一个很有趣的观点,可以通过生命的迭代性质给生命做一个区分。最初级的生命,也就是生命1.0,他们的迭代完全依赖自然进化,包括身体的进化和思想的进化。而人类虽然身体的迭代依然需要漫长的进化过程,但是知识的积累传递,让人类在思想上的迭代可以在单个个体的生命周期内完成。因此人类是2.0版本的生命。
而人工智能连硬件的迭代都已经不需要靠自然进化了。它的硬件迭代完全靠着你给他配什么样的硬件,它的软件迭代靠着机器学习,这个更不用说了。而它有能力对自我的进行复制,有能力对外界的刺激做出反应。人工智能距离智慧生命的距离已经比我们想象中要近很多了。
当然这个只是我个人的感受,毕竟我也不是这方面的专家。
但我们设想这样一个事情,就是,我们都知道人是社会关系的总和。假设一个Ai,他说话也跟我说话方式一样,他也能针对你们问我的问题,做出符合我风格的回答(毕竟完全用我的说话方式去训练的)。他甚至能够完成一些交给我的任务,比如做一个剪辑。那么对于网络上你们所有没有见过我的人来说,这个Ai就是我。并且至少在你们的认知里,这个Ai就是一个跟你们没有差别的生命体。
越写越有点懒得写了。最后一个点是见证历史。
你们说,我们觉得这些年反复地在见证历史,是因为历史真的在这些年变化特别大呢?还是单纯因为我们生活在这个时代,所以我们感知力更强?即使一些事情过两个月大家已经不讨论了,但是发生的那一刻我们还是觉得见证历史了。这样的感觉?
不过我真的非常相信,Ai的出现会代表着人类从旧人类走向新人类的种族进化的起点。