摘要:受到近段时间AI热的影响,以及 离谱!我竟然用ChatGPT做出了播放量100000的视频! 这个视频的启发,up亲自用AI工具(GPT-3.5、bing AI、剪映)制作了一个营销号视频【ttjibu】欢迎点进来浪费你2分钟时间,切身体会到了AI工具的使用门槛与劣势。
一、制作流程
1、用gpt生成10个龙傲天故事梗概;
2、挑选其中1个让gpt扩写得到文案;
3、用剪映的图文成片生成与文案对应的画面,人生朗读,以及bgm。
1、关于故事生成
该过程中使用了bing ai的创造模式(图2),以及chatgpt3.5免费版(图3)。可以看到,后者对“龙傲天”的理解略显浅薄(直接上龙傲天3个字我也是没绷住),但生成的故事还是挺男频爽文的;前者对“龙傲天”的理解相对更到位,且感觉更加营销号一些。我最后选择了bing生成的故事(选赌徒那个是因为感觉赌徒这个要素更浮夸更能吸引人),并进行了进一步续写。
2、关于故事扩写
gpt扩写的挺抽象的,各种毫不相干的要素交织在一起,结尾还突兀回归正能量,这和我给他的指令含糊不清有关(图3,当时本来想拿这10篇文章训练它的,但结果它要我一篇一篇地给他,我干脆将错就错直接让他自由扩写)。
但当时我看着这篇抽象文章透露着一股人工智障的美,看着非常乐,反而莫名得到了我的青睐,于是就拿来做了这期视频的文案。我把全文放下面给大伙看看。
至于bing生成的故事,我则结合自己对男频爽文的理解,给了它更加具体的指令(图4)。
bing整出来的东西也挺抽象的,但和gpt的抽象不是同一个方向。bing的扩写缝了大量的男频爽文的要素,但由于各要素之间不兼容导致变成了个四不像,文章最后一句更是直接让我绷不住了,龙傲天不是这么用的\(`Δ’)/。另外,bing一口气写了1200字,这也是我不用它的一个原因。
3、关于视频生成
本来想用必剪的,但发现必剪的语言朗读有文本字数限制,便改用剪映了。语音包我选择的是台湾男声,理由是认为这种声音更契合讲故事的声线(剪映中可免费商用的语音包有几十种,还是很丰富的)。画面则让剪映自己根据文本去找素材。至于字幕和bgm,也是剪映自己加的。
人声朗读、bgm、字幕我都挺满意的,除了有几句台词其朗读的音频莫名丢失之外。但问题不大,通过添加文本、文本朗读就能补回去了。
但画面就很差了,我感觉剪映找画面的逻辑是“提取文本中的关键词 → 根据关键词找图片/视频”,但这就会导致画面不具有上下文连续性,而且很容易因为关键词找错导致画面与文案语义不匹配。另外,有些素材一帧对应几十字的文案,画面表现力相当的差;甚至有部分台词找不到对应的素材。
三、结论(其实只是自己的一些感悟)
1、AI不擅长生成创意。哪怕是像我文章开头提到的那个视频中,AI也没有直接产生创意,而是在模仿创意。但这就需要你收集并提供创意给AI,这个过程其实是需要你对对应内容有相当深入的了解的。如果你不提供对应的创意供AI模仿,那AI生成的东西很可能就是上述一样的答辩。另外我也看了不同类型的AI生成视频的分享,如科普知识类的【有被震惊到😱】挑战用AI制作一部完整的视频(标题,文案,制作,缩图,优化…),和鸡汤类的用AI技术来打造爆款短视频,AI扩写+语音合成+数字人,这类营销号视频则不怎么吃创意,虽然我没尝试,但我猜用gpt生成文案应该效果是不错的。当然AI也不是完全无法提供创意,但还是需要你给一个比较细的切入点,这就要求你要对所属的领域非常熟悉。同时你得能熟练地使用AI,这点将在下面的第2点中进一步阐述。
2、AI工具的门槛比想象中的要高。这里第一层含义是AI工具的获取有一定难度,无论是通过合法途径获取并使用gpt等的账号,还是通过特殊手段体验gpt,都需要你付出一定的成本;第二层含义是你对AI工具使用的熟练程度会直接影响你生产内容的质量和速度。近期火热的AI绘画就是一个典型的例子,体验一下关键词成图很容易,但想要精准地获得想要的图片,就需要你精准地描述关键词、选择模型、选择画风、调节不同参数。生成文本和视频也同理,你得准确地向AI传达你的需求(比如我对营销号的认识就比较浅,不然应该能提更细致的要求),AI才能给你生成想要的东西。
3、事实上,在最近的AI热中,媒体展现的一直都是AI某些相对强势的方面,但这不意味着AI就是六边形战士。在这次视频创作过程中,我对AI的期待被泼了一盆冷水,也对AI工具有了更客观的认知。AI能够完成视频创作中的大部分环节,但这并不能保证成品有营养有价值。能够运用AI来做出优质视频的人,我相信哪怕他不借助AI工具,也同样能做出优质视频。
蛙哥全景看世界 2024-12-24