近来,AIGC(生成式人工智能)火了、而且是爆红。在《Science》此前发布的2022年度科学十大突破中,AIGC就赫然在列,并且在诸多大厂、相关机构的2023年科技趋势预测中,AIGC也成为了继NFT、元宇宙、Web3之后,俨然又一个“出圈”的风口。
回顾此次AIGC的“出圈”,在一定程度上其实始于游戏设计师杰森·艾伦使用AI绘图工具Midjourney创作的作品《太空歌剧院》,在美国科罗拉多州艺术博览会上摘得金奖一事所引发。但由AI来生成内容显然并非一个多么新鲜的概念,远的不提,早在2017年微软旗下的AI部门小冰就曾出版了史上第一本由AI独立创作的现代诗集《阳光失了玻璃窗》。
所以与其讲AIGC如今“一夜爆红”,倒不如说是“十年寒窗无人问,一举成名天下知”。趁着这股东风,又或者是迫于市场竞争的压力,近日谷歌方面也公布了其对音乐生成AI模型MusicLM的研究成果,显示该模型可根据文本或图片生成任何类型的高保真音乐。
但在展示了大量的案例,并强调了MusicLM具备的一系列功能过后,谷歌方面却并未公开发布MusicLM。要知道,现象级文本生成AI模型ChatGPT之所以能够掀起全网热议,除却其自身“文能提笔做文章,武能动手修BUG”的表现外,面向公众开放、允许用户体验的策略,无疑也是重要因素之一。
对此谷歌方面的解释是,MusicLM仍面临诸多风险和不足,其中包括技术不完善、版权限制、伦理争议等,例如其所生成的音乐中,约有1%是直接从训练集的歌曲中复制而来。
事实上,MusicLM的这些风险同样也是目前AIGC产品普遍面临的难题,并且相较于算法、NLP(自然语言处理)等技术方面的难题可以“关起门来解决”,版权限制、伦理争议等问题则更加“众口难调”,也需要各界从多个角度去协调。
一方面,如今无论MusicLM、还是ChatGPT,抑或其他生成式AI模型,他们想要生成内容都需要先通过海量“数据饲料”的训练。其中以MusicLM为例,据谷歌透露,其训练数据库中的音乐时长就达到了280000小时。但这样通过“数据喂养”训练的AIGC模型,就不可避免的需要面对版权方面的争议。
例如此前在2022年10月底,工程师Ogbogu Kalu便曾因为未经同意抓取迪士尼签约画师Hollie Mengert的作品,并通过训练制作了可批量生成Hollie Mengert画风的AI模型,引发了诸多的批评。为了应对这一情况,在二次元绘画领域最为成熟的日本,“AI学習禁止”已经成为了一个流行词。此外AIGC生产的内容版权究竟该归于何处,也是一个已经亟需解决的争议点。
另一方面,AIGC创作的作品究竟价值几何、能不能被消费,同样也是一个悬而未决的复杂命题。而这一点,从不同商业机构截然相反的态度上,便可以窥见一二。其中,图片库Getty Images由于考虑到种种风险,禁止通过其销售使用AI模型生成的作品。但Adobe方面却承认以Stable Diffusion和DALL-E 2为代表的AI模型创造的作品的价值,并支持创作者将其放到Adobe Stock平台销售。
而在艺术领域,AIGC面临的问题则更加复杂。虽然有观点认为,艺术创作的立意和技法都服务于人本身的思绪脉络,是“兴之所至”,而AIGC则是依靠算法以结果生成结果,没有人的主观能动、无法“无中生有”,因此产出的作品精巧归精巧,却平庸、匠气。
但从美国科罗拉多州艺术博览会评委会在得知《太空歌剧院》是一副由AI生成的作品后,依然决定向其颁发奖项来看,承认AI作品具有艺术价值的观点也同样存在。
此外不得不提的是,在这一轮的AIGC浪潮中,相比谷歌、Meta等巨头,反倒是Stability AI、OpenAI等初创企业“抢滩”获得了巨大的优势。但这显然并不意味着这些巨头对此不够重视,其实早在OpenAI推出ChatGPT的前三个月,Meta就曾发布过类似的对话机器人Blenderbot。而对于Blenderbot未能“火起来”的原因,Meta首席人工智能科学家Yann LeCun则将其归咎于对内容审核过于谨慎、而导致的对话结果无聊。
其实随着科技发展对人类生活的影响日益增大,对“新技术”采取谨慎态度早已是头部企业的共识,这一点从谷歌目前并未公开MusicLM一事上就有所体现。但目前有消息显示,在市场竞争压力之下,巨头们似乎也有意“冒险”。
对此就有些AI伦理学家表示,科技巨头匆忙进入市场可能会让数十亿人面临潜在的危害,比如分享不准确的信息、生成假图像,或是让学生有能力在考试中作弊等。
不过尽管目前谷歌等巨头还很“保守”,但据Gartner方面预计,到2025年,AIGC将占所有生成数据的10%。而且红杉在《Generative AI:A Creative New World》一文,更是“盛赞”AIGC有潜力产生数万亿美元的经济价值,甚至这篇文章的作者之一,就正是与ChatGPT师出同门的GPT-3模型。
事实上,尽管AIGC现阶段仍面临诸多挑战,但寒冬在后、桎梏在前,好不容易觅得下一个突破口的科技巨头,显然不会坐以待毙。只不过从目前来看,无论巨头还是初创企业,都尚未在AIGC领域探索出明确可行的商业模式。
就在AIGC走红后,腾讯很快在QQ中上线了“QQ小世界AI画匠”、百度推出AI绘画应用“文心一格”,抖音方面则推出了AI绘画特效,并且这些产品也确实带来了流量与话题。但随着用户新鲜感的不再,这些产品的热度也骤然下降,而哪些生成的作品更是被新的内容推向网络信息洪流的深处,也使得这样的尝试更像是一轮营销活动。
另一边,“工具化”则似乎正成为AIGC试图完成商业化落地的一个方向。作为OpenAI背后的投资者,据悉微软不仅有意加大投资,还计划将ChatGPT整合进自家搜索引擎必应Bing,以及Word、PowerPoint、Outlook邮箱等办公套件中,并表示一旦进行了有效的集成,未来将可能改变超过10亿人编写和演示文档、文稿和电子邮件的方式。
近日还有消息称,百度方面正计划在2023年3月推出与ChatGPT类似的对话机器人产品,且最初版本将嵌入其搜索引擎中。此前在早些时候,百度还推出了新一代AIGC营销内容生产工具“营销内容AI助理团”。据百度集团资深副总裁何俊杰介绍,“目前百度有三分之一的广告分发已经用到AICG能力”。
只是在现阶段,AIGC真的能够担起这一重任吗。且不谈潜在的版权风险、伦理争议,仅在技术层面,目前AIGC的成熟程度或许还很难满足商业化的需求。要知道,当下即使是被称为有史以来最好对话机器人的ChatGPT,也会“一本正经”地给出与命题南辕北辙的答案。
在《Generative AI: A Creative New World》一文的结尾就提出,如今的AIGC产业与iPhone刚出现时的移动应用场景颇为相似,有些噱头、但比较单薄,竞争差异化与商业模式尚不明确,但却“提供了一个有趣的视角”。在红杉方面看来,AIGC融入人类工作、创作和娱乐方式的未来将“很容易想象”。
但这一番“预言”能否实现,显然当下还没有人能够断言。不过从目前一众科技企业的相应投入来看,这场围绕AIGC展开的战役已然打响。
【本文图片来自网络】
本文来自微信公众号 “三易生活”(ID:IT-3eLife),作者:三易菌,36氪经授权发布。