当前位置:首页|资讯|AIGC|OpenAI|ChatGPT|Whisper

潘多拉盒已打开,多位大佬深度解读AIGC

作者:游戏陀螺发布时间:2023-03-08

原标题:潘多拉盒已打开,多位大佬深度解读AIGC

全民AIGC的时代要来了。

自去年下半年开始,随着AI绘画、AI聊天相继火爆出圈,生成式AI在全球掀起热潮。什么是生成式AI(Generative AI 或 AIGC)?简单来说,这是对现有文本、音频、图像等进行分析再创作出新内容的技术。

比如AI绘画,只要输入想到的文字,就能在极短时间内产出相应且令人惊艳的图像。2022年8月,游戏设计师Jason Allen通过AI绘画Midjourney创作的《太空歌剧院》,在美国科罗拉多州举办的艺术博览会上,斩获数字艺术类别比赛一等奖。虽然后续该奖项引发一些舆论争议,但成为加热AIGC浪潮的一个导火索。

AI作画《太空歌剧院》

同理,在AI聊天中,输入你想要的问题,就能快速获得一份条例清晰的答案。作为其中的新晋顶流——ChatGPT,自2022年11月底推出后,短短两个月之内,月活跃用户数就破亿,而这也彻底引爆AIGC浪潮。

马斯克去年12月向ChatGPT拱了一把烈火

潘多拉盒已开,AIGC浪潮势不可挡

不同与元宇宙概念的遥不可及,AIGC触手可得。

3月19日“AIGC创新实践在线大会”,立即扫码报名

根据阿里达摩院发布的《2023十大科技趋势》报告显示,过去一年,生成式AI技术上的进展主要来自于三大领域:一是图像生成领域,以DALL·E-2、Stable Diffusion为代表的扩散模型(diffusion model);二是自然语言处理(NLP)领域基于GPT-3.5的ChatGPT;三是代码生成领域基于GPT-3的Copilot。

去年是AI绘画高速发展的一年,从操作较为繁琐且出图较慢的AI绘画先锋Disco Diffusion,到数分钟出图的Midjourney,再到8月免费开源且能几秒出图的Stable Diffusion,特别是后两者,极大推动了AI绘画的发酵。随后如NovelAI、niji·journey在二次元画风方面的出色表现,也瞬间引爆了绘画圈层。

海外网友AI作画

AI绘画效果惊人,大批公司开始跃跃欲试。

无论是否公开说明,不少游戏公司已经开始使用AI绘画辅助游戏项目。比如,今年二月初,完美世界在回复投资者提问时,表示他们已在游戏研发过程中使用AI绘图,相关技术对于开拓设计思路与创意灵感、提升研发效率起到了很好的推动作用。

也有一些公司率先享受到了AI绘画的成果。前段时间,一家名为Lost Lore工作室分享了他们如何利用AI绘画在手游《Bearverse》项目节省了7万美元的案例。通过AI绘画,他们艺术总监只花费了不到1周时间,就完成了17个游戏角色和一批UI的设计。如果按照以往,一个角色就需要花费16个小时,相当于2个工作日的时间,或者需要花费34个工作日来完成这17个角色。

AI绘画惊人的迭代速度,让美术人员陷入了失业焦虑。有人感言,“未来可能从业者给AI随便改改作业就好了。”

另一端,以ChatGPT为代表的自然语言处理领域,同样有不少公司开始使用。

一份由美国职业咨询平台Resumebuilder.com的调查发现,近一半受访者的公司已经开始使用ChatGPT,且使用 ChatGPT 的公司中约一半表示,ChatGPT已经开始取代他们公司的员工。这些公司使用ChatGPT用于编写代码、文案和内容创作、客服、记录会议和文件摘要等。

图片来源:央视财经

重磅的是,OpenAI于近日宣布为第三方开发者开放ChatGPT和Whisper(语音转文字)的模型API,意味着开发者能使用目前全新的API模型gpt-3.5-turbo来开发各种应用或集成在产品中,例如开发智能客服等,且OpenAI已经将ChatGPT的成本压低90%。这无疑将极大促进自然语言领域AIGC的增长。

百度创始人、董事长兼首席执行官李彦宏曾表示:“未来十年,AIGC将颠覆现有内容生产模式。可以实现以十分之一的成本,以百倍千倍的生产速度,去生成AI原创内容。”

可以预见,使用这些生成式AI技术生出图像或文案,可能在很近的未来,成为行业常态。机器人抢饭碗的时代真的来了。

学会与AI共存,抓住AIGC机遇

高速发展的AIGC,也带来的法律与道德层面的争议,比如版权问题,不恰当内容等。关于版权争议,前段时间,美国版权局裁定使用人工智能系统 Midjourney 创作的漫画小说中的图像不应获得版权保护。这是美国法院或机构首次就AI创作作品的版权保护范围作出裁定。

诚然,面对AIGC爆炸式的增长,如何利用AI、界定AI边界,也是亟待解决的问题,但面对势不可挡的AIGC,我们唯有学习与AI共存,抓住AIGC的机遇。

怕掉队的巨头们都在跑步入场。

今年1月,微软向OpenAI追加“数十亿美元”的投资,加深与后者的合作,并且在2月宣布ChatGPT加持版的搜索引擎 New Bing(新必应)和Edge浏览器,向搜索一哥Google发起挑战。Bing的下载量也因这一消息一夜猛增了10倍。

谷歌自然不甘落后,在2月初推出AI聊天机器人Bard,对战ChatGPT,虽然首秀翻车,但在AI领域积淀颇深的谷歌,仍旧被华尔街分析师坚定看好。另外,谷歌向人工智能初创公司Anthropic投资近4亿美元,后者正在测试OpenAI热门产品ChatGPT的竞争产品。

2月底,Meta发布一款新的人工智能大型语言模型 LLaMA,加入到这场AI竞赛中,并且将成立一个新的顶级产品组,专注于生成式人工智能。

国内方面,百度的“文心一言”发布会将于3月16日举行。“文心一言”是百度基于文心大模型技术推出的生成式对话产品,被称为中国版的“ChatGPT”。百度在去年8月推出了AI绘画——文心一格。

据了解,阿里巴巴旗下的阿里达摩院相关的ChatGPT产品已经进入到了内测阶段,也有消息称腾讯已针对类ChatGPT对话式产品成立“混元助手”项目组。还有字节跳动、网易、科大讯飞等等,都在布局AIGC。

我们从AIGC产业链看机会。 目前AIGC产业链结构大体可以分三层:基础层、中间层和应用层 *。

图源:华泰证券科技研究微信公众号

基础层即预训练模型,需要非常高额的成本投入。据北京智源人工智能研究院,2020年OpenAI发布的NLP 模型 GPT-3 的参数量约 1750 亿,训练数据量达45TB,模型训练成本近1200万美元。因此,唯有像OpenAI、谷歌、微软、Meta、百度等头部的科技公司或研发机构才有能力承担起这些费用。

鉴于大模型训练需要巨大的算力规模,基础层中的芯片、服务器等硬件提供商也成为其中的重要支持部分。比如 Stability AI 选择亚马逊云科技作为首选云提供商。通过使用亚马逊云科技一站式全托管的机器学习平台SageMaker,Stability AI能够使其模型训练具有更高韧性和性能。

中间层即垂直化、场景化、个性化的模型。在预训练模型的基础上,快速生成垂直化的小模型,帮助企业实现降本增效。比如,多个绘画模型基于开源后的Stable Diffusion开发,如二次元绘画领域的NovelAI。

应用层即面向C端的AIGC应用。从模态上看,应用层有图像、音频、文本、视频等,其中图像领域代表产品包括 MidJourney、Dream Studio等;音频包括 DeepMusic等;文本包括 ChatGPT、Sudowrite等;视频包括Runway等。

百度李彦宏近期表示:“AI技术已经发展到一个临界点,各行各业都不可避免地被改变。”像离我们普通人很近的游戏、电商、广告领域,将同样不可避免迎来变革。

为了让大家更好的了解和探索AIGC, 亚马逊云科技将于2023年3月9号14:00-18: 00举办“AIGC创新实践在线大会”。亚马逊云科技的多位专家,将携手来自行者AI、泽森科工、敦煌集团、大觥科技技术、达旦数生DailyLive、易点天下、计算美学(NOLIBOX)等大佬,共同探索AIGC在游戏、广告、电商等领域的创新实践。

*来源:华泰证券科技研究微信公众号文章:“AIGC引领内容生产方式变革”


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1