当前位置:首页|资讯|人工智能|DALL·E|Stable Diffusion

生成式人工智能的历史与未来

作者:二师兄talk发布时间:2023-12-01


mj


生成式人工智能(Gen AI)有着悠久的历史,可以追溯到20世纪60年代。然而,2022年被认为是AI伟大觉醒的一年。本文将回顾Gen AI的发展,并着重探讨2022年以来的创新与整合。


第一幕:探索时代

回想起2022年4月,当我第一次看到DALL-E 2时,就像是一次顿悟,我感觉到一场重大的变革即将发生。我开始尝试使用GPT-3和其他当时的AI写作工具。

随后在8月,开源图像模型Stable Diffusion的发布引发了图像工具的爆炸式增长。到了2022年12月,一款使用了Stable Diffusion的移动照片应用Lensa AI在短短一个月内就记录了全球用户近2000万次的下载。

2022年的巅峰是ChatGPT的公开发布,标志着这项技术突破进入主流,仅用了几个月就吸引了1亿用户。ChatGPT的成功不仅在教育领域引起了颠覆,同时也成为AI创新的催化剂,促使人们纷纷尝试生成式人工智能,新的工具几乎每天都在涌现。

在这个时代,大型语言模型(如GPT-4、PaLM2、Claude、LLaMA等)、LLM策略、以及图像、视频和代码模型等创新层出不穷。


第二幕:整合时代

最近的一些文章表明,Gen AI正进入第二幕。Gen AI正在成熟,呈现出一种整合的趋势。我将这个时代定义为“整合时代”,并强调探索和整合并不是彼此割裂的,而是相辅相成的。

整合时代的开始源于第一年的AI竞赛。大型科技公司纷纷建立伙伴关系,巩固了自己在竞争中的地位。微软+OpenAI、亚马逊+Anthropic、谷歌+Nvidia等的合作,使得Gen AI不再是一个孤立的应用,而是融入了用户已经习惯的工具和产品中。

整合时代的特点:

  1. 嵌入一切:技术巨头的策略很简单,将最好的AI嵌入到已经被广泛使用的工具和产品中。比如,微软计划将AI嵌入到其365 Office套件、Bing搜索引擎、Web应用程序以及Xbox游戏主机中。谷歌也有相似的计划,将AI嵌入到Google搜索、Google Workspace、以及各种移动应用中。

  2. 图像和图形:在图像和图形领域,尽管Midjourney和Stable Diffusion在探索时代占据主导地位,但Adobe通过Firefly v2迎头赶上,并在其应用程序和创意工具中捆绑了令人印象深刻的Gen AI功能。

  3. 云服务提供商:作为云服务提供商的亚马逊不仅提供云服务,还成为LLM提供商,提供了以Bedrock为基础的模型即服务的方法。

整合时代的到来意味着生成式人工智能正在像电力一样渗透到我们的生活中,成为系统的一部分,融入我们已经习惯的用户体验中。

初创公司的挑战:

虽然我们将继续在Discord频道、Github仓库和社交媒体上看到初创公司的惊人创新,但是对于这些小公司来说,要在Gen AI领域长期竞争将变得越来越困难。至少,它们将需要支付“税款”,因为大科技公司拥有LLMs、拥有铁路和电网。

这正是为什么大多数大型科技公司(不包括Meta)反对开源LLMs的原因。开源继续成为生成式人工智能活力的一部分,因为创新需要公司在没有专有LLM公司强加的限制下进行实验和创新。

协作推动定制:

随着生成式人工智能进入下一个阶段,系统和公司之间的合作将增加,以提供定制的AI能力,满足不同行业和商业应用的需求。

未来的展望:

如果要预测“第三幕”会是什么样子,我认为我们将看到人工智能在物理世界中的更多存在。整合时代主要是AI与软件的融合,而“生物空间”时代将是AI与物理、生物的融合。


最后的思考:

生成式人工智能已经进入其第二幕,表现出不同系统的融合和企业合作,为各个行业的各种应用提供了定制的人工智能能力。

随着生成式人工智能在我们的工具和生活中变得越来越根深蒂固,对伦理人工智能、数据隐私和安全方面的合理担忧也将变得突出。在这一进程中,开源继续发挥着关键的作用,推动着创新的前进。



Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1