文章来源:元宇宙日爆
图片来源:由无界 AI生成
2022年11月30日,基于AI大模型GPT-3.5的ChatGPT正式发布。这款由OpenAI开发的聊天机器人,不仅可以回答各种问题,还能够创作诗歌、故事、歌曲、代码……甚至还学会了模仿名人的风格和语气。它的出现,不仅开启了生成式AI的新篇章,更让AI大模型成为2023年科技界竞相追逐的新风口。
ChatGPT打响了AI新赛道的“发令枪”,全世界掀起了AI装备竞赛的狂潮,科技巨头你追我赶,不断扩张商业版图。在即将过去的2023年中,围绕AI大模型,有哪些事件值得铭记,有哪些经验值得总结?2024年,AI大模型又将呈现出怎样的发展趋势?
2023年,国内外AI大模型产品以令人眼花缭乱的速度更新迭代,国内更是开始了“百模大战”。公开资料显示,截至10月,国内已经发布了238个AI大模型,其中,不少AI大模型的性能已经赶超GPT-3.5。光鲜背后,也有不少企业宣告解散,“套壳”大模型依然屡见不鲜。回顾AI大模型火爆的这一年,每个月都有大事件和值得记录。
汇总如下 1月
“出道”仅两个月的ChatGPT月度活跃用户突破一亿,这使其成为历史上增长最快的面向消费者的App,作为对比,TikTok达到1亿用户用时9个月,Instagram则用了两年半的时间。ChatGPT在底层数据、核心技术、应用场景、用户体验等各方面都具有里程碑式的意义,其最大亮点在于优秀的语言理解、意图识别、逻辑推理、内容生成等能力。它的出现意味着AI的交互能力实现了跨越式发展,某种程度上满足了大众对AI的认知与使用需求,使人类意识到AI或许真的可以超越并取代人类。
同期发生:谷歌推出文本生成音乐产品MusicLM。
2月
投资OpenAI的微软第一时间品尝到了收获的果实。2月7日,微软发布了ChatGPT版搜索引擎 New Bing。其中最值得关注的技术突破莫过于New Bing运行的是OpenAI为它定制的基于ChatGPT技术的大语言模型“普罗米修斯”。据悉,New Bing上线48小时内即有超过100万人申请加入。对于此前仅占全球搜索量3%的Bing而言,此番终于抓住了难得的机会。
同期发生:复旦大学自然语言处理实验室发布国内第一个对话式大型语言模型MOSS大模型;Meta发布大语言模型LLaMA。
3月
OpenAI发布AI大模型GPT-4。GPT-4是在GPT-3之后的一项重大突破,它拥有超过1000亿个参数,是GPT-3的10倍。GPT-4的发布是AI领域的又一个重要里程碑事件,对自然语言处理技术起到了重大的推动作用。GPT-4不仅展示了其强大的生成能力和灵活性,也为人类与机器之间的交流和合作提供了更多可能性。
3月16日,百度创始人李彦宏宣布正式推出基于百度新一代大语言模型的生成式AI产品“文心一言”。文心一言具有文学创作、商业文案创作、多模态生成、数理逻辑推算、中文理解等能力。李彦宏在发布会上表示:“百度是全球为数不多在‘芯片—框架—模型—应用’四层进行全栈布局的人工智能公司,也是全球大厂中第一个做出对标ChatGPT产品的企业。”
同期发生:谷歌向公众开放其人工智能聊天机器人Bard的访问权限;英伟达推出企业生成式AI云服务;科技领袖联名呼吁暂停AI装备竞赛。
4月
Meta于2月推出的大语言模型LLaMA拥有不同版本,包括7B、13B、33B和65B等参数级,虽然它比GPT-3的量级小,但在许多任务上,它都能和GPT-3的性能相媲美。LLaMA发布时并未开源,但在一段时间后,这个模型突然在网络上泄露,迅速引发了数千次下载。这次重大的泄露事件,被业界称之为“史诗级泄露”,原因是LLaMA由此成为大语言模型领域层出不穷的创新来源,短短几周内,基于它构建的LLM代理的创新,已经呈爆炸式增长。
4月11日,在阿里云峰会上,阿里云智能首席技术官周靖人正式宣布推出大语言模型“通义千问”。通义千问是一个大规模语言模型,具备多轮对话、文案创作、逻辑推理、多模态理解、多语言支持等功能。通义千问可以跟人类进行多轮的交互,也融入了多模态的知识理解,有着非常强的文案创作能力,能够续写小说、编写邮件等,极大提升了人们的工作效率。通义千问的发布意味着,在AI赛道上,阿里迈出了关键的一步。
同期发生:免费开源项目Auto GPT成为热议话题;商汤科技日日新SenseNova AI大模型发布;欧盟提出《人工智能法案》。
5月
谷歌发布AI大模型PaLM 2,能够理解、生成和翻译100多种语言。它采用了大量的多语言文本进行训练,因此在常识推理、数学逻辑分析和回答医学问题等方面具有更强的能力。PaLM 2在某些基准测试中已经超过了GPT-4的表现。PaLM 2的发布更像是一场谷歌向微软和OpenAI发起的全面反击战。与此同时,在不同的生态和技术能力下,国际市场上,AI大模型战役愈演愈烈。
5月6日,科大讯飞星火大模型正式发布,同时发布的还有大模型在教育、办公、汽车、数字员工四大行业方面的应用成果。值得关注的是,科大讯飞发布的星火大模型基于昇腾AI打造,科大讯飞与华为共同启动了“星火昇腾”联合生态,完善算力生态体系的建设。科大讯飞董事长刘庆峰在发布会上表示,认知大模型正在成为通用人工智能的“曙光”。
同期发生:AI编程语言Mojo发布;ChatGPT iOS应用发布。
6月
国内AI大模型数量“井喷式”增长,中科院紫东太初大模型2.0、上海人工智能实验室书生浦语大模型、360智脑大模型、百川智能百川大模型、智源悟道天鹰大模型等集中发布,各方纷纷入场,足以证明在大模型带动下AI产业的火热。业内专家预测,在中国规模庞大的互联网用户的支撑下,国内企业在算法和算力上有望不断实现突破并取得领先。从算力到应用,AI大模型发展的加速键已被按下。
同期发生:OpenAI发布GPT-3.5 Turbo和16K模型,并下调使用价格;AI视频制作模型Runway Gen 2上线;欧盟发布全球第一部人工智能法案。
7月
特斯拉创始人兼首席执行官埃隆·马斯克宣布正式成立xAI公司。马斯克表示,xAI公司的目标是了解宇宙的真实本质,虽然是一个独立的实体,但会与“X公司”、特斯拉和其他公司有密切的合作关系。此外,该公司的网站还公布了其员工的姓名,这支团队由马斯克领导,并将Dan Hendrycks列为顾问,其余团队成员则分别来自DeepMind、OpenAI、谷歌研究院、微软研究院、特斯拉和多伦多大学,科研经验相当丰富。
7月7日,在华为开发者大会期间,华为正式发布盘古大模型3.0。这是一个完全面向行业的大模型系列,可为客户提供100亿参数、380亿参数、710亿参数和1000亿参数的系列化基础大模型,同时提供全新能力集,包括NLP大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,客户和合作伙伴能够直接调用。华为云CEO张平安表示,不愿将盘古大模型与ChatGPT相比。“Chat意为聊天,但我们没有时间聊天。参数再多、对话能力做得再好,如果解决不了实际问题,也没有多大用处。AI最不应该替代的就是作诗作画,这是人类应该呈现的东西,为什么要把它交给机器?”
同期发生:Meta推出大语言模型LLaMA 2;中国国家互联网信息办公室等七部门联合发布公布《生成式人工智能服务管理暂行办法》。
8月
英伟达发布新一代GH200 Grace Hopper平台,该平台依托于搭载全球首款HBM3e处理器的新型Grace Hopper超级芯片(以下简称GH200),专为加速计算和生成式AI时代而打造。自从2022年底基于GPT-3.5的ChatGPT推出以来,全球AI大模型开发热情暴涨,这让英伟达的芯片变得供不应求,GH200超级芯片的发布进一步提升了英伟达在AI芯片领域的霸主地位。
8月31日,百度官方宣布“文心一言向全社会开放”,用户可以在应用商店下载“文心一言App”或登录“文心一言官网”体验。包括百度文心一言在内,共有8个企业/机构的AI大模型位列第一批名单,可以正式上线面向公众提供服务。随后,“文心一言App”冲上各大应用商店的热门榜单,在App Store上直接登顶免费榜榜首,成为当日热门应用。
同期发生:ChatGPT企业版推出;美国华盛顿联邦地区法院法官判定人工智能没有版权。
9月
ChatGPT的多模态能力得到进一步增强,这次升级引入了两项重要的功能:语音输入和图像上传。这些新功能将用户与ChatGPT的互动推向了一个新的高度,使得AI不仅能够理解文字,还能够“听”和“看”。这让ChatGPT不再仅仅是一个文本处理工具,而是开启了更多领域的探索。
9月7日,在AI大模型浪潮中表现相对低调的腾讯,在2023腾讯全球数字生态大会上,正式发布腾讯混元大模型,并通过腾讯云对外开放。腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生表示,混元大模型具有强大的中文理解与创作能力、逻辑推理能力,以及可靠的任务执行能力,在解决大模型常见的“幻觉”问题上取得了明显进步。
同期发生:微软推出蛋白质生成模型EvoDiff;Meta AI助手发布。
10月
谷歌凭借自研的Tensor G3芯片,为自家的手机点亮了AI技能树。Pixel 8与Pixel 8 Pro都采用了谷歌自研最新的Tensor G3芯片,其AI性能(即在设备上运行的机器学习模型数量)是Pixel 6使用的第一代Tensor芯片的2倍。谷歌高层表示,Tensor G3芯片的研发目的不是提升传统的各项性能指标,也就是“不是用来跑分的”,而是旨在推动移动计算的发展,为移动设备上的应用生成式AI铺平道路。
同期发生:Stability AI推出开源大语言模型Stable LM 3B。
11月
ChatGPT让OpenAI成为仅次于字节跳动和SpaceX的超级独角兽,但OpenAI此次占据媒体头条却是因为公司高层上演的一出“宫斗剧”。纵观全球科技商业历史,或许很难找出第二家企业,在短短五天内换了四任CEO,OpenAI却成功做到了。这场“权力的游戏”几经反转后终于落下帷幕,但理念冲突与路线之争并未停止,天平最终是否不可避免地倒向一方,“受益者是人类”的最初愿景又能否实现?光鲜背后,该OpenAI考虑的问题还有很多。
马斯克的新公司xAI发布了首个AI大模型Grok-1。据悉,Grok-1是一款基于Transformer的自回归模型,可以和用户进行对话。xAI表示,Grok-1通过X平台进行训练,可以实时了解最新情况并回答用户的相关问题。但作为一个只训练了两个月的AI大模型,Grok-1显然尚不具备与GPT-4掰手腕的资本。
同期发生:英伟达发布H200芯片;微软发布自研Maia 100芯片。
12月
ChatGPT最有力的竞争对手在年底压轴出现——谷歌Gemini 1.0正式上线。Gemini最大亮点之一就是原生多模态大模型——设计时就原生支持多模态,具有处理不同形式数据(语言+听力+视觉)的能力;一开始就在不同模态上进行预训练,利用额外的多模态数据进行微调以提升有效性。谷歌表示,该模型在一系列智力测试中的表现优于OpenAI的GPT-4模型和“专家级”人类。Gemini针对不同的应用创建了3个版本,分别是Nano、Pro和Ultra,其中,Ultra版超过了所有现有AI大模型的能力。它在行业标准MMLU基准上的得分为90%,而“专家级”的人类预计能达到89.8%。这是AI首次在测试中击败人类,也是现有大模型中得分最高的。
AMD在美国加州圣何塞举办的Advancing AI大会上正式发布两款AI芯片旗舰产品,Instinct MI300X与MI300A。诸多AI产业的龙头公司也来到大会现场,为“英伟达挑战者”站台助威。AMD CEO苏姿丰认为,英伟达目前占据统治地位是不争的事实,但未来AI算力市场的规模巨大,AMD仍能分一杯羹,“AMD不一定要击败英伟达才能在市场上取得成功”。
同期发生:微软发布AI大模型Phi-2;华为云推出业界首个AI大模型混合云。