2023年是AI大模型元年,也是爆发之年,国内外科技巨头、创业者纷纷入局。
“颠覆”和“卷”成为AI界的高频热词。这一年,小而美的小模型开始尝试从垂直领域超越大模型,对标主流Transformer架构的新框架正在探索模型训练的捷径。多模态、行业强应用频频颠覆业界学界和投资界的想象。
这一年,大语言模型升级迭代标的日趋庞大,各厂商从卷参数到卷扩展输入的上下文长度,再到卷从业人员的薪资待遇。这一年,部分先入局者积攒了数据和壁垒,从开源转为闭源,业界透明度下降。年末,美国《纽约时报》以侵犯版权为由,起诉OpenAI和微软公司,法律和道德争议浮出水面。
总体来看,业界离AGI(通用人工智能)还有相当距离,但后起之秀加速追赶,行业黑马频频破圈,造富狂潮汹涌,行业氛围如临决赛圈。2024已来,回望2023年,《财经》新媒体盘点七大AI探索,用研报和数据告诉你过去这一年AI的圈内事。
ChatGPT是由OpenAI开发的一种语言生成模型。它是GPT(Generative Pre-trained Transformer)系列模型的一部分,使用了基于Transformer架构的深度神经网络。ChatGPT旨在进行自然语言对话生成,使其适用于聊天和问答任务。
2023年1月,微软向OpenAI加注100亿美元;4月,OpenAI拿下超3亿美元融资;8月底,据创始人奥特曼透露,OpenAI每月营收已破1亿美元;11月,GPT-4 Turbo发布,OpenAI 正成为硅谷最炙手可热的初创公司。
GPT-4 Turbo发布后,《财经》新媒体采访了行行AI董事长、顺福资本创始人李明顺。谈及最新的GPT Store时,李明顺表示“惊艳四方”和“窒息”。但他相信只要投入足够的资金和算力,本土大模型的底座能力足够支撑中国AI生态领域丰富的应用创新。
天风证券首席分析师孔蓉认为,大模型的发展趋势是加速多模态能力迭代,对于国家、行业和公司来讲,这是一场竞赛,当按钮被按下,有能力入局的参与者都会加速赛跑,因为OpenAI的先发优势并不是不可追赶的。
2023年12月,《自然》2023年度十大人物揭晓,ChatGPT首次以非人类身份位列年度科学人物,“我们将其破例纳入榜单,以承认生成式人工智能给科学发展和进步带来的巨大改变。”
制约ChatGPT的是可能是芯片算力的物理限制、训练数据的枯竭和服务器产能不足中的任意一环,他所需的算力正在以每100天翻一番的速度增长,“但是,生成式 AI 革命已经开始,且已经无法回头。”《自然》评委说。
大模型的训练、维护成本会因参数量提高而水涨船高,使企业盈利难上加难。据澎湃新闻估算,训练一个千亿规模大型模型的总费用 = GPU成本 + 其他硬件成本 + 数据中心成本 + 人力成本,共计约1.43亿美元。经济学人杂志根据研究机构统计推算,到2026年训练一个顶尖模型的成本要超过10亿美元。2023年下半年,小模型进入众多公司视野。
小模型相比大模型参数量少得多,训练成本也更小。理论来看,只要给小模型提供更充足的数据训练,小模型的能力也可以优于大模型。
另外,“知识蒸馏”也是知识压缩的常用做法。如百度等企业,使用针对不同行业的特别算法,先用大模型训练,再将训练结果传授给到轻量化的行业小模型中,用以处理该领域的内容。此举也可降低资源占用,节省运算成本。目前文心大模型和国内多家大模型已在各个领域落地了良好精调的小模型。
端侧小模型指的是可以在手机端运行的AI模型。通过搭载更大内存、更高带宽的新款芯片,手机也可具备在本地运行AI计算的能力。据联发科,最新发布的第七代APU790具备支持终端运行33亿参数大模型的能力。而对于更高的算力要求,手机则会预处理用户请求、调用大模型算力、接收云端的计算结果。
针对手机用户日常使用特点,手机厂商亦可给大模型知识蒸馏侧重用户日常需求。例如华为让其语音助手小艺重点学习了购物、生活常识、对话等日常场景,有让手机“智能语音助手”变得“真智能”。
除了华为,vivo的蓝心大模型、三星的Gauss大模型、OPPO的AndesGPT、荣耀魔方大模型,谷歌的Gemini均已在其最新设备中搭载运行。
2023年发布了不少具备AI智驾功能的新车,主要发展方向在自动驾驶和智能座舱两方面。想要在2023年的汽车市场占据一席之地,需要卷配置。早在2021年底,一家传统车企就曾宣言“四颗以下,请别说话”,其新车搭载了四个固态激光雷达,11个高清摄像头,12个超声波雷达,5个毫米波雷达,38个智能化感知元件。另外,高速路段自适应巡航、L2及以上级别自动驾驶、城区复杂路况行驶、自动泊车等功能逐渐成为新车标配。根据中国汽车工业协会数据,传统燃油车一般需要600颗左右芯片,为满足智驾需求,更高级的智能汽车的芯片需求量接近3000颗。
在接受《财经》新媒体采访时,麦肯锡全球副董事合伙人周冠嵩先生表示,目前,攻克环境感知及决策算法是一个艰难卓绝的过程。造价高昂的激光雷达,暂时充当了车企发展自动驾驶的“拐杖”,加速了城市NOA(即领航辅助驾驶)“开城”,并给予感知算法升级完善的时间。但未来,包含激光雷达点云数据在内的多传感器数据融合方案,乃至纯视觉感知方案将会成为自动驾驶广泛普及(包含经济型车辆)的理想方案。
根据周冠嵩先生观察预测,在高阶智驾的帮助下,驾驶员相当比例的时间、精力有望从繁琐的驾驶工作中被释放出来,这部分时间将可能被投入到更高附加值的工作及娱乐中去。目前操作系统本身虽尚无立竿见影的经济效益,但智驾产品刺激了消费需求、改变了用户场景,正在重塑中国高端电动车消费人群的偏好。
另根据ICV的报告,L2级乘用车方面,中国市场在2021年占到全球销量的43%,达841.9万辆,2026年预计增长至2713.2万辆,未来五年,中国市场将是全球智能驾驶技术发展的主要推进器。
2023年机器人圈里最重大的新闻当属12月特斯拉发布的人形机器人Optimus。马斯克曾多次强调,特斯拉是一家结合AI和机器人的公司。这位世界首富的理想是:后人工智能时代,机器人取代人类进行重复性劳动。
2023年年末,国外学术界的专家就“关于生成式人工智能(AI)与机器人”主题展开了讨论。得出结论:2023是彻底改变机器人学的一年,生成式AI对机器人技术的各个领域,从模拟到设计,都产生革命性的影响。但通用人工智能和通用机器人短期内不会出现。
根据易观分析2023年最新的《中国医疗健康人工智能行业应用发展图谱》,AI医疗应用前景广泛,可替代医生阅片进行病理诊断,缓解专业医师短缺,释放医疗资源,提高医院运转效率。
在健康管理方面,AI亦可对专人的体检和健康报告进行分析,长期监测服务。此外,准确率极高的大模型线上问诊,用药监测等功能也正逐步惠及大众,AI医疗的出现相当于为病患提供了专家陪护,但落地情况暂不明朗。
此外,荷兰研究人员的最新研究《利用生命事件序列预测人类寿命》在健康领域值得关注。一个根据600万丹麦人的健康数据和劳动力市场依附情况训练出的AI模型,能以较高的准确率预测人的性格,甚至是死亡时间。
天气预报是科学领域中最古老且充满挑战的工作之一,然而要做到准确有效却非常困难。以往预测台风路径需要5小时,而现在AI只需要10秒。2023年5月,中央气象台表示,华为云盘古大模型在“玛娃”的路径预报中表现优异,提前五天预报出其将在台湾岛东部海域转向路径。
盘古气象大模型采用了一种名为Pangu-Weather的高分辨率模型,该模型基于全球43年的全球天气数据,训练深度神经网络,使得该模型在精度和速度方面超越传统数值预测方法。
本文来自微信公众号“财经”(ID:mycaijing),作者:实习生 谢奕宁,撰稿人:刘芬,编辑:蒋诗舟,36氪经授权发布。