岁末年终,大模型厂商们又秀了一波 " 肌肉 "。
2 月 1 日,此前在大模型领域一直保持 " 静默 " 状态的字节跳动终于有了新动作,其上线了 "Coze 扣子 "AI Bot 开发平台;与过往聊天机器人的形式不同," 扣子 " 更像是 2023 年 11 月 Open AI 发布的 GPTs,可以让用户通过聊天、调用插件等方式,创建个人定制版 Bot,实现 "0 代码 " 开发。
图片来源:微博截图
除了字节下场外,猎豹移动 CEO 傅盛创立的猎户星空也在 1 月 21 日发布了自己的大模型 Orion-14B;傅盛强调,在企业应用场景中,猎户星空大模型在结合企业私有数据和应用时,即可实现千亿参数级别的模型效果。
而诸如科大讯飞、三六零等在 2023 年就第一时间抢滩大模型的厂商,如今则正迅速迭代;前者在近日发布了星火大模型 V3.5,后者则上线了大模型搜索 App"360 AI 搜索 "。
就在不久之前,手机厂商也纷纷涌入了大模型赛道。1 月 10 日,荣耀发布了自研的 70 亿参数端侧 AI 大模型 " 魔法大模型 ",自此,华为、小米、OPPO、vivo、荣耀五家国产主流手机厂商在大模型领域齐聚。同时,大洋彼岸的苹果据传也正在测试在 iOS 18 中引入生成式 AI 功能。
" 百模大战 " 似乎并没有随着时间的流逝而偃旗息鼓,反而是愈演愈烈。厂商们如今都打着怎样的算盘?2024 年的大模型赛道会迎来新的重大变革吗?
01 大厂涌入,赛道拥挤
ChatGPT 的出现并非毫无征兆。
创造它的 OpenAI 早在 2015 年便已成立,并在 2018 年就推出了初代生成式预训练模型 GPT-1,这也是 ChatGPT 最初的原型。
在此之前,业内的 NLP 模型(自然语言处理)主要是基于针对特定任务的大量标注数据进行训练,能力有限。
GPT 在自然语言推理、问答任务和常识推理等方面取得了突破,为此它也获得了微软 10 亿美元投资。随后,从 GPT-1 到 GPT-2,到 GPT-3,短短 2 年时间里 GPT 的能力不断提高。
图片来源:OpenAI 官网截图
2022 年 11 月 27 日,随着由 GPT-3.5 修改而来的人工智能对话聊天机器人 ChatGPT 的推出,这个一直在小圈子走红的研究成果,才第一次为大众所认识。能聊天、画画、写文案、编代码,强大的功能,使得 ChatGPT 一经发布迅速走红,5 天时间注册用户数超过百万,两个月时间月活突破 1 亿,成为史上增长最快的消费者应用。
消息传至国内,一石激起千层浪。人工智能竟然已经发展到如此地步了?震惊之下,淘宝上售卖 ChatGPT 账号甚至都成了一门生意。与此同时,看到巨大商机的各界大佬们,也纷纷下场,表态要尽快推出自己的大模型。
从 2023 年的 3 月到 9 月,各个互联网大厂在该赛道争先卡位。从百度的大语言模型 " 文心一言 "、360 的智脑大模型,到阿里巴巴的 " 通义千问 " 大模型、科大讯飞的星火大模型,再到腾讯的混元大模型,国内传统的三大互联网巨头 "BAT" 悉数下场。
此外,华为、京东、商汤科技、网易有道、昆仑万维(300418.SZ)等等都陆续推出了大模型产品,甚至连移动、联通、电信三大运营商,长虹等家电生产企业,清华、复旦、中科院等科研院所和高校,都发布了各自的大模型。
图片来源:华为云 AI 公众号
2023 年 5 月的中关村论坛上,专家口中中国 "10 亿级参数规模以上 " 大模型的发布数量尚为 79 个;而据 GitHub 的统计数据,到 2023 年底国内已经发布的大语言模型接近 300 个。" 百模大战 " 早已不是虚言。
不过相比当初外卖界的 " 百团大战 "," 百模大战 " 对资金的需求更为苛刻。
根据 NVIDIA 官方信息,在训练底层模型阶段,训练一次 1750 亿参数的 GPT-3 需要 34 天、使用 1024 张 A100 GPU 芯片,而为了维持日常推理,OpenAI 至少需要 3.24 万张 A100;以此推算,ChatGPT 仅硬件成本就超过了 8 亿美元。
昆仑万维集团 CEO 方汉更是公开表示," 没有 2000 张 A100 的卡,实验都做不了 "。为此,海天瑞声、因赛集团等 "AI 概念股 " 甚至接连发布定增预案,募集资金用于训练大模型。
图片来源:罐头图库
此时,如何在缩小与 ChatGPT 差距的同时,尽快找到应用落地的方向,并实现自我造血,成为了 " 百模大战 " 中,每一位参与者都要面对的问题。
02 大模型,有何应用场景?
从商业角度分析,大模型带来的机遇,可以概括为成本减少效率提升、原有市场需求再扩大、创造新的市场需求三大类。
大模型超强的人机对话、图文及音视频生成能力,不但让其在传统客服场景中获得了广泛应用,对于游戏、影视制作等也产生了深远影响。
阿里、美团的在线智能客服算法,以及中国移动的 " 九天大模型 "、中国电信的 TeleChat 大模型等,都属于此类产品,将应用场景直接锁定在了智能客服、智慧政务等方面。在 2023 年的亚运会上,科大讯飞与中国移动联合推出了基于星火大模型的 5G 新通话,接完电话之后,申请服务,会即刻转成文字、生成纪要、生成待办事项。
游戏、影视制作方面,导演陆川曾在采访时表示," 用 AI 画电影海报,15 秒出来的效果比专业海报公司做一个月的还要好。"
原有市场需求再扩大,则体现在对于传统业务的升级上,这也是大模型应用最广泛的领域。
以传统的搜索引擎为例,接入文心一言后,在百度搜索框里输入问题,给出的可以不再是链接,而是一个更确定的答案。以此为基础,百度地图、网盘、文库等应用都能通过接入大模型进行重构。
旗下业务众多的腾讯,对腾讯云、腾讯广告、腾讯游戏、腾讯会议等多个业务和产品,也已完成了接入腾讯混元大模型的测试,并取得了初步效果。
图片来源:腾讯混元官网截图
此外,在传统的教育、医疗、汽车等领域,大模型也获得了广泛的应用。
接入讯飞星火大模型后,科大讯飞的学习机实现了 AI 一对一辅助教学、中英文作文批改、口语陪练等功能;百度推出了产业级的医疗行业大模型 " 灵医 ";华为云盘古大模型的赋能,则让问界新 M7 在智能驾驶领域 " 遥遥领先 ",两个月大定突破 10 万台。
在创造新的市场需求方面,AI 超级助理、AI 机器人等需求也被不断创造出来。前者,包括文心一言、讯飞星火、通义千问等在内的各家通用大模型都有相应产品,它们大都能理解用户的语言语义,并具备图像理解能力,可以通过调用软件 API,使用各种各样的工具来帮助用户完成任务;而后者则已有包括优必选、追觅、宇树在内的不少于 10 家机器人企业,展出过相关产品。
图片来源:通义官网截图
不过,在一片欣欣向荣背后,也存在隐忧。比照各家大模型的应用不难发现,不管是提高效率还是扩大需求,市场上绝大多数的应用,实现的功能都较为雷同。
以 AI 学习机为例,除了科大讯飞有相关产品外,接入子曰大模型的网易有道、接入 MathGPT 的好未来、接入银河大模型的作业帮,以及接入文心一言的百度、接入 360 智脑的 360,都有类似的产品在售。功能方面,各自宣传的也都大同小异,AI 一对一辅导、全科 AI 作业助手、虚拟人口语教练等,站在消费者的角度,几乎很难体会到其中的差别。
尽管各家都能拿出一堆的排名榜单来论证,自己的大模型得分更高、能力更强;但体现在实际应用中时,那百分之几甚至是千分之几的差别,还是让人不得不产生疑惑:我们真的需要这么多大模型吗?
03 2024 会出现 " 杀手级应用 " 吗?
尽管市场中的大模型让人眼花缭乱,但行业对大模型发展的趋势还是形成了一定的共识。
百度创始人李彦宏就曾表示:"人类进入 AI 时代的标志,不是产生很多的大模型,而是产生很多的 AI 原生应用。"360 创始人周鸿祎也在今年年初谈及大模型发展趋势时称,2024 年将成为大模型应用场景之年,会出现 " 杀手级应用 "。
这也意味着,大模型与 C 端用户的距离会越来越近。
字节的 " 扣子 " 平台就是一个例子。据 " 趣解商业 " 了解,其有着无限拓展的能力集,用户可以通过添加插件的方式,来不断强化自定义 Bot 的能力;此外,用户还能将本地文件上传到 Bot 的知识库中,供其学习;创建出来的机器人,还能部署在不同的社交平台和应用程序上。
图片来源:扣子官网截图
这等于是给用户提供了自己开发聊天机器人的机会,让更多人能参与到 AI 生态的建设中。
与此同时,大模型也正在经历软件、硬件一体化协同的过程。
在这方面,智能手机厂商无疑是业界的代表。据 " 趣解商业 " 不完全统计,在国产智能手机中,目前华为 Mate60 Pro、小米 14 Pro、vivo X100 系列、OPPO Find X7 系列、荣耀 Magic6 系列等手机都已搭载大模型。
这些大模型除了能让 AI 助手变得更为智能外,还有一个重点的应用领域是手机相册。原来想消除照片中的其他游客,只能用 PS,且考验手法和技术;现在直接应用 AI 抹除功能,就能一步到位且几乎没有破绽。
类似的还有美图公司(1357.HK)自研的 AI 视觉大模型 " 奇想智能 "。其已与三星达成合作,用户可以在 Galaxy S24 系列手机上体验 AI 图像编辑功能;不仅可以 " 智能 p 图 ",还能通过用户给出的图片进一步生成 "AI 画风 "。
与手机对标的场景是 PC(电脑)。1 月,联想已经发布了 AIPC 产品,其在内嵌大模型后,有更强的算力支撑能力、人机交互更为智能、应用生态也更加开放。
而金山办公(688111.SH)推出的 WPS AI 就是可以在 PC 平台上应用的软件产品。其将重点放在了智能文档上,可以帮用户轻松创作办公所需的文本、PPT,还能自主消化 PDF 等文件资料,并解答有关这些资料的问题。
此外,教育也是一个重要的应用场景。科大讯飞、好未来、作业帮、网易有道等厂商都将大模型融入 AI 学习机中,教育类学习平板电脑的销量更是在 2023 年直线上升。而且基于产品的迭代,学习平板的价格还在不断走高。
深度科技研究院院长张孝荣认为,大模型未来可能会朝专业化与个性化、低门槛化的方向发展。模型的功能会更加细分,针对特定领域或特定需求进行优化;同时通过提供更友好的界面和更便捷的接口,降低使用难度,让更多的人参与到基于大模型的开发和研究中。
而且由于算力所限,大模型可能更多地部署在云端和边缘端;这样可以降低计算资源和存储资源的消耗,提高模型的响应速度和可用性。
但无论是哪种趋势,都要与实际成本相结合;否则只是一味投入,显然难以为继。
三六零(601360.SH)在 2023 年上半年,尽管新兴业务 "360 智脑 " 创造了近 2000 万元营收,但在 9.1 亿元的总收入中,占比不过 2.1%。
科大讯飞(002230.SZ)2023 年预计扣非净利润同比下降 71%-81%,主要原因就与公司在自主可控平台上加大认知大模型研发投入有关。
除此之外,如何让用户更好地理解大模型的决策过程和结果,提高其信任度,也是一个关键的问题。
04 中外大模型差距在哪?
国内大模型产业如火如荼,美国则更甚。根据《中国人工智能大模型地图研究报告》,全球累计发布的大模型中,中美两国大模型数量占近 80%。早在 2023 年 5 月,美国 10 亿级参数规模以上的基础大模型就已突破 100 个。
除了广为人知的 ChatGPT 外,美国具有代表性的通用大模型公司还包括 Anthropic、Cohere 以及 Google 等。
其中,Anthropic 被称为 "OpenAI 劲敌 "。其研发的聊天机器人 Claude 能一次性总结约 7.5 万个单词,比 ChatGPT 更适合处理长对话和内容、对大量文档进行深入分析,而且具备更快的平均响应时间。
Cohere 的特点则是其差异化的定位。不同于 OpenAI,其坚定选择了 toB 路线,提供灵活性存储和资料隐私保护路径,强调安全性、隐私及定制化服务。
至于 Google,最新的情况是推出了 AI 模型 Gemini,特点是多模态处理和对复杂逻辑的理解能力。在行业标准 MMLU(多任务语言理解)基准测试中,Gemini 是唯一一个成绩超越人类专家测试结果的 AI 模型。
北京市社会科学院研究员王鹏认为,中美大模型的差别主要体现在融资水平、基础大模型发展水平和应用层发展水平三个方面。
据不完全统计,2023 年上半年,美国 AIGC 一级市场中,硅谷在人工智能领域融资总金额约 140 亿美元,占世界总融资金额的 55%,平均轮次融资金额为 3.3 亿美元。同期国内人工智能领域则要谨慎得多,投资事件数量同比下降 49%,涉及总金额 61.74 亿元,同比下降 62%。
而在基础大模型发展水平方面,国内大模型还存在数据总量缺乏、算力资源缺乏、场景渗透率有限等问题。毕竟从公开数据量上看,英文数据本身占主导优势,美国还在采取多种方式限制中国获取算力的核心资源。
至于应用层方面,中国同样处于跟随状态;其中在办公、金融及医疗领域落后美国较为明显。
针对众多国内厂商都有宣称自家大模型已经超越 GPT-4 的情况,张孝荣认为:"从理论上说,某些厂商有可能在局部领先于 GPT4,但考虑到双方在算法、算力和数据资源等方面的投入,国内模型全面超越 GPT4 的可能性比较小。"
在他看来,需要正视国内外大模型的差距,这涉及到技术、人才、资金等各方面的因素。
好消息是,中国有着超大的市场规模以及丰富的应用场景,为大模型的落地应用提供了广阔的空间和条件。而且越多的数据、场景,越能让大模型更实用。这让中国在底层研发技术上略逊于美国的情况下,依然具备赶超美国的机会。
但无论中国还是美国,在大模型这条赛道上都还有很多难题待解。最典型的就是输出结果可信性不足、稳定性不强、以及安全性等问题。
对于人和 AI 来说,这都将是一个长期的学习过程。
来源:趣解商业