不止百模大战,也是中美争锋。
来源 | AI黑马
作者 | 张沉浮
早在2017年,国家就出台了新一代人工智能发展规划,明确将人工智能列为国家战略。今年4月28号,中央政治局会议更是重点提及要重视通用人工智能的发展,营造创新生态。7月13日,《生成式人工智能服务管理暂行办法》公布,鼓励技术在各行业和各领域的创新应用。
人工智能三大要素,算力、算法和数据。其中,中国两国在算力方面差距不大,按2022年年底的数据,美国占全球算力36%,中国占31%。
不可否认的是,中美在AGI和AIGC上还是存在差距的。
大模型的基础是深度学习框架,美国的Tensorflow和PyTorch已经深耕深度学习框架生态多年,虽然国内企业也自主开发了深度学习框架,但市场考验还不够,生态还有待打造。
邬贺铨院士 认为:“在中国从事AI研究的技术人员不算少,但具有架构设计能力和AIGC数据训练提示师水平的人才仍然短缺。在ChatGPT出现之前,有人认为中国在AI方面的论文与专利数与美国不相上下,ChatGPT的上线使我们看到了在AIGC上中美的差距,现在是需要清楚认识和重视我们面对的挑战,做实实在在的创新。”
现在许多公司和研究机构都处在“百模大战”之中,不论初创公司还是大公司,充分竞争的市场才是好市场,充分竞争的公司才是好公司。
张亚勤院士 认为:“大模型时代才刚刚开始,42公里的马拉松我们刚跑到5公里,算力、数据不够都不成问题。中国在PC时代落后于美国,但在移动互联时代领先于美国(数字支付、微信、短视频),AI时代要给创业者、科研人员、企业更多信心。”
一些产业从业人士指出,在AI大模型上中美争锋,主要是“OMG”和“BAT”的战斗。
我们依次看一下这六家企业:OpenAI、Meta、Google、百度、阿里、腾讯。
1)Open AI
2022年11月30日,OpenAI发布ChatGPT。作为ChatGPT的母公司,Open AI引领着AI大模型的发展。2016年微软投资了OpenAI十亿美金。2020年推出的 GPT-3 ,有1750亿参数,是大模型的技术。2022年推出的 ChatGPT 是基于大模型的产品形态。2023年微软继续投入100亿美金,OpenAI+微软已成为最具影响力的AI力量。
2)Meta
Facebook先是押注元宇宙,如今又入局AI大模型。扎克伯格是蹭热点,还是全面发力?过去Facebook的使命是“Make the world more open and connected”,这个话也是非常具有互联网时代特色的,就是开放、连接。如今,扎克伯格已然意识到这个东西不够了,他说我们要“Bring the world closer together”,怎么才能“closer together”呢?还是要通过用户画像、通过人工智能的技术,找到人和人之间相同的兴趣,把他们连接在一起。MetaAI发布了开源大模型LLaMA,可以在单个GPU上运行。
3)Google
2023年5月10日,谷歌在两个小时的大会里提及“AI”200多次,并一口气推出了AI大模型PaLM2、AI机器人Bard、AI搜索、AI办公等多款模型和产品,一套完整的AI系统全面嵌入谷歌旗下超过25个产品和应用。
图注:谷歌搜索将在产品搜索页面同时展示其产品描述、评论、价格和展示图等信息。
4)百度
2023年3月16日,百度在中国率先发布文心大模型。据了解,百度是中国最早布局大模型的公司,于2019年就开始了预训练模型 Ernie1.0。目前,文心大模型家族已形成文心大模型+工具与平台+产品与社区的庞大大家族。
除了依托百度搜索的海量数据优势,百度在AI大模型领域的“四层模式”(芯片层+框架层+模型层+应用层)才是其在“百模大战”中的核心竞争力。百度之所以能够在Google、Meta、阿里、腾讯等大厂之前先做出来“文心一言”,就是因为这四层的全栈布局。
百度在芯片层的布局是昆仑芯,已经量产几万片。昆仑芯第三代,预计2024年初量产。飞桨属于框架层,文心属于模型层。
5)阿里
2023年,4月11日,阿里发布大模型。张勇表示,阿里巴巴所有产品未来将接入“通义千问”大模型,进行全面改造,包括天猫、钉钉、高德地图、淘宝、优酷、盒马、饿了么等。他认为,面向AI时代,所有产品都值得用大模型重新升级。
阿里云也面向企业提供普惠的AI基础设施和大模型能力。未来每一个企业都可以通过阿里云调用通义千问的全部能力,也可以结合企业自己的行业知识和应用场景,训练自己的企业大模型。比如,每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。
图注:钉钉会议能够随时生成会议记录并自动总结会议纪要、生成待办事项。
6)腾讯
直到2023年6月19日,腾讯才姗姗来迟地开了场发布会。腾讯对外公布行业大模型研发进展,宣布将助力企业构建专属大模型及智能应用,为企业提供MaaS一站式服务。
据了解,腾讯将为文旅、政务、金融等10余个行业,提供超过50个大模型行业解决方案。比如,基于腾讯云智能媒体AI中台,为央视打造人工智能开放平台,提供智能标签、修复、智能翻译等30多种算法。为上海大学,利用腾讯云教育行业大模型能力,构建专属的教育行业大模型基础平台,覆盖在校生和毕业生全生命周期业务,将提供教学助手、人才培养、招生就业助手和作业批改等服务;此外,腾讯企点、腾讯会议、AI代码助手等多款头部SaaS产品,也迎来了能力升级。
我们认为,中国大模型战队中除了BAT,还应该重点关注四家企业和机构,360、华为、智源和智谱。
百度、阿里、腾讯、360、华为、智源、智谱,就好比是中国AI大模型的“战国七雄”。
7)360
2023年6月13日,360集团对外发布了360智脑大模型。360关于大模型的战略是八个字:“两翼齐飞、四路并发”。
“两翼齐飞”,一方面要发展大模型的技术,另一方面要场景化、产品化、平民化、垂直化。只是模仿ChatGPT,做了一个搜索对话框,做了一个聊天机器人,指望这个东西带来工业革命是不现实的。场景分为四路:一是To C的场景,搜索引擎+浏览器和桌面。二是面向中小企业。三是面向政府、大型企业。四是面向行业的GPT,跟有行业数据的合作伙伴相结合。
8)华为
2023年7月7日,华为发布盘古大模型3.0.“不作诗、只做事”、“AI 重塑千行百业”、“AI for Industries ”华为的盘古大模型聚焦行业价值场景,围绕行业重塑、技术扎根、开放同飞三大方向,为行业客户提供服务。
盘古大模型3.0是一个完全面向行业的大模型系列,包括5+N+X三层架构。
华为从2019年到2021年之间就开始立项做盘古大模型。2021年发布了盘古NLP大模型、盘古机器视觉大模型、盘古科学计算大模型、盘古药物分子大模型。到2022年在行业中拓展应用,发布了盘古矿山大模型、盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型。2023年7月7日发布的盘古大模型3.0,重点提及了5个基础大模型(自然语言、多模态、视觉、预测、科学计算)和7个行业大模型(政务、金融、制造、药物分子、矿山、铁路、气象)。
9)智源
2023年6月9日,智源研究院院发布了全面开源的“悟道3.0”系列大模型及算法。继 2021 年悟道大模型项目(悟道1.0于2021年3月发布)连创“中国首个+世界最大”纪录之后,智源 “悟道3.0 ”进入全面开源新阶段,带来一系列领先成果:“悟道·天鹰”(Aquila)语言大模型系列、天秤(FlagEval)开源大模型评测体系与开放平台,“悟道 · 视界”视觉大模型系列,以及一系列多模态模型成果。
10)智谱
2023年3月,基于千亿基座模型的ChatGLM开启内测。智谱AI由清华大学计算机系的技术成果转化而来,致力于打造新一代认知智能通用模型,提出了Model as a Service(MaaS)的市场理念。公司于2021年合作研发了双语千亿级超大规模预训练模型GLM-130B,并主导构建了高精度通用知识图谱,把两者有机融合为数据与知识双轮驱动的认知引擎,并基于此千亿基座模型打造ChatGLM。此外,智谱AI也推出了认知大模型平台Bigmodel.ai,形成AIGC产品矩阵。通过认知大模型链接物理世界的亿级用户、赋能元宇宙数字人、成为具身机器人的基座,赋予机器像人一样“思考”的能力。
最后,我们回看几个问题。
1、中国为什么一定要自研AI大模型?
基于战略安全角度和经济商业价值,都能得出中国一定要自研AI大模型这一确切答案。从中美贸易战到芯片卡脖子等,中国政府必然要保证关键技术的自主可控和国家安全。并且OpenAI和微软的实践也表明了,AI大模型将有巨大的商业价值,中国企业需要抓住这一机遇。
李开复也认为,“使用海外的开源大模型就可以做出中国版的OpenAI”的说法是绝对错误的,技术的天花板将决定你永远做不出达到或超越GPT-4.0技术水平的大模型。此外,拿海外训练出来的大模型,在国内做微调是值得商榷的。因为国内外的文化习惯、法律法规不同,所以自主创新做大模型是中国企业的必经之路。
2、中国AI大模型产品何时能赶上“ChatGPT”?
李彦宏曾公开表示,文心一言与ChatGPT版本差距并不明显,可能只相差一两个月的时间。对于这种说法,王小川则调侃称,媒体采访的可能是平行世界的李彦宏。
王小川认为国内目前的大模型和ChatGPT的差距不可能只是两个月。“如果在追上目前ChatGPT-3.5的水平,大概今年内就能做到,但如果要追上未来的GPT-4和GPT-5,预计要3年左右的时间。”
艾瑞咨询认为,与ChatGPT功能对标的大语言模型(Large Language Models, LLMs),目前国外主要有Google推出的Gopher、LaMDA以及Meta的Llama等;国内为百度首发的“文心一言”、360发布的大语言模型、阿里发布的“通义千问”、商汤发布的 “商量”等。虽从对话和文本生成的直观体验看ChatGPT略胜一筹,但对于Google等国外大厂而言,克隆ChatGPT并不存在太高壁垒,当前暂时落后主要是出于公司战略与技术理念差异,选择了不同技术路线,随着各家探索成果和新技术方法的实践不断推进,仍存在对GPT系列模型赶超的可能。对百度等国内大厂而言,则在数据、算力、工程化能力等关键要素上存在短板,短期内难以对国外领先大模型实现赶超,为跟随者角色,长期更需要国内AI全产业链整体进化。
3、AI大模型的竞争关键和创新机会在哪?
1)通过OMG可以看到:ChatGPT在逻辑推理、上下文理解等方面的能力,是模型参数量达到该量级后“涌现”出的,即所谓的“大力出奇迹”。在此之前,坚定的科研初心,丰厚的资本支持,是中国科技企业需要向美国科技企业认真学习的。
2)通过百度可以看到:“基础层+模型层+应用层”,底层技术的积累至关重要。无论是芯片层的昆仑还是框架层的飞桨,“根技术”的深厚决定枝叶的生长速度。
3)通过阿里可以看到:“互联网时代的产品都值得用AI重新升级”。阿里是这么说的,也是这么做的。必然有后浪高举AI原生的旗帜,颠覆马云的互联网思维。
4)通过腾讯和华为可以看到。无论是云服务还是大模型,竞争的核心和商业的重点,都指向行业ToB服务,AI大模型要更有行业价值,也要“离钱更近一点”。
5)通过360可以看到,数字人是大模型重要的应用入口,大模型的发展要和国家的产业数字化战略相结合,企业级垂直大模型更为关键。把大模型拉下神坛,变成每个企业、政府部门都感觉能够直接使用的东西。
4、中小企业该如何面对AI大模型?
李开复说:
我们完全可以想象今天的Word、PowerPoint、Excel、Photoshop等应用通通都会用AI大模型重写一次,而且重写之后它的用户体验会变,甚至商业模式也会变。
李彦宏说:
业界有一种说法,大模型时代来了,每一个产品都值得重做一遍。但谁真正重新做了一遍呢?百度要做第一个把全部产品重做一遍的公司,不是整合,不是接入,是重做,重构!
也有企业保持理性:
折腾是找死!不折腾是等死!
大模型更像是巨头的游戏和军备竞赛,它和芯片、语料息息相关,如果没有巨量的资金储备,很难真正做大模型;非巨头还是要理性看待大模型。
大模型是基础建设,行业模型与应用场景等将拥有更大的发展机会?
创业黑马近期举办了两期AIGC产业营,参与者大多都是中小企业,300家。
通过其数据可以发现:25%的企业已经开始探索和应用AIGC,传统产业的企业期望利用AIGC转型升级,300家企业分布在企服、消费、培训、文娱、营销等各个行业领域。
但无论如何,中小企业不得不去思考:
有没有能力做AI大模型或行业模型?
自己的行业会不会出现新的AI产品?
新的AI产品会不会颠覆自己?
自己有没有能力做出那个AI产品?
自己原有产品如何基于AI新技术进行迭代创新?
自己基于大模型做微调做应用层创新?
基于国内外的哪个大模型做应用研发和产品创新?
不考虑大模型,直接用AIGC的产品或工具,简单粗暴降本增效?
……
最后,还有一点值得大家注意:
“十年前的传统观点认为,人工智能首先会影响体力劳动,然后是认知劳动,再然后,也许有一天可以做创造性工作。现在看起来,它会以相反的顺序进行。”
高科技投机机构ARK Invest预测,以AIGC为代表的新一代人工智能技术将辅助知识工作者(包括教师、律师、医生、财务、程序员等白领职业)提高工作效率。报告预测,到 2030 年,AI 将大幅提高知识工作者的工作效率,平均工作效率增加140%,新一代人工智能技术将有可能大幅度降低脑力劳动者的工作强度。如果这一切成为现实,或将是继人类历史上由于动力革命而摆脱繁重的体力劳动之后,人类社会发生的又一次伟大的技术革命。
上面引号里那句话,是ChatGPT创始人,山姆·阿尔特曼,说的。
他还说过一个观点:
“没必要担心被AI取代,人类和机器终将融为一体。”