2023年6月13日,360公司创始人周鸿祎在360产品发布会上表示,中国大模型部分能力已经超过了最近火热的GPT-4。此言一出,引起了广泛的关注和热议。那么,这种说法是否靠谱,中国的大模型水平到底如何呢?
这里,我们先解释一下什么是大模型,所谓大模型是指拥有巨大参数量和计算能力的人工智能模型。目前,大模型在自然语言处理、图像识别、语音识别等领域有广泛应用。而在这些领域中,由OpenAI在2023年3月15日凌晨发布的GPT-4正是一款备受瞩目的大模型,从公布的情况来看,GPT-4已经表现出许多通用人工智能(AGI)的特征,一些测试结果已经超越了大部分人。
那么,中国的大模型水平如何?我们可以从多个角度来看。
首先,客观来说,从学术研究来看,中国的大模型研究水平已经相当高。2021年,中国科学院自动化研究所、清华大学等机构的研究人员合作发布了一篇题为《GShard:高效的大规模多模态模型训练方法》的论文,该论文提出了一种高效的大规模多模态模型训练方法,这一方法事实上已经超越了OpenAI发布的GPT-3。此外,中国的大模型研究也得到了国家的大力支持,如2019年国家自然科学基金委员会设立了人工智能前沿联合基金,专门用于支持大模型研究。
其次,从产业发展来看,中国的大模型产业也在快速发展。众所周知,人工智能产业是我们高度重视的领域之一,大模型也是其中的核心技术之一。目前,中国的大模型产业已经涵盖了算法、芯片、云计算等多个领域,并且在这些领域中,中国的公司已经具备了相当的技术实力和市场份额。
最后,从技术实力来看,中国的大模型水平也在不断提升,各大互联网巨头纷纷推出自家的产品。例如,阿里巴巴推出了“通义千问”、百度公司推出了“文心一言”、华为推出了“盘古系列”AI大模型、360推出了“360智脑4.0”、商汤科技推出了“日日新”大模型、科大讯飞推出了“星火”大模型,这里就不一一列举。简而言之,中国大模型开发已经呈现“百舸争流千帆竞”的态势,其中一些大模型已经处于世界领先水平。
不过,需要注意的是,周鸿祎所说的“中国大模型部分能力已经超过GPT-4”是一个非常宏观的说法,具体指的是哪些方面,还需要更多的数据和实验来证明。因此,我们万不能盲目自信。在人工智能落地应用爆发的前夕,我们更需要的是持续投入研究和发展,才能在大模型领域取得更大的进展,赶上甚至超越国外同行。
综上所述,无论是从学术研究、产业发展还是技术实力来看,中国的大模型水平都已经达到了相当高的水平。相信在未来的发展中,中国的大模型将继续发挥着重要的作用,为人工智能领域的发展做出更大的贡献。
大家对此怎么看呢,欢迎留言讨论。关注我不迷路,下期更精彩。
我是国纳科技酱,理工科背景全媒体营销人;苏州市纳米新材料协会前理事、西建大无锡校友会副会长;百家匠心计划科普创作者;空净/节能/环保领域实践20年。
重要声明:此处所发表的文章是作者国纳科技酱原创作品,版权归国纳科技酱所拥有,部分图片来自互联网,如有侵权联系删除。