当前位置:首页|资讯|商汤|ChatGPT

【原创】读创下午茶|中国大模型赛道风起云涌!商汤今日官宣:于高考等多项评测,其大模型已超ChatGPT

作者:读创发布时间:2023-06-07

原标题:【原创】读创下午茶|中国大模型赛道风起云涌!商汤今日官宣:于高考等多项评测,其大模型已超ChatGPT

读创/深圳商报记者 马强

2023年高考今日开考,高考作文、AI写高考作文等关于高考的主题毫无疑问登上热搜并全网刷屏。但在另一个看不到的赛场——大模型,中美两国创业者的竞争,也在悄无声息地进行。在港上市公司商汤科技今日在其微信公众号宣布,其与上海AI实验室等发布“书生·浦语”大模型,已在包括高考在内的多项中文考试中,取得了超越ChatGPT的成绩。

▲高考首日,多个与高考相关主题登上热搜。截图来源:新浪微博

截至7日15:50,商汤科技港股报2.14港元,涨0.94%,公司总市值716.2亿港元。

▍商汤:AI考生今日抵达,“书生·浦语”大模型多项成绩领先ChatGPT

商汤科技在公众号文章中称,近日,商汤科技、上海AI实验室联合香港中文大学、复旦大学及上海交通大学发布千亿级参数大语言模型“书生·浦语”(InternLM)。“书生·浦语”具有1040亿参数,是在包含1.6万亿token的多语种高质量数据集上训练而成。

▲截图来源:商汤科技微信公众号

中文大语言模型是否能够在高考中赶超ChatGPT呢?文章称,全面评测结果显示,“书生·浦语”不仅在知识掌握、阅读理解、数学推理、多语翻译等多个测试任务上表现优秀,而且具备很强的综合能力,因而在综合性考试中表现突出,在多项中文考试中取得超越ChatGPT的成绩,其中就包括中国高考各个科目的数据集(GaoKao)。

“书生·浦语”联合团队选取了20余项评测对其进行检验,其中包含全球最具影响力的四个综合性考试评测集:

•由伯克利加州大学等高校构建的多任务考试评测集MMLU;

•微软研究院推出的学科考试评测集AGIEval(含中国高考、司法考试及美国SAT、LSAT、GRE和GMAT等);

•由上海交通大学、清华大学和爱丁堡大学合作构建的面向中文语言模型的综合性考试评测集C-Eval;

•由复旦大学研究团队构建的高考题目评测集Gaokao。

实验室联合团队对“书生·浦语”、GLM-130B、LLaMA-65B、ChatGPT和GPT-4进行了全面测试,针对上述四个评测集的成绩对比如下(满分100分)。

▲截图来源:商汤科技微信公众号

记者注意到,文章特别提到,Gaokao是由复旦大学研究团队构建的基于中国高考题目的综合性考试评测集,包含了中国高考的各个科目,以及选择、填空、问答等多种题型。在GaoKao测评中,“书生·浦语”在超过75%的项目中均领先ChatGPT;而且,在以美国考试为主的MMLU上,“书生·浦语”也实现和ChatGPT持平。

不过,商汤科技在公众号文章中也坦承,虽然“书生·浦语”在考试评测上取得优秀成绩,但在测评中也可以看到,大语言模型仍然存在不少能力局限性。“书生·浦语”受限于2K的语境窗口长度(GPT-4的语境窗口长度为32K),在长文理解、复杂推理、撰写代码以及数理逻辑演绎等方面还存在明显局限。另外,在实际对话中,大语言模型还普遍存在幻觉、概念混淆等问题。这些局限使得大语言模型在开放场景中的使用还有很长的路要走。

▍中美是大模型赛道头部玩家,中国今年新增大模型已超美国

入局的远不止商汤科技!自ChatGPT去年末在全球掀起巨大轰动以来,大模型无疑已成为全球最热闹的赛道之一。在这个赛道上,中美是两大头部玩家。数据显示,中国已推出79个大语言模型,尤其是在2023年以来,推出大模型的数量已超美国。

新发布的《中国人工智能大模型地图研究报告》统计,过去5年,中国10亿以上参数规模的大模型已经发布了79个,涉及14个省市,北京和广东最多。美国已经发布了100个大模型。在大模型领域,中国和美国遥遥领先,两国相加占全球总量的80%以上。

在微软OpenAI、Google的引领下,2023开年以来,全球掀起了大模型“军备竞赛”时代的序幕。中国互联网大厂和科技大佬的创业热情也由此点燃,做类ChatGPT产品、建中国版OpenAI蔚然成风,也正因此,有业内人士惊呼:AI 2.0的“诸神之战”已经开启!

互联网大厂一马当先。百度率先推出“文心一言”,腾讯推出AI智能创作助手“腾讯智影”及“混元”AI大模型,阿里达摩院推出中文多模态预训练模型M6项目,科大讯飞启动生成式预训练大模型“1+N”任务攻关,华为推出“盘古”大模型,字节跳动也被爆正在布局大模型AI Lab……

科技大佬和创业团队也不遑多让。今年2月,原美团联合创始人、高级副总裁王慧文宣布打造中国OpenAI。之后,前搜狗CEO王小川,前京东AI掌门人周伯文,阿里技术副总裁贾扬清,出门问问创始人李志飞,AI大牛、创新工场人工智能工程院院长李开复等一众大佬,争先加入ChatGPT创业队伍。今年3月,语言大模型玩家澜舟科技宣布完成了Pre-A+轮融资,并推出语言生成模型——孟子MChat可控大模型;清华唐杰教授的智谱AI;清华系黄民烈教授的聆心智能;清华系NLP实验室孙茂松、刘知远团队;深言科技岂凡超;循环智能联合创始人杨植麟;复旦邱锡鹏教授团队等等,也都被曝已或早或晚耕耘于大模型沃野。

城市是另一个维度。上海、北京两地相继出台人工智能相关政策。日前,《深圳市加快推动人工智能高质量发展高水平应用行动方案(2023-2024年)》重磅发布,深圳将发挥政府投资引导基金作用,统筹整合基金资源,形成规模1000亿元的人工智能基金群。整体来看,《行动方案》分别从强化智能算力集群供给、增强关键核心技术与产品创新能力、提升产业集聚水平等六大方向制定多项措施,旨在打造国家新一代人工智能创新发展试验区和国家人工智能创新应用先导区。

▍英伟达掌握大模型算力“命门”,黄仁勋也将访华?

说到大模型,就不得不说英伟达,以及其创始人兼首席执行官、美籍华人黄仁勋。

▲英伟达 图源:新华社

生成式AI训练大规模神经网络,需要高度复杂、并行的计算能力,传统CPU的并行计算效率较低,GPU的并行计算能力极强,非常适合训练生成式AI。英伟达目前占据着GPU市场84%的份额,可以说掌握着AI大模型“军备竞赛”的算力“命门”。失去了英伟达的GPU,大模型就会歇火。也正因此,英伟达美股年内涨幅美股第一,近日还成为全球首家“万亿俱乐部”芯片企业。

马斯克结束访华刚走,市场传言,黄仁勋也要来。据传,黄仁勋还会与腾讯、字节跳动、理想、比亚迪和小米的高管碰面。如何在美国管制之下更好地开拓中国市场,并满足中国“百模大战”的庞大算力需求,可能是黄仁勋要考虑的一大课题。

如果能顺利成行,黄仁勋将成为继库克和马斯克之后,今年第三位到访中国的万亿美元市值美国科技巨头。黄仁勋判断,未来生成式人工智能将推动万亿美元的数据中心将从通用计算向加速计算转型,但这个庞大的市场,几乎一半属于中国,一半属于美国。

▍群雄逐鹿谁能脱颖而出?优秀的技术产品是“赛马”赛出来的

对AI 2.0的前景以及大模型的未来,AI大牛李开复有着较为深刻的认知。李开复认为,AI 2.0将是一个巨大的平台机遇,其规模将是移动互联网的10倍,所有的应用和界面都会被重写一遍,将颠覆很多行业。内容生产、娱乐等是AI2.0最快也最易于落地应用的领域。

李开复还指出,使用海外的开源大模型就可以做出中国版的OpenAI的说法有误。虽然开源模型本身有一定局限性,但如果直接使用海外的开源大模型,技术的天花板将决定你永远做不出达到或超越GPT-4.0技术水平的大模型。此外,拿海外训练出来的大模型在国内做微调也值得商榷。因为国内外文化习惯、法律法规不同。所以,自主创新做大模型是中国企业的必经之路。

群雄逐鹿态势已成,谁能最后脱颖而出?李开复预计,未来不可能有50家大模型公司存在,会收敛到一个很小的数字上。不过,AI2.0市场规模巨大,足以容纳巨头、中小企业和初创公司在里面“赛马”。在当前大模型这个赛道,大家都在你追我赶,可以鼓励以各种不同的模式去先行先试,而优秀的技术产品,也正是“赛马”赛出来的。

审读:孙世建


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1