近日,美国斯坦福大学AI团队主导的Llama3-V开源模型被证实套壳抄袭国内清华大学与面壁智能的开源模型“小钢炮”MiniCPM-Llama3-V 2.5。斯坦福团队的两位作者就这一学术不端行为正式道歉,并撤下了模型。
短短几天内,这场风波尘埃落定,与中国团队给出的证据之确凿不无关系。上个月底,斯坦福团队在网络上宣传只需500美元就可训练出一个超越GPT-4V的SOTA多模态大模型。但很快就有人发现,该团队的Llama3-V模型使用的模型结构和代码与国内团队发布的MiniCPM-Llama3-V2.5极为相似。
紧接着,国内团队发现,Llama3-V可以识别出“清华简”战国古文字,“不仅对得一模一样、连错得都一模一样”。而这一古文字数据为研究团队花费数月从“清华简”上逐字扫描并人工标注得来,并未对外公开。“实锤”之下,斯坦福团队的抄袭也就无从分辩了。
诚如专家所言,尽管这次以一种令人遗憾的方式揭示了中国AI研发的较高水平,但也说明,现如今中国创业公司的大模型产品开始受到国际的广泛关注与认可。人工智能为千行万业的跨越式发展带来机遇,中国同样在追赶这一风口。截至去年底,中国有至少130家公司研究大模型产品,其中100亿级参数规模以上的大模型超过10个,10亿级参数规模以上的大模型已近80个,大模型数量位居世界第一梯队。
对于中美在大模型领域的差距,有业内人士表示,一年前,中国大模型与OpenAI、Google启动大模型研发的时间点比起来,有7到10年的差距;但如今,中美之间的差距约为6个月。曾几何时,一提及美国科技创新,很多人都是仰望心态。而新赛道上的表现证明,我们正在将差距不断缩小,完全不必妄自菲薄。
从长远来看,如今的大模型已从原来的纯语言模态逐步走向多模态的探索。相关研究正处于起步阶段,技术成熟度还不高,这为中国的发展提供了新的契机。就短板来说,我国在人工智能算力、算法上尚存一定差距。从加快全国一体化算力网建设,到构建算力产业链,再到加强行业算力建设布局,需要相关部门加速推进。
另一方面,我们占据了应用场景、人口规模和产业集群等优势,为人工智能技术的应用提供了广阔的场景和超大规模内需市场。在应用实践中锤炼、迭代和改进的技术,反过来又会促进应用更加深化,从而形成技术进步与应用推广相互推进的良性循环。我们要充分发挥自身制度优势,保持独立自主的精气神,更加自信地勇闯“无人区”,更加主动地拥抱世界,在部分技术不占先发优势的情况下,加快脚步、站稳脚跟。
“人工智能是引领这一轮科技革命和产业变革的战略性技术,具有溢出带动性很强的‘头雁’效应。”我们既要“紧张”起来,以时不我待的紧迫感去抢抓机遇,保持第一梯队的位置;也要“放松”下来,以更加自信的姿态,有条不紊、踏踏实实地走好自己的路。时间,永远不会辜负智慧与汗水。
撰文:夏天