在知乎看到有人这么评价「清华系开源大模型 (MiniCPM-Llama3-V 2.5) 被抄袭」事件:
整件事就是,一个毫无名气的中国学生团队基于美国meta开源的llama3最小的那个模型搞个了毫无商业价值的开源模型,被美国一个同样毫无名气的学生团队抄了。
via https://www.zhihu.com/question/657971226/answer/3519464358
虽然这番评论比较尖酸刻薄,但其实整体没什么毛病。
不过说回我们在 AI 领域贡献的开源大模型技术,从此次事件来看,中国的开源模型其实十分强大,但在国际社区中的整体知名度并不高。
比如本次事件中的 MiniCPM,其作为一个极其强大的开源模型,在发布后并没有得到应有的关注,反而是其套壳的海外版本意外走红。
直到抄袭事件曝光,许多本应持续关注开源社区优秀作品的研究者才意识到 MiniCPM 的存在。
斯坦福人工智能实验室主任Christopher Manning “怒斥”本校学生:
这是典型的不承认自己错误!
就连抄袭事件的主角之一也在回应中所表示,他们 “看了很多最近的论文以验证这项工作的创新性,但却并不知道也未被告知有关 OpenBMB 的任何先前工作”。
OpenBMB开源社区由清华大学自然语言处理实验室和面壁智能共同支持发起,旨在打造大规模预训练语言模型库与相关工具, 加速百亿级以上大模型的训练、微调与推理,降低大模型使用门槛,与国内外开发者共同努力形成大模型开源社区, 推动大模型生态发展,实现大模型的标准化、普及化和实用化。
DeepMind 工程师也指出,这件事里有意思的地方是,相比造假的 Llama3-V,MiniCPM 是真的存在的能达到如此强大能力的模型。但是它获得的关注是如此之少。同样的结果,就因为不是来自一些常青藤大学,就无法流行起来。
还有一位国外 AI 社区的创始人也说道:“中国在机器学习生态的工作一直以来都被社区忽视了。他们正在用有趣的 LLM、VLM、音频和扩散模型做一些令人惊奇的事情。”
事实上,中国大模型在国际社区中确实有非常好的口碑。
通义千问不久前开源千亿参数大模型 Qwen1.5-110B 就在国外社区引起巨大反响,持续占领了 Hacker News 热度榜首一段时间。
当时 Stability AI 研究主管 Tanishq Mathew Abraham 说道:
“许多最具竞争力的开源大模型,包括 Qwen、Yi、InternLM、Deepseek、BGE、CogVLM 等正是来自中国。
关于中国在人工智能领域落后的说法完全不属实。相反,他们正在为生态系统和社区做出重大贡献。”
还有人表示,由于中英文间的语言障碍,海外通常能看到中国大模型也只是发布的一部分,太多 AI 应用和集成没有被完全展现。推测这些模型在中文上表现应该比英文更好。但即便如此,它们在英文基准测试上已具备相当的竞争力。
也有人称自己属实被过去一年中 Arxiv 上 AI 论文里中文署名作者的庞大数量震惊到了。
前斯坦福兼职讲师、Claypot AI 联合创始人 Chip Huyen 在调研过 900 个流行开源 AI 工具后,在个人博客中分享自己的发现:“在 GitHub 排名前 20 的账户中,有 6 个源自中国。”
OpenAI 早期投资人 Vinod Khosla 曾在 X 发文称,美国的开源模型都会被中国抄去。
但这番言论马上被 Meta 首席人工智能科学家——有“AI 教父”之称的 Yann LeCun 反驳:“AI 不是武器。无论我们是否把技术开源,中国都不会落后。他们会掌控自己的人工智能,开发自己的本土技术栈。”
还有在斯坦福读书的同学也分享称,教授在课堂上大力称赞中国开源模型,特别是开诚布公地与社区积极分享成果,跟欧美一些头顶 “开源” 名号的明星公司不同。
有网友也表达了和这个教授相似的观点,“美国最该尴尬的,是今天中国开源模型们重大的贡献”。
正如面壁智能创始人刘知远所说:
从横向来看,我们显然仍与国际顶尖工作如Sora和GPT-4o有显著差距;
同时,从纵向来看,我们已经从十几年前的nobody,快速成长为人工智能科技创新的关键推动者。
Reference
https://mp.weixin.qq.com/s/WctorGul9oMjPlzpscRvhg
https://x.com/chrmanning/status/1797664513367630101
https://x.com/giffmana/status/1797603360230760471
https://x.com/osanseviero/status/1797635895610540076
https://openbmb.cn/
END
热门文章
-中国 Python 开源项目作者被诺贝尔奖得主邀请会面
-腾讯牌安卓模拟器,微软都说好!
-最适合写代码的等宽字体Cascadia Code——三年来首次大版本更新:由微软开源、新增两款Nerd字体
-微软工程师真会整活,将.NET移植到40年前的任天堂NES