GPT-4里套娃LLaMA 2，OpenAI创始成员周末爆改「羊驼宝宝」，GitHub一日千星

作者：量子位发布时间：2023-07-24

大神仅花一个周末训练微型LLaMA 2，并移植到C语言。

推理代码只有500行，在苹果M1笔记本上做到每秒输出98个token。

作者是OpenAI创始成员Andrej Karpathy，他把这个项目叫做Baby LLaMA 2（羊驼宝宝）。

虽然它只有1500万参数，下载下来也只有58MB，但是已经能流畅讲故事。

所有推理代码可以放在C语言单文件上，没有任何依赖，除了能在笔记本CPU上跑，还迅速被网友接力开发出了各种玩法。

llama.cpp的作者Georgi Gerganov搞出了直接在浏览器里运行的版本。

提示工程师Alex Volkov甚至做到了在GPT-4代码解释器里跑Baby LLaMA 2。

大模型套娃小模型，成了。

羊驼宝宝诞生记

据Karpathy分享，做这个项目的灵感正是来自llama.cpp。

训练代码来自之前他自己开发的nanoGPT，并修改成LLaMA 2架构。

推理代码直接开源在GitHub上了，不到24小时就狂揽1500+星。

训练数据集TinyStories则来自微软前一阵的研究。

2023新视野数学奖得主Ronen Eldan、2023斯隆研究奖得主李远志联手，验证了1000万参数以下的小模型，在垂直数据上训练也可以学会正确的语法、生成流畅的故事、甚至获得推理能力。

此外，开发过程中还有一个插曲。

Karpathy很久不写C语言已经生疏了，但是在GPT-4的帮助下，还是只用一个周末就完成了全部工作。

对此，英伟达科学家Jim Fan评价为：现象级。

最初，在CPU单线程运行、fp32推理精度下，Baby LLaMA 2每秒只能生成18个token。

在编译上使用一些优化技巧以后，直接提升到每秒98个token。

优化之路还未停止。

有人提出，可以通过GCC编译器的-funsafe-math-optimizations模式再次提速6倍。

除了编译方面外，也有人提议下一步增加LoRA、Flash Attention等模型层面流行的优化方法。

Baby LLaMA 2一路火到Hacker News社区，也引发了更多的讨论。

有人提出，现在虽然只是一个概念验证，但本地运行的语言模型真的很令人兴奋。

虽然无法达到在云端GPU集群上托管的大模型的相同功能，但可以实现的玩法太多了。

在各种优化方法加持下，karpathy也透露已经开始尝试训练更大的模型，并表示：

70亿参数也许触手可及。

GitHub

https://github.com/karpathy/llama2.c

在浏览器运行Baby LLaMA 2

https://ggerganov.com/llama2.c

参考链接

[1]https://twitter.com/karpathy/status/1683143097604243456

[2]https://twitter.com/ggerganov/status/1683174252990660610

[3]https://twitter.com/altryne/status/1683222517719384065

[4]https://news.ycombinator.com/item?id=36838051

本文来自微信公众号“量子位”（ID:QbitAI），作者：梦晨，36氪经授权发布。

近期资讯

坤琳讲 2024-12-28

基于微服务的校园社团平台系统-毕业设计参考文献

努力搬砖的程序员- 2024-12-28

适配出海企业的财务会计软件全解析

出海企业需强大财务软件应对跨国挑战，ZohoBooks支持多货币、语言，提供全流程服务，自动化功能提高财务效率，确保税务合规，集成Zoho生态，实时报表助决策，保障数据安全。一、了解出海企业的独特需求出海企业相比于仅在国内经营的企业，其在财务管理上面临着更多的挑战和复杂性。以下是一些核心需求：1、跨国财务合规性国际业务意味着企业需要遵循多个国家的会计和税务法规。这就要求财务软件具有强大的合规支持能力，能够自动更新各国的财务法规和税务变化，以确保财务管理的准确性和及时性。2、多语言支持不同国家的业务需要与不

Zoho云服务 2024-12-28

聚光投放底层逻辑课，从基础知识到计划搭建，助你降低开口成本十倍。

课程目录1_试看：先导课（聚光不想亏钱就耐心看完）.mp42_试看：聚光的基础知识（开户流程、禁入行业、私信白名单获取）.mp43_聚光投放的核心是什么？.mp44_聚光后台所有操作按钮底层逻辑.mp45_种草计划应该怎么搭建？.mp46_商销计划应该怎么搭建？.mp47搜索计划应该如何搭建？.mp48_客资搜集计划应该怎么搭建？.mp49_如何进行A-B测试？.mp410跑是主力计划搭建的SOP （-）.mp411_跑量主力计划搭建的SOP （二）.mp411-241225[齐齐-话术课].mp412_

凌零创业网_2025 2024-12-28

GPT-4里套娃LLaMA 2，OpenAI创始成员周末爆改「羊驼宝宝」，GitHub一日千星

羊驼宝宝诞生记

GitHub

在浏览器运行Baby LLaMA 2

参考链接

推荐体验

相关资讯