GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」，GitHub一日千星

作者：量子位发布时间：2023-07-24

梦晨发自凹非寺

量子位 | 公众号 QbitAI

大神仅花一个周末训练微型 LLaMA 2，并移植到 C语言。

推理代码只有500行，在苹果M1笔记本上做到 每秒输出98个token。

作者是OpenAI创始成员 Andrej Karpathy，他把这个项目叫做 Baby LLaMA 2（羊驼宝宝）。

虽然它只有 1500万参数，下载下来也只有 58MB，但是已经能流畅讲故事。

所有推理代码可以放在 C语言单文件上， 没有任何依赖，除了能在笔记本CPU上跑，还迅速被网友接力开发出了各种玩法。

llama.cpp的作者 Georgi Gerganov搞出了 直接在浏览器里运行 的版本。

提示工程师 Alex Volkov甚至做到了 在GPT-4代码解释器里跑Baby LLaMA 2。

大模型套娃小模型，成了。

羊驼宝宝诞生记

据Karpathy分享，做这个项目的灵感正是来自llama.cpp。

训练代码来自之前他自己开发的nanoGPT，并修改成LLaMA 2架构。

推理代码直接开源在GitHub上了，不到24小时就狂揽1500+星。

训练数据集TinyStories则来自微软前一阵的研究。

2023新视野数学奖得主Ronen Eldan、2023斯隆研究奖得主李远志联手， 验证了1000万参数以下的小模型，在垂直数据上训练也可以学会正确的语法、生成流畅的故事、甚至获得推理能力。

此外，开发过程中还有一个插曲。

Karpathy很久不写C语言已经生疏了，但是在GPT-4的帮助下，还是只用一个周末就完成了全部工作。

对此，英伟达科学家Jim Fan评价为： 现象级。

最初，在CPU单线程运行、fp32推理精度下，Baby LLaMA 2每秒只能生成18个token。

在编译上使用一些优化技巧以后，直接提升到每秒98个token。

优化之路还未停止。

有人提出，可以通过GCC编译器的-funsafe-math-optimizations模式再次 提速6倍。

除了编译方面外，也有人提议下一步增加LoRA、Flash Attention等模型层面流行的优化方法。

Baby LLaMA 2一路火到Hacker News社区，也引发了更多的讨论。

有人提出，现在虽然只是一个概念验证，但本地运行的语言模型真的很令人兴奋。

虽然无法达到在云端GPU集群上托管的大模型的相同功能，但可以实现的玩法太多了。

在各种优化方法加持下，karpathy也透露已经开始尝试训练更大的模型，并表示：

70亿参数也许触手可及。

GitHub：

https://github.com/karpathy/llama2.c

在浏览器运行Baby LLaMA 2：

https://ggerganov.com/llama2.c

— 完—

「AIGC算力全景与趋势报告 · 量子位智库」下载

AIGC时代，算力成为「硬通货」。当前大模型的发展对算力产生新的需求，算力行业迎来变革机会。机遇当前，量子位智库发布《AIGC算力全景与趋势报告》，扫描下方二维码即可查看完整报告。

8月上旬，我们将举办「量子位AIGC行业沙龙——AIGC时代的算力基石」，欢迎感兴趣的企业联系～

点这里 👇关注我，记得标星哦～

一键三连「分享」、「点赞」和「在看」

科技前沿进展日日相见 ~

近期资讯

江苏百尔智能装备取得货物自动装卸车专利，方便工作人员使用

金融界2024年12月31日消息，国家知识产权局信息显示，江苏百尔智能装备有限公司取得一项名为“种货物自动装卸车”的专利，授权公告号CN222223995U，申请日期为2024年4月。

金融界 2024-12-31

如何轻松制作个性化二维码及其广泛应用与未来展望

随着科技的发展，二维码越来越普及了。还有一些活动，比如会议、展会，通常会使用二维码签到，提前生成好二维码，参与者到场后只需出示二维码，工作人员扫一扫，就能完成签到，节省了时间。

新报观察 2024-12-31

京东通信网上营业厅下线，用户可通过微信营业厅办理相关业务

12月31日消息，京东通信官网显示，京东通信网上营业厅将于今日正式下线，用户可通过微信营业厅办理相关业务。公开资料显示，京东集团在2013年12月获得工信部颁发的国家首批虚拟运营商牌照，与中国联通和中国电信两家基础通信运营商合作提供移动通信服务。

砍柴网 2024-12-31

苹果新款Magic Mouse要2026年底才推出！充电位置终于改了

12月31日消息，据媒体报道，苹果公司正计划对其MagicMouse进行重大重新设计，并预计在2026年底与OLEDMacBookPro一同亮相。

砍柴网 2024-12-31

如何设置安全电脑密码以保护个人隐私和数据安全的实用指南

而通过设置密码，我们可以有效地阻止未授权的访问，确保自己的信息只有自己才能查看。那么，具体怎么设置呢？接下来，选择你的账户，然后点击“更改密码”按钮。最后，提醒大家，设置密码并不意味着万无一失。

新报观察 2024-12-31

如何解决电脑麦克风无声音问题的全面指南与技巧分享

在现代生活中，电脑麦克风的使用越来越普遍。无论是视频会议、在线课程，还是游戏聊天，良好的音质都能提升我们的体验。但是，有时候我们会遇到这样的问题：电脑麦克风没声音。这可真让人头疼，特别是当你急着开会或者玩游戏的时候。别担心，今天我们就来聊聊如何解决这个问题。首先，检查硬件连接是个不错的开始。

新报观察 2024-12-31

汉桐科技取得车联网T-BOX终端专利，实现设备整体安装稳固且操作方便

金融界2024年12月31日消息，国家知识产权局信息显示，汉桐科技（武汉）有限公司取得一项名为“一种车联网T-BOX终端”的专利，授权公告号CN222224028U，申请日期为2024年3月。

金融界 2024-12-31

宁波森富利电机取得一种用于车载屏幕的阻尼旋转装置专利，可防止输出主轴自由偏转

金融界2024年12月31日消息，国家知识产权局信息显示，宁波森富利电机有限公司取得一项名为“一种用于车载屏幕的阻尼旋转装置”的专利，授权公告号CN222224034U，申请日期为2024年4月。

金融界 2024-12-31

广东信源物流设备取得一种导轨嵌入式车载自动装卸设备专利，实现装卸货物等环节自动化、无人化

金融界2024年12月31日消息，国家知识产权局信息显示，广东信源物流设备有限公司取得一项名为“一种导轨嵌入式车载自动装卸设备”的专利，授权公告号CN222223994U，申请日期为2024年5月。

金融界 2024-12-31

如何设置个性化铃声，让你的苹果手机在嘈杂环境中脱颖而出

使用预设铃声如果你不想费太多心思，直接使用苹果手机自带的铃声是个不错的选择。在设置铃声的时候，先打开你的手机，找到“设置”这个应用。

新报观察 2024-12-31

GPT-4里套娃LLaMA 2！OpenAI创始成员周末爆改「羊驼宝宝」，GitHub一日千星

推荐体验

相关资讯