微软推出iPhone能跑的ChatGPT级模型，网友：OpenAI得把GPT-3.5淘汰了

作者：量子位发布时间：2024-04-23

微软 OpenAI ChatGPT LLaMA

梦晨发自凹非寺量子位 | 公众号 QbitAI

Llama 3发布刚几天，微软就出手截胡了？

刚刚发布的Phi-3系列小模型技术报告，引起AI圈热议。

其中仅3.8B参数的Phi-3-mini在多项基准测试中超过了Llama 3 8B。

为了方便开源社区使用，还特意设计成了与Llama系列兼容的结构。

微软这次打出“手机就能直接跑的小模型”的旗号，4bit量化后的phi-3-mini在iPhone 14 pro和iPhone 15使用的苹果A16芯片上跑到每秒12 token。

这意味着，现在手机上能本地运行的最佳开源模型，已经做到ChatGPT水平。

在技术报告中还玩了一把花活，让phi-3-mini自己解释为什么构建小到手机能跑的模型很令人惊叹。

除了mini杯之外，小杯中杯也一并发布：

Phi-3-small，7B参数，为支持多语言换用了tiktoken分词器，并额外增加10%多语种数据。

Phi-3-medium，14B参数，在更多数据上训练，多数测试中已超越GPT-3.5和Mixtral 8x7b MoE。

（大杯他们目前不打算做）

作者阵容一看也不简单，一眼扫过去MSRA和MSR雷蒙德团队都投入了不少人。

那么，Phi-3系列到底有什么独特之处呢？

根据技术报告中披露，其核心秘诀就在于数据。

去年团队就发现，单纯堆砌参数量并不是提升模型性能的唯一路径。

反而是精心设计训练数据，尤其是利用大语言模型本身去生成合成数据，配合严格过滤的高质量数据，反而能让中小模型的能力大幅跃升。

也就是训练阶段只接触教科书级别的高质量数据，Textbooks are all you need。

Phi-3也延续了这一思路，这次他们更是下了血本:

投喂了多达3.3万亿token的训练数据（medium中杯是4.8万亿）

大幅强化了数据的”教育水平”过滤

更多样化的合成数据，涵盖逻辑推理、知识问答等多种技能

独特的指令微调和RLHF训练，大幅提升对话和安全性

举个例子，比如某一天足球比赛的结果可能对于大模型是良好的训练数据，但微软团队删除了这些加强知识的数据，留下更多能提高模型推理能力的数据。

这样一来，对比Llama-2系列，就可以用更小的参数获得更高的MMLU测试分数了。

不过小模型毕竟是小模型，也不可避免存在一些弱点。

微软透露，模型本身参数中没能力存储太多事实和知识，这一点也可以从TriviaQA测试分数低看出来。

缓解办法就是联网接入搜索引擎增强。

总之，微软研究院团队是铁了心了要在小模型+数据工程这条路上走下去，未来还打算继续增强小模型的多语言能力、安全性等指标。

对于开源小模型超过ChatGPT这回事，不少网友都认为压力现在给到OpenAI这边，需要赶快推出GPT-3.5的继任者了。

参考链接：[1]https://arxiv.org/abs/2404.14219

本文来自微信公众号“量子位”（ID：QbitAI），作者：关注前沿科技，36氪经授权发布。

近期资讯

如何用手机拍出高质量视频的实用技巧与创意分享指南

在这个数字化的时代，手机已经成为我们生活中不可或缺的一部分。无论是记录日常生活、分享旅行经历，还是制作专业视频，手机拍视频的功能越来越强大。今天就来聊聊如何用手机拍出好看的视频，绝对能让你的视频在朋友圈中脱颖而出。首先，了解你的设备很重要。不同的手机在摄像头的质量、功能和操作上可能差异很大。

新报观察 2024-12-30

如何轻松下载安装微信，掌握使用技巧与注意事项分享

录”里，点击右上角的“添加朋友”，通过手机号、微信号或者扫一扫来添加好友。这样就能轻松找到身边的朋友，随时随地聊天。如果你想使用微信支付，那就更方便了。只要绑定你的银行卡，就能轻松进行转账、付款，甚至购物。支付的时候，微信的二维码功能也非常实用，商家只需扫描你的二维码，你的钱就能瞬间到账。当然，使用微信的时候，保护个人隐私也很重要。

新报观察 2024-12-30

合肥明士达取得铸件表面毛刺打磨装置专利，实现操作简单快捷且成本低

金融界2024年12月30日消息，国家知识产权局信息显示，合肥明士达科技发展有限公司取得一项名为“种铸件表面毛刺打磨装置”的专利，授权公告号CN222222072U，申请日期为2024年4月。

金融界 2024-12-30

中建二局第四建筑工程取得一种焊接点打磨装置专利，为管材焊接点的打磨工作增添操作使用便捷

金融界2024年12月30日消息，国家知识产权局信息显示，中建二局第四建筑工程有限公司取得一项名为“一种焊接点打磨装置”的专利，授权公告号CN222222073U，申请日期为2024年4月。

金融界 2024-12-30

宁波市镇海甬力取得球体铸件表面处理装置专利，可自动调节铸件角度提高打磨效率

金融界2024年12月30日消息，国家知识产权局信息显示，宁波市镇海甬力机械铸造有限公司取得一项名为“一种球体铸件表面处理装置”的专利，授权公告号CN222222079U，申请日期为2024年5月。专利摘要显示，实用新型提供了一种球体铸件表面处理装置，属于铸造件表面处理技术领域。

金融界 2024-12-30

如何设置U盘启动：步骤详解与常见问题解决指南

那么，怎么设置U盘启动呢？你需要一个U盘，容量一般来说8GB就足够了，当然，如果你要安装大一些的操作系统，可能需要更大的。

新报观察 2024-12-30

如何解决以太网未连接问题：实用技巧与步骤分享

在日常生活中，网络已经成为我们不可或缺的一部分。无论是工作、学习还是娱乐，网络的稳定性都直接影响着我们的体验。然而，有时候我们会遇到“以太网未连接”的问题，这可真让人头疼。别担心，今天就来聊聊这个问题，看看我们该如何解决。首先，遇到以太网未连接的情况，最常见的就是网络线的问题。你可以先检查一下网线是否插好。

新报观察 2024-12-30

海宁明益电子取得压铸件表面处理设备专利，可对压铸件不同位置进行充分均匀打磨

金融界2024年12月30日消息，国家知识产权局信息显示，海宁明益电子科技有限公司取得一项名为“一种压铸件表面处理设备”的专利，授权公告号CN222222078U，申请日期为2024年5月。专利摘要显示，本实用新型涉及压铸件加工技术领域，公开了一种压铸件表面处理设备，包括底座，所述底座顶端的内部设置有安装板。

金融界 2024-12-30

如何设置苹果手机实现接听电话时的震动提醒功能解析

在我们日常生活中，手机已经成为了不可或缺的一部分。无论是工作、社交还是娱乐，手机都扮演着重要的角色。尤其是苹果手机，以其简洁的操作和流畅的体验，吸引了无数用户。今天，我们来聊聊一个实用的小技巧——如何设置苹果手机接通电话时的震动提醒。说到震动提醒，很多人可能觉得这好像是个小事，但其实它能在很多场合下给我们带来方便。

新报观察 2024-12-30

安徽望博新材料取得用于铝板带生产的边条去毛边装置专利，提高去毛边的工作质量

金融界2024年12月30日消息，国家知识产权局信息显示，安徽望博新材料有限公司取得一项名为“用于铝板带生产的边条去毛边装置”的专利，授权公告号CN222222077U，申请日期为2024年5月。专利摘要显示，本实用新型公开了用于铝板带生产的边条去毛边装置，属于铝板带生产技术领域。

金融界 2024-12-30

微软推出iPhone能跑的ChatGPT级模型，网友：OpenAI得把GPT-3.5淘汰了

推荐体验

相关资讯

微软发苹果手机能跑的ChatGPT级模型，网友：得把GPT3.5淘汰了

OpenAI 推出新模型 —— GPT-4o Mini ！取代 GPT-3.5 Turbo

小模型时代来了？微软推出其最小参数 AI 模型，性能逼近 GPT-3.5

开源大模型超越GPT-3.5！爆火MoE实测结果出炉，网友：OpenAI越来越没护城河了

联网GPT-3.5上线！网友实测给差评

近期资讯

如何用手机拍出高质量视频的实用技巧与创意分享指南

如何轻松下载安装微信，掌握使用技巧与注意事项分享

合肥明士达取得铸件表面毛刺打磨装置专利，实现操作简单快捷且成本低

中建二局第四建筑工程取得一种焊接点打磨装置专利，为管材焊接点的打磨工作增添操作使用便捷

宁波市镇海甬力取得球体铸件表面处理装置专利，可自动调节铸件角度提高打磨效率

如何设置U盘启动：步骤详解与常见问题解决指南

如何解决以太网未连接问题：实用技巧与步骤分享

海宁明益电子取得压铸件表面处理设备专利，可对压铸件不同位置进行充分均匀打磨

如何设置苹果手机实现接听电话时的震动提醒功能解析

安徽望博新材料取得用于铝板带生产的边条去毛边装置专利，提高去毛边的工作质量

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响