13B模型全方位碾压GPT-4？这背后有什么猫腻

作者：机器之心发布时间：2023-11-18

GPT-4 OpenAI

一个参数量为 13B 的模型竟然打败了顶流 GPT-4？就像下图所展示的，并且为了确保结果的有效性，这项测试还遵循了 OpenAI 的数据去污方法，更关键的是没有发现数据污染的证据。如果你细细查看图...【查看原文】

相关资讯

机器之心 2023-10-23

首次击败GPT-4？700亿参数Xwin-LM登顶斯坦福AlpacaEval，13B模型吊打ChatGPT

研究人员评估了Xwin-LM在805个问题上与Text-Davinci-003、ChatGPT和GPT-4的胜率。GPT-4的回答是正确的，但Xwin-LM不仅正确回答了问题，还解释了法语表达中「晚上好」的来…

GPT-4 ChatGPT 斯坦福

巴比特资讯 2023-09-23

全球最强开源大模型一夜易主，谷歌Gemma 7B碾压Llama 2 13B，今夜重燃开源之战

谷歌发布全球最强开源大模型Gemma，7B性能超越Llama 2 13B！谷歌和OpenAI，已经卷出了新高度。这轮番放深夜炸弹的频率，让人不得不怀疑双方都已经攒了一堆大的。

谷歌 OpenAI LLaMA

新智元 2024-02-22

近期资讯

如何高效设置权限以保障信息安全和团队协作效率

无论是在工作中，还是在个人生活里，权限的设置都是一个非常重要的环节。想象一下，如果你在一个团队中工作，大家都能随意访问和修改文件，那可能会导致混乱和误解。

新报观察 2024-12-31

被“硬控”了！网易云音乐发布2024社区年度关键词

12月31日，网易云音乐2024社区年度报告正式发布，“硬控”成为年度社区关键词。

中关村在线 2024-12-31

广东嘉拓取得涂布机收放卷转塔机构及涂布生产线专利，具有翻转架两侧翻转同步性高，翻转性能稳定的优点

金融界2024年12月31日消息，国家知识产权局信息显示，广东嘉拓自动化技术有限公司取得一项名为“一种涂布机收放卷转塔机构及涂布生产线”的专利，授权公告号CN222225495U，申请日期为2024年4月。

金融界 2024-12-31

蜂巢能源取得自动接带机构及放卷设备专利，有效提高设备生产效率

金融界2024年12月31日消息，国家知识产权局信息显示，蜂巢能源科技股份有限公司取得一项名为“自动接带机构及放卷设备”的专利，授权公告号CN222225492U，申请日期为2023年12月。

金融界 2024-12-31

开箱评测奢音X9是2024最好的韶音平替吗

前言：奢音X9已经首发上市了，今天我们抢先拿到了新品，给大家揭秘这次产品更新，都有哪些变化呢？奢音X9采用防水机身，经过防水标准检测，达到了IPX8级防水。

砍柴网 2024-12-31

探讨电话能打不能接的多种原因及解决方案

工具打电话。如果网络信号不好，或者对方的网络不稳定，电话就可能无法接通。这时候，你可能还会看到“正在连接中”的提示，但其实根本没有成功。说到这里，可能你会问，既然原因这么多，怎么办呢？首先，遇到这种情况，我们可以先确认一下自己的信号是否良好。如果信号很好，那就得考虑对方的手机情况了。

新报观察 2024-12-31

折叠屏iPhone定档2026年

据最新报道，苹果正在积极推进其首款折叠屏iPhone的研发进程，并有望于2026年5月正式进入量产阶段。据外媒爆料，这款折叠屏iPhone预计将采用横折设计，展开后的屏幕尺寸将达到7英寸，由三星供应屏幕。据悉，这款折叠屏iPhone将采用前所未有的先进技术，以确保其在使用过程中的稳定性和耐用性。

中关村在线 2024-12-31

创维推出 23.8 英寸 2K 180Hz 电竞显示器 F24G52Q Pro，899 元

IT之家12月31日消息，除了27英寸的F27B50UPro之外，创维还推出了23.8英寸2K180Hz电竞显示器——F24G52QPro，首发到手价899元。

IT之家 2024-12-31

技术驱动需求为先|智象未来完成Pre-A轮融资

12月28日，智象未来科技有限公司在安徽人工智能产业先导区启动仪式中，正式发布智象多模态生成大模型3.0版。

砍柴网 2024-12-31

“烛龙”被发现，已知最遥远螺旋星系

12月31日消息，国际天文学团队借助詹姆斯・韦伯太空望远镜，通过PANORAMIC巡天项目，观测到“烛龙”（Zhúlóng）和A2744-GDSp-z4两个螺旋星系，这一发现再次革新了我们对早期宇宙星系演化的理解。

IT之家 2024-12-31

13B模型全方位碾压GPT-4？这背后有什么猫腻

推荐体验

相关资讯

13B模型全方位碾压GPT-4？这背后有什么猫腻

【Mini GPT-4】13B 使用指南

评论能力强于GPT-4，上交开源13B评估大模型Auto-J

首次击败GPT-4？700亿参数Xwin-LM登顶斯坦福AlpacaEval，13B模型吊打ChatGPT

全球最强开源大模型一夜易主，谷歌Gemma 7B碾压Llama 2 13B，今夜重燃开源之战

近期资讯

如何高效设置权限以保障信息安全和团队协作效率

被“硬控”了！网易云音乐发布2024社区年度关键词

广东嘉拓取得涂布机收放卷转塔机构及涂布生产线专利，具有翻转架两侧翻转同步性高，翻转性能稳定的优点

蜂巢能源取得自动接带机构及放卷设备专利，有效提高设备生产效率

开箱评测奢音X9是2024最好的韶音平替吗

探讨电话能打不能接的多种原因及解决方案

折叠屏iPhone定档2026年

创维推出 23.8 英寸 2K 180Hz 电竞显示器 F24G52Q Pro，899 元

技术驱动需求为先|智象未来完成Pre-A轮融资

“烛龙”被发现，已知最遥远螺旋星系

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响