以小博大，小模型如何比肩大模型

作者：神州问学发布时间：2024-01-09

在这个数据驱动的时代，机器学习模型正迅速膨胀至前所未有的规模。巨大的模型如GPT-4和BERT，因其庞大的数据集、复杂的架构而成为行业瞩目焦点。然而，这种规模的增长并非没有代价。庞大的模型意味着巨大...【查看原文】

相关资讯

PVG！以小博大

OpenAI于2024年7月18日凌晨发布了最新的技术研究——Prover-Verifier-Games（简称“PVG”），旨在解决AI模型的“黑盒”问题，提升其推理和输出准确性。该技术通过引入一种新的训练框架，使用小模型来验证和监督大模型的输出，从而提高整体的输出准确率和可控性。具体来说，PVG框架包含两个主要组成部分：证明者（Prover）和验证者（ Verifier）。其中，证明者通常是一个更强大的模型，如GPT-4；而验证者则是一个相对较小且能力较弱的模型，如GPT-3。在这一过程中，证明者需要

OpenAI GPT-4

鲨鱼辣椒Ops 2024-07-19

以小博大进行时！2023年值得关注的个小模型

Zephyr由Hugging Face设计，是一个70亿参数的小型语言模型。实际上是在公共数据集上训练的 Mistral-7B 的微调版本，但也通过知识蒸馏技术进行了优化。

Hugging Face

null 2024-01-12

近期资讯

iPhone未进前三！国外网友票选2024最佳手机：谷歌、三星、索尼上榜

快科技12月29日消息，又到了2024年年末，每到这个时候各大平台都会举办类似最佳手机的投票。今年9to5Google、AndroidPolice和AndroidAuthority都举行了相关票选，一起来看看哪款手机获得最多国外网友的肯定。

快科技 2024-12-29

华为官宣悬赏300万元

日前，华为宣布面向全球启动2024奥林帕斯奖悬红难题征集，这是华为公司第五年举办该全球赛事。2024奥林帕斯悬红难题为：一、每bit极致性价比的存储技术；二、面向AI时代的新型数据底座。2024年的奖项设置了2个奥林帕斯奖，5个奥林帕斯先锋奖，获奖人/团队将与华为建立技术交流渠道并获得科研助力。

金融界 2024-12-29

国际观察｜美国“芯片战”的枉费心机与一错再错

雷蒙多近日接受美国媒体采访时表示，拜登政府提出的《芯片与科学法案》(芯片法案)通过联邦政府给予芯片企业巨额补贴，鼓励国内创新，有助于“打败中国”。中国海关总署数据显示，2024年前11个月，中国集成电路出口首次突破万亿元人民币，同比增长20.3%。

金台资讯 2024-12-29

河北唐山：智能餐厅让百姓在家门口吃上“科技饭”

AI智慧引导机器人领位，智能餐饮机器人炒菜，云轨系统送菜到桌……2024年12月27日，由唐山投资控股集团、唐山文旅集团筹划的文旅潮盒商业街焕新开街，文旅·云餐智能餐厅潮盒店也一同开业。文旅·云餐智能餐厅潮盒店占地面积325平方米，配备8台智能餐饮机器人，可提供主食、热菜、凉菜等60余种中式菜品，同时容纳70余人用餐。

极目新闻 2024-12-29

越疆：协作机器人龙头多项数据亮眼

【12月23日登陆港交所的次新股越疆股价异动，12月27日单日大涨23.18%】越疆是国家级专精特新“小巨人”企业，港股上市后获“协作机器人第一股”称号，主要从事协作机器人的设计等工作。其产品广泛应用于多场景，按2023年出货量计，在全球协作机器人行业中排名前二，在中国排名第一，全球市场份额为13.0%。

和讯网 2024-12-29

上海又玩“新花头”了：当AI作曲从实验室走向市场国乐+AI燃情年末

东方网记者熊芳雨12月29日报道：随着科技的发展进步，AI作曲系统正在全面参与音乐的制作流程，近日上海民族乐团在凯迪拉克·上海音乐厅举办的《零•壹|中国色》中国首台AI创作的国乐音乐会，将AI作曲的音乐作品从实验室走向市场，成功转型成观众们触手可及的艺术享受。

东方网 2024-12-29

算力直降97%，GPT-3存储只用20MB？！这篇直接在1.58-bit下训练模型的新论文火了

好家伙！1750亿参数的GPT-3只需20MB存储空间了？！基于1.58-bit训练，在不损失精度的情况下，大幅节省算力（↓97%）和存储（↓90%）。最近，从事机器学习的Will小哥发了一篇论文，直接引来几十万网友or同行围观。

量子位 2024-12-29

为低空经济提供人才智力支持：盐城温州等地高校成立低空经济产业学院

11月8日，在深圳市宝安区无人机系统应用测试基地，深圳市安特狗航天航空科技有限公司的载人飞行器在进行飞行测试。在国家发改委层面，国家发改委低空经济发展司已经公开亮相，并连续与自然资源部、生态环境部等部委、有关中央企业以及通信、导航方面有关专家进行座谈。

澎湃新闻 2024-12-29

AOC新款27寸显示器首发7599元：2K 360Hz屏、支持ULMB2

快科技12月29日消息，AOC推出了新款27寸显示器——AG276QSG，首发7599元。据悉，新款显示器配备了一块FastIPS面板，分辨率为2560x1440，最高支持360Hz刷新率，响应时间为1msGTG，支持HDR600。

驱动之家 2024-12-29

华为畅想70X手机海报曝光：支持北斗卫星双向通信、鸿蒙系统麒麟芯片

这款手机的价格定位应该在2000元左右，搭载了麒麟8000降频版处理器，预装HarmonyOS4.3系统。值得一提的是，华为畅想70Pro在今年1月开售，配备6.7英寸FHD+（1080x2388分辨率）LCD屏幕；使用一亿像素主摄，支持暗光拍摄、疾速抓拍、美颜自拍等拍照模式。

中关村在线 2024-12-29

以小博大，小模型如何比肩大模型

推荐体验

相关资讯

PVG！以小博大

以小博大进行时！2023年值得关注的个小模型

生成式AI模型转向？微软开始尝试“以小博大”

国产AI杀疯了！以小博大对战GPT，或为对抗AI iPhone的最强后援

两个小模型互相验证，直接比肩大模型？微软的rStar甚至没用CoT和微调

近期资讯

iPhone未进前三！国外网友票选2024最佳手机：谷歌、三星、索尼上榜

华为官宣悬赏300万元

国际观察｜美国“芯片战”的枉费心机与一错再错

河北唐山：智能餐厅让百姓在家门口吃上“科技饭”

越疆：协作机器人龙头多项数据亮眼

上海又玩“新花头”了：当AI作曲从实验室走向市场国乐+AI燃情年末

算力直降97%，GPT-3存储只用20MB？！这篇直接在1.58-bit下训练模型的新论文火了

为低空经济提供人才智力支持：盐城温州等地高校成立低空经济产业学院

AOC新款27寸显示器首发7599元：2K 360Hz屏、支持ULMB2

华为畅想70X手机海报曝光：支持北斗卫星双向通信、鸿蒙系统麒麟芯片

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响