谷歌训了28个15亿参数模型，说明数据对大模型训练的影响

作者：夕小瑶发布时间：2023-05-30

谷歌 ChatGPT

随着ChatGPT的爆火，大规模语言模型（Large Language Model，LLM）如日中天。然而，由于相关数据细节并不公开，相关研究大多都是盲人摸象式探索，缺乏系统的经验指导。本文针对LL...【查看原文】

相关资讯

最强开源大模型Llama 3来了！4000亿参数模型狙击GPT-4，训练数据量达Llama 2七倍

最强开源大模型Llama 3来了！4000亿参数模型狙击GPT-4，训练数据量达Llama 2七倍智东西（公众号：zhidxcom）编译长颈鹿编辑李水青智东西4月1

LLaMA GPT-4

智东西 2024-04-19

10亿参数模型进手机！15秒即可出图，飞行模式也能用

萧箫发自凹非寺量子位 | 公众号 QbitAI 纯靠手机跑Stable Diffusion，出一张图需要多长时间？答案是15秒以内。还是开飞行模式那种，完全不需要借助云服务器的算力！不仅能生

Stable Diffusion

量子位 2023-06-19

通义千问开源720亿参数模型

北京商报讯（记者魏蔚）12月1日，阿里云开源了通义千问720亿参数模型Qwen-72B。根据10个权威基准测评结果，Qwen-72B性能超越开源标杆Llama2-70B和大部分商用闭源模型，可适配企业级、科研级的高性能应用。当天，通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio，实现“全尺寸、全模态”开源。

通义千问

北京商报 2023-12-01

最强开源大模型！阿里云开源通义千问720亿参数模型

阿里云举办通义千问发布会，宣布开源通义千问720亿参数模型Qwen-72B。该模型基于3Ttokens高质量数据训练，在10个权威基准测评中荣获最佳成绩，超越了开源标杆Llama2-70B和大部分商用闭源模型，成为业界最强的开源大模型。其性能已经得到了中小企业和个人开发者的青睐，并且累计下载量超过150万，催生了150多款新模型和应用。

通义千问

中关村在线 2023-12-01

阿里云通义千问720亿参数模型开源

12月1日，阿里云开源通义千问720亿参数模型Qwen-72B。据了解，该版本模型的性能超过Llama2-70B和大部分商用闭源模型，可适配企业级、科研级的高性能应用。此外，通义千问还开源了18亿参数模型Qwen-1.8B和音频大模型Qwen-Audio，实现“全尺寸、全模态”开源。

通义千问

南方都市报 2023-12-01

近期资讯

三星 Galaxy S25 系列想要 Qi2 无线充电，需额外购买磁吸手机壳

IT之家12月26日消息，科技媒体SamMobile昨日（12月25日）发布博文，报道称三星GalaxyS25系列手机需要搭配官方的“磁吸保护壳”，才能体验Qi2的磁吸无线充电功能。

IT之家 2024-12-26

康明斯恩泽申请基于质子交换膜电解槽的电解水制氢系统专利，降低电解水制氢系统在制氢过程中的安全风险

金融界2024年12月26日消息，国家知识产权局信息显示，康明斯恩泽（广东）氢能源科技有限公司申请一项名为“一种基于质子交换膜电解槽的电解水制氢系统”的专利，公开号CN119177458A，申请日期为2024年10月。专利摘要显示，本发明主要用于电解制氢技术领域。

金融界 2024-12-26

商标暗示三星首款 XR 头显叫“Samsung（Galaxy）Switch”

IT之家12月26日消息，根据最新公示的商标文件，三星代号为“Moohan”的首款XR头显设备在上市后，可能叫做“SamsungSwitch”或者“GalaxySwitch”。三星已在欧洲知识产权局（EUIPO）和英国知识产权局（UKIPO）注册了“SamsungSwitch”商标，预估目前已在美国和韩国进行类似的商标注册。

IT之家 2024-12-26

华为智能配件产品iFTTR全光家庭存储模块曝光,售价293元

华为智能配件产品“HUAWEIKNAS01-256G”近日现身中国电信终端产品库，这款产品的零售价格为293元。据悉，KNAS01-256G是华为的iFTTR全光家庭存储模块，需要配合带有家庭存储接口的华为FTTR设备使用。根据官方介绍，这款存储模块采用了本地和云端双备份的方式，可以实现用户数据的存储功能。

中关村在线 2024-12-26

轻松掌握文件转换为PDF格式的多种方法与技巧

在日常生活中，我们经常会遇到需要将文件转换成PDF格式的情况。无论是工作报告、学习资料，还是个人文档，PDF格式都因其良好的兼容性和排版稳定性而受到广泛欢迎。今天，我们就来聊聊如何将各种文件转换成PDF格式，过程其实并不复杂，跟着我一步一步来就好。在开始之前，先说说为什么PDF格式这么受欢迎。

新报观察 2024-12-26

意大利能源巨头埃尼启动欧洲最强超级计算机，耗资超1亿欧元

IT之家12月26日消息，意大利能源巨头埃尼（Eni）今日启动其最新的超级计算机系统HPC6，该系统跻身全球最强超算之列。HPC6坐落于米兰附近的费雷拉埃尔博尼奥内，配备了近14000块来自AMD的GPU，总投资超过1亿欧元（IT之家备注：当前约7.59亿元人民币）。该系统以其卓越的能源效率著称，由一座1兆瓦的光伏电站供电。

IT之家 2024-12-26

四川博正达机械密封件科技取得金属包装箱平口数控圆盘锯机床专利，加快了对物件切割速度

金融界2024年12月26日消息，国家知识产权局信息显示，四川博正达机械密封件科技有限公司取得一项名为“一种金属包装箱平口数控圆盘锯机床”的专利，授权公告号CN222199116U，申请日期为2024年5月。

金融界 2024-12-26

充分利用苹果TV：家庭娱乐中心的多功能指南

苹果TV在近年来逐渐成为家庭娱乐中心的核心之一，许多用户对它的使用方法和功能并不十分了解。其实，苹果TV不仅仅是一个观看视频的设备，它还可以作为你的智能家居控制中心、游戏机甚至是音乐播放器。今天，就让我来跟你聊聊如何充分利用苹果TV，让你的娱乐体验更加丰富多彩。首先，苹果TV的设置过程相对简单。

新报观察 2024-12-26

4300元抢到PS5 Pro带光驱主机网友：超值

这主要是因为PS5Pro默认不配备光驱，玩家需要额外购买才能使用。由于这一特性，导致黄牛囤积大量二手光驱，并将其在海外二手市场高价销售。该网友透露，在Facebook市场上发现了这个机会，卖家自称因被解雇而缺乏收入，并以低价出售。

中关村在线 2024-12-26

江西金品铜业取得一种铜板加工用裁切装置专利，方便固定铜板和能够变换裁切面为斜面

金融界2024年12月26日消息，国家知识产权局信息显示，江西金品铜业科技有限公司取得一项名为“一种铜板加工用裁切装置”的专利，授权公告号CN222199118U，申请日期为2024年1月。

金融界 2024-12-26

谷歌训了28个15亿参数模型，说明数据对大模型训练的影响

推荐体验

相关资讯

最强开源大模型Llama 3来了！4000亿参数模型狙击GPT-4，训练数据量达Llama 2七倍

10亿参数模型进手机！15秒即可出图，飞行模式也能用

通义千问开源720亿参数模型

最强开源大模型！阿里云开源通义千问720亿参数模型

阿里云通义千问720亿参数模型开源

近期资讯

三星 Galaxy S25 系列想要 Qi2 无线充电，需额外购买磁吸手机壳

康明斯恩泽申请基于质子交换膜电解槽的电解水制氢系统专利，降低电解水制氢系统在制氢过程中的安全风险

商标暗示三星首款 XR 头显叫“Samsung（Galaxy）Switch”

华为智能配件产品iFTTR全光家庭存储模块曝光,售价293元

轻松掌握文件转换为PDF格式的多种方法与技巧

意大利能源巨头埃尼启动欧洲最强超级计算机，耗资超1亿欧元

四川博正达机械密封件科技取得金属包装箱平口数控圆盘锯机床专利，加快了对物件切割速度

充分利用苹果TV：家庭娱乐中心的多功能指南

4300元抢到PS5 Pro带光驱主机网友：超值

江西金品铜业取得一种铜板加工用裁切装置专利，方便固定铜板和能够变换裁切面为斜面

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响