当前位置：首页|资讯|OpenAI

强化学习+大模型轻松发顶会！不要光想着LLM，OpenAI o1这样做才是对的

作者：深度之眼官方账号发布时间：2024-09-29

OpenAI最近的新模型o1大家关注了吗？体验了一下雀食功能强大，逻辑和推理能力基本碾压GPT4o。研究了一下OpenAI给的技术博客，o1采用的是大模型+强化学习的策略，通过强化学习进行训练，成功突破LLM推理极限。这种策略一直以来都挺火，结合了俩热点，不仅实现了更高效的学习和更强的泛化能力，也减少了训练成本，提高系统的整体性能。目前这个方向的研究主要围绕四个技术路线展开：LLM 作为信息处理者、LLM 作为奖励设计者、LLM 作为决策者、LLM 作为生成者。最近也有了不少阶段性的成果，比如ICLR 2...【查看原文】

推荐体验

相关资讯

强化学习+大模型轻松发顶会！不要光想着LLM，OpenAI o1这样做才是对的

OpenAI最近的新模型o1大家关注了吗？体验了一下雀食功能强大，逻辑和推理能力基本碾压GPT4o。研究了一下OpenAI给的技术博客，o1采用的是大模型+强化学习的策略，通过强化学习进行训练，成功突破LLM推理极限。这种策略一直以来都挺火，结合了俩热点，不仅实现了更高效的学习和更强的泛化能力，也减少了训练成本，提高系统的整体性能。目前这个方向的研究主要围绕四个技术路线展开：LLM 作为信息处理者、LLM 作为奖励设计者、LLM 作为决策者、LLM 作为生成者。最近也有了不少阶段性的成果，比如ICLR 2

深度之眼官方账号 2024-09-29

刚刚，OpenAI震撼发布o1大模型，强化学习突破LLM推理极限

语言模型的 AlphaGo 时刻？

机器之心 2024-09-13

OpenAI震撼发布最强模型o1！强化学习突破LLM推理极限

具体来说，o1系列是OpenAI首个经过强化学习训练的模型，在输出回答之前，会在产生一个很长的思维链，以此增强模型的能力。接下来它会给自己定义任务、分析限制条件、列出需要用到的方法。o1-preview在某些…

等保测评办理 2024-10-22

模型观察室专栏：OpenAI推出o1模型！强化学习助力LLM推理能力飞跃

近日，OpenAI在官网商业化频道下，对满血版o1进行提前剧透，即正式版o1即将推出，其性能在数学和编码方面遥遥领先于现有的GPT-4o和预览版o1。 [图片] 在未来几个月里，官方计划为o1系列模型增加更多功能，如网页浏览、文件和图像上传等，并支持ChatGPT自动选择合适模型。 [图片] 此前OpenAI于9月13日正式发布针对复杂推理问题的全新大模型 o1，引起了广泛关注。 [图片] OpenAI o1的技术创新 • o1模型具备复杂推理能力，可以解决比目前专业的科学、代码和数学模型所能

OpenAI ChatGPT 编程

景联文数据标注 2024-10-30

近期资讯

SIE CEO：PS5硬件质量过硬会有很长的生命周期

西野英明表示，PS5的生命周期延长不会影响新硬件的推出时机，新技术的引入与技术进步紧密相连。索尼希望在现有硬件继续提供娱乐的同时，引入新技术，逐步扩展整个生态系统。关于PS5Pro的筹备，西野英明则认为产品的推出需要平衡技术、价格和时机，索尼始终在考虑何时推出产品最符合市场需求。

游侠网 2024-12-30

央视《焦点访谈》：岚图汽车彰显中国先进智造实力

工厂屋顶上一排排整齐排列的太阳能光伏板，年发电量2000万千瓦时；车间内935台机器人协同作业、如臂使指；AGV智能搬运机器人满载零部件，沿既定轨道驶向装配生产线；总装车间内，每118秒，就有一辆汽车从智能流水线诞生……12月28日晚黄金时段，中央电视台《焦点访谈》栏目特别策划的《信心2024》制造业专题开播，岚图汽车高端智造工厂、岚图...

中新汽车 2024-12-30

微星发布全新显示器型号MPG-325CQRXF 支持AI Vision

这款产品配备了一块31.5英寸的RapidVA曲面屏，其曲率为1000R，分辨率达到2560x1440，并且支持刷新率在48至280Hz之间。响应时间达到0.5msGTG，最大亮度可达350cd/m2，峰值亮度可达到400cd/m2。

中关村在线 2024-12-30

支付宝上线AI视觉搜索产品“探一下”，可拍图识别花草美食等

继今年7月推出“碰一下”功能后，12月30日，支付宝推出新一代AI视觉搜索产品“探一下”。“探知识”即，用户遇到不懂的事物或知识，包括花草、昆虫、美食、建筑、展览物品等，可通过“探知识”实现AI随手识图，收获新知。

财经天下WEEKLY 2024-12-30

Magic7 RSR保时捷亮相，荣耀宣布全面升级大王影像

近日，荣耀Magic7RSR保时捷设计及影像技术发布会上，荣耀正式宣布Magic7系列将全面升级“大王影像”，以人性化的摄影体验为核心目标，重塑摄影体验新境界。全新端侧AIRAW大模型技术，让手机可以充分释放传感器极限解析力，重点提升12x-30x焦段中高倍望远拍摄的照片画质。

三湘都市报 2024-12-30

在轨实施181个项目！报告首次发布→

据中国载人航天工程办公室消息，12月30日，在即将迎来中国空间站全面建成两周年之际，该办公室首次公开发布《中国空间站科学研究与应用进展报告》（2024年）（以下简称《报告》）。

光明网 2024-12-30

英伟达押注下一个增长点：“人形机器人大脑”Jetson Thor预计明年上半年上市

面对芯片业务日益激烈的竞争，英伟达正在押注机器人技术作为其下一轮增长的主要驱动力。12月29日，《金融时报》报道，英伟达将在2025年进一步加大对机器人技术的投入，在明年上半年推出新一代用于人形机器人的紧凑型计算机JetsonThor。

华尔街见闻 2024-12-30

用AI之眼探索万物，支付宝上线“探一下”

12月30日，支付宝推出新一代AI视觉搜索产品“探一下”，基于自研的多模态大模型技术，可“用AI之眼探索万物”，提供更快速、有用、趣味的生成式搜索服务。用户遇到感兴趣的事物，就能让AI通过摄像头，识别花草宠物和潮玩、做旅游的随身讲解、查询商品药品详情等，还能趣味解读萌宠照、宝宝照等，晒图不愁配文案。

扬子晚报 2024-12-30

用友：20个“关键词”解码2024大型企业数智化

2024年是大型企业数智化转型的加速之年，我们见证了大型企业数智化转型的跨越式发展!AI、大数据、云计算快速发展，成为企业数智化核心技术，众多领先企业积极探索技术与应用的融合，持续提升运营效率与决策精准度。

中国财富网 2024-12-30

科创解码｜对话张波：新材料助力绿水青山，“绿氢”来了

地球上70%是水，水里是氢和氧，这样看来氢的含量非常多。怎么把这个成本降下来？张波说，如果用了更低价格的绿电产出来的氢气，比如一度电降到两毛钱以内，一公斤氢气10块钱都不到，那交通成本的价格也会降下来，氢能燃料电池汽车也有望更加普及、走向社会。

东方网 2024-12-30

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1