张俊林：OpenAI o1 的价值意义及强化学习的 Scaling Law

作者：机器之心发布时间：2024-09-14

OpenAI o1 是自 GPT 4 发布以来，基座大模型最大的进展，逻辑推理能力提升的效果和方法比预想的要好，GPT 4o 和 o1 是发展大模型不同的方向...【查看原文】

相关资讯

suntiger 2023-04-23

近期资讯

小米官方回应小米SU7在交通事故中发生冒烟情况

【CNMO科技消息】有消息显示，9月16日上午10点03分左右，在南京南站附近道路上一辆小米SU7发生意外交通事故，现场小米SU7散发大量白烟，一时间在网上引发热议。回应指出，车辆在行驶过程中因路面湿滑，驾驶人操作不当，导致车辆冲出车道撞向隔离花坛区。

手机中国 2024-09-17

四川天府新区：智能客服用上超算算力

近年来，四川天府新区在兴隆湖周围汇聚起以中国科学院成都分院为代表的高能级科研机构资源，以国家实验室为代表的科研战略资源，以成都超算中心为代表的领先科研基础设施资源，汇聚大量高层次科研人才，着力营造一流创新生态，为催生更多原创性、颠覆性科技创新成果奠定了坚实基础。“这款扫地机器人清洁能力咋样？”

金台资讯 2024-09-17

中国气象局调整重大气象灾害台风二级应急为暴雨三级应急响应

今年第13号台风“贝碧嘉”强度逐渐减弱，中央气象台9月17日6时发布台风蓝色预警和暴雨黄色预警。受台风及其残余环流影响，预计未来三天山东、江苏、河南、安徽等地将有大到暴雨。经综合研判和应急会商，中国气象局9月17日9时将台风Ⅱ级应急响应调整为暴雨Ⅲ级应急响应。

极目新闻 2024-09-17

上海创米科技取得电子设备专利，提高了电子设备的抗静电干扰能力

金融界2024年9月17日消息，天眼查知识产权信息显示，上海创米数联智能科技发展股份有限公司取得一项名为“电子设备“，授权公告号CN221728597U，申请日期为2023年12月。”

金融界 2024-09-17

系列总监透露EA希望《战地》新作能登陆Switch2

关于任天堂下一代游戏机的传言一直没有消停过，而且随着其亮相日期的临近--任天堂已经确认它将在明年四月之前亮相，甚至还有报道称它最快也将在本月亮相--关于第三方游戏将如何支持这款游戏机的问题也越来越突出。以EA公司为例，该公司是业内最大的第三方发行商之一，但多年来在支持任天堂Switch方面普遍落后于其他大多数公司。

3DMGAME 2024-09-17

人类首次月背“挖土”：嫦娥六号返回月壤成分揭秘，填补月背研究历史空白

9月17日消息，人类在探索月球的浩瀚征途中，曾先后通过6次Apollo任务、3次Luna任务和1次嫦娥五号任务，从月球表面带回380余公斤样品。然而，所有这些样品均来自月球正面。我国嫦娥六号返回器携带月球样品于今年6月25日返回，共采集月球样品1935.3克。6月28日，嫦娥六号任务月球样品正式交接给国家天文台。

IT之家 2024-09-17

9月20日央视新闻直播！余承东现场交付首批华为Mate XT非凡大师

快科技9月17日消息，今日，华为终端官微宣布，9月20日9:30，华为常务董事、终端BG董事长、智能汽车解决方案BU董事长余承东将现身央视新闻直播间，现场交付首批华为MateXT非凡大师。预热海报显示，央视新闻直击全球首款三折叠屏手机首销仪式。华为MateXT非凡大师将于9月20日10:08开售，目前在华为官网的预约人数已超624万人。

快科技 2024-09-17

iOS 17.7正式版发布：修复16个系统漏洞建议所有用户升级

苹果于今日凌晨发布了iOS18正式版和iOS17.7正式版的更新。其中，iOS17.7提供了重要安全性修复，并建议所有用户安装。据官网数据显示，此次修复共涉及16个漏洞，其中包括2个内核漏洞。这意味着低版本的iOS系统都可能受到影响。此次漏洞修复涵盖了辅助功能、压缩、邮箱、快捷指令、GameCenter、ImageIO等多个方面。

中关村在线 2024-09-17

被低估的iPhone16：芯片、内存、充电、电池、AI都有升级

自从苹果发布iPhone16以来，很多人就吐槽，除了创新了一个相机按键，另外还有一个沙漠金之外，就又没有了任何创新了。但是，当iPhone16预售时，大家发现，原来很多人嘴上说没创新，抢的比谁都快，预售开启，Pro系列秒没，连官网Appstore都被抢的卡了。

科技plus 2024-09-17

吉林省南北建筑工程取得一种水利施工排水装置专利，提高水泵的使用寿命

金融界2024年9月17日消息，天眼查知识产权信息显示，吉林省南北建筑工程有限公司取得一项名为“一种水利施工排水装置“，授权公告号CN221721844U，申请日期为2023年12月。”专利摘要显示，本实用新型提供了一种水利施工排水装置，属于水利施工排水技术领域。

金融界 2024-09-17

张俊林：OpenAI o1 的价值意义及强化学习的 Scaling Law

推荐体验

相关资讯

强化学习

chatgpt与对话的强化学习

1.强化学习能解决什么问题

强化学习—PPO（Proximal Policy Optimization）算法原理及实现

强化学习工具包-OpenAI Gym

近期资讯

小米官方回应小米SU7在交通事故中发生冒烟情况

四川天府新区：智能客服用上超算算力

中国气象局调整重大气象灾害台风二级应急为暴雨三级应急响应

上海创米科技取得电子设备专利，提高了电子设备的抗静电干扰能力

系列总监透露EA希望《战地》新作能登陆Switch2

人类首次月背“挖土”：嫦娥六号返回月壤成分揭秘，填补月背研究历史空白

9月20日央视新闻直播！余承东现场交付首批华为Mate XT非凡大师

iOS 17.7正式版发布：修复16个系统漏洞建议所有用户升级

被低估的iPhone16：芯片、内存、充电、电池、AI都有升级

吉林省南北建筑工程取得一种水利施工排水装置专利，提高水泵的使用寿命

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响