当前位置：首页|资讯

中信证券：OpenAIo1推理升级关注强化学习新机遇

作者：证券时报发布时间：2024-09-18

中信证券研报指出，OpenAIo1模型升级思维链和强化学习，重点提升模型推理性能，代码、数学、科学等强逻辑领域能力大幅提升，持续探索AGI实现新方式。新模型在训练和推理端同步推动算力需求倍增，算力产业链景气度持续上升；应用端进一步降低各领域应用开发成本，推理性能提升扩展强逻辑场景覆盖，加速各领域应用落地。建议持续关注相关领域的头部AI公司。

推荐体验

相关资讯

强化学习

什么是强化学习？强化学习 (RL) 是一种功能强大的机器学习 (ML) 方法，近年来在各行各业中得到越来越广泛的应用。这是一种基于反馈的方法，让人工智能 (AI) 驱动的系统（称为 agent，代理）通过反复迭代来学习如何在环境中完成任务。当需要实时决策、缩短周转时间、降低功耗和提高性能时，RL 可以充当得力助手。RL 是人工智能技术的一个子集，在各行各业中的应用越来越普遍，其中包括电子设计自动化 (EDA)。EDA 中的 RL 可助力设计复杂的电子电路和系统，此类设计通常要进行多次迭代，并且需要不断优化

机器学习人工智能

Cadence楷登 2024-01-31

1.强化学习能解决什么问题

2016年和2017年最具影响力的AlphaGo大胜世界围棋冠军李世石和柯洁事件，其核心算法就用到强化学习算法Research (deepmind.com)。2022年第大热的ChatGPT也用到了reinforcement learning from human feedback (RLHF)。如今，强化学习正在各行各业开花结果，成为学术界和工业界追捧的热点。到底强化学习解决其中什么问题呢？一句话来说，强化学习所能解决的问题是智能决策问题，更确切地说是序贯决策问题。什么是序贯决策问题？就是需要连续不断地

李富贵bilibili 2023-02-19

基于Transformer的强化学习新突破！2大创新思路学到就是赚到！

基于Transformer的强化学习（TRL）是一种利用Transformer模型架构来改进和增强强化学习算法性能的方法。这种方法通过结合Transformer模型强大的表示能力和强化学习的决策优化框架，显著提升了智能体的学习能力和适应能力，为我们解决复杂环境下的决策问题提供了新的思路，因此也被广泛应用于各大领域。目前，TRL主要有两大发展方向：架构增强、轨迹优化。架构增强：通过改进Transformer的架构来提高强化学习模型的性能。轨迹优化：使用Transformer来优化强化学习中的轨迹数据，以更好

迪哥教人工智能 2024-08-14

ChatGPT新机遇分享

-- 报告摘要 --驱动新范式的引擎：GPT模型体系，能高效地压缩信息表达世界知识，能持续提高泛化能力(涌现，子概念空间等），能更有效更可延申地对齐(自然语言，价值等），能足够并持续地充分利用更多有效算力，能用好充足的token/模态和有效地token化，能有效地参数扩展，小型化，本地化，能有效地扩展任务领域和专业知识-- 以上为本文报告前10-- 以上为本文报告前10页预览 --

全行业报告库 2023-05-16

OpenAI带来新机遇

OpenAI带来新机遇开源生态给了微软巨大震撼。面对日新月异的云上竞速，微软愈发意识到超前布局的重要性。在收购GitHub、构建开源生态的正面战场背后，微软悄悄做了件更具长远眼光的战略投资。20

OpenAI 微软 GitHub 融资

科技烟灰缸 2023-06-14

近期资讯

极氪副总裁赵春林：极氪001目前无CTB和三电机计划

极氪副总裁赵春林：极氪001目前无CTB和三电机计划

三言科技 2024-09-15

科技昨夜今晨0915：华为纯血鸿蒙9月底推正式版

科技昨夜今晨0915：华为纯血鸿蒙9月底推正式版

IT之家 2024-09-15

美国商务部长力挺英特尔，推动英伟达、苹果等公司使用英特尔代工

美国商务部长力挺英特尔，推动英伟达、苹果等公司使用英特尔代工

IT之家 2024-09-15

阿里云工作人员回应相册BUG：已反馈，将尽快回应

阿里云工作人员回应相册BUG：已反馈，将尽快回应

三言科技 2024-09-15

消息称 OpenAI 明年调整结构，转变为传统的营利性公司

消息称 OpenAI 明年调整结构，转变为传统的营利性公司

IT之家 2024-09-15

微软 Win11 预览版迎来新小组件：定时器和倒数日

微软 Win11 预览版迎来新小组件：定时器和倒数日

IT之家 2024-09-15

陈震收到华为三折叠手机被锁，华为终端CTO：媒体样机需尽快升级商用版

陈震收到华为三折叠手机被锁，华为终端CTO：媒体样机需尽快升级商用版

三言科技 2024-09-15

哪吒 S 第 9 次 OTA 升级：B站 App 上车，显示模式随“时”切换

哪吒 S 第 9 次 OTA 升级：B站 App 上车，显示模式随“时”切换

IT之家 2024-09-15

完成人类首次商业太空行走后，龙飞船载4人成功返回地球

腾讯科技 2024-09-15

科学家研发火星电池，用火星大气成分作为反应燃料，寿命约两个火星月

科学家研发火星电池，用火星大气成分作为反应燃料，寿命约两个火星月

DeepTech深科技 2024-09-15

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2024 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1