WebRL 是清华大学和智谱 AI 联合推出的自进化在线课程强化学习框架,通过自我进化课程学习和结果监督奖励模型(ORM)评估任务成功与否,显著提升了开源 LLM 在 WebArena-Lite 基准
清华
蚝油菜花 2024-11-06
巧合的是,第三方机构QuestMobile11月5日披露的AIGC(人工智能生成内容)App月活数据显示,9月豆包、文小言、Kimi等排名前十,元宝不在榜单中。
人工智能腾讯AIGC
北京商报 2024-11-06
像这样的可交互世界模型,一个模型就是一个游戏,每秒20帧零延迟的生成效率,也让不少人都投来了惊讶的目光。另外不同于Sora等双向模型的是,Oasis生成帧的过程是自回归的,因此能够根据游戏输入对后续帧进行调节…
Sora
量子位 2024-11-08
复刻 OpenAI o1 推理大模型,开源界传来最新进展: LLaMA 版 o1 项目刚刚发布,来自上海 AI Lab 团队。 简介中明确:使用了蒙特卡洛树搜索,Self-Play 强化学习,PPO,
LLaMA编程OpenAI
量子位 2024-11-05
`Awesome ChatGPT Prompts` 是一个开源项目,专门收集和整理各种适用于 ChatGPT 的高质量提示词(prompts)。这个项目由开发者 **f** 发起,旨在帮助用户更高效地
提示词ChatGPT
MARIOW 2024-11-04
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1