刚刚，OpenAI 又发布了一个「期货」

作者：AppSo发布时间：2024-12-17

OpenAI

早在直播活动开始前，负责模型微调的 OpenAI 研究员 Steven Heidel 就表示，虽然今天发布的产品可能不适用于所有人，但对于一部分人来说，它将具有重大意义。

OpenAI CEO Sam Altman 则在 X 平台发文称：

这种效果非常好；它成为了我 2024 年最大的惊喜之一。我非常期待看到人们会创造出什么！

X 网友已经给我们敲好黑板，划重点了：

强化微调（RFT）将于明年推出，专门针对 o1 模型。

通过利用强化微调（RFT）优化 o1 模型在专业领域的推理能力。

强化微调（RFT）通过仅需少量示例即可高效适应，优于传统的微调方法。

具体而言，OpenAI 今天推出了一个强化微调（Reinforcement Fine-Tuning）研究计划。

该计划允许开发人员利用大量的高质量任务（从数十到数千个）来训练模型，并依据提供的标准答案来评估模型的回答。

这种方法不仅可以增强模型在处理相似问题时的逻辑推理能力，还能显著提升模型在特定领域任务中的精确度。

直播过程中，OpenAI 还特地邀请了一位来自劳伦斯伯克利国家实验室的研究员 Justin Reese，他也向我们展示了这项技术成果目前在实际应用过程中的作用。

作为计算生物学家，Justin 的主要研究领域是罕见遗传疾病。

据他介绍，全球大约有 3 亿人患有罕见疾病，但问题是，评估罕见疾病比较困难，因为这通常需要具备两方面的知识：

一是必须具备医学领域的专家级知识，二是必须对生物医学数据进行系统性的推理。

通过与德国 Charite 医院等机构合作，Justin Reese 研究团队从数百篇罕见疾病病例报告中提取关键信息，然后使用 OpenAI 微调模型来更有效地推理出疾病的成因。

在直播过程中，OpenAI 研究人员也向我们使用强化微调优化模型的完整流程。

团队会使用经过精心准备的数据集对模型进行强化微调。数据集中每个样例包含病例报告、观察到的和缺失的症状列表，以及模型需预测的目标基因。

模型需要根据给定的症状信息对潜在致病基因进行优先级排序，预测结果中正确基因的排名越靠前，得分就越高。

微调过程还会通过一个 graders（评分器）来衡量模型表现。评分器通过将模型输出与标准答案进行对比，给出 0 到 1 之间的评分，用于量化模型在验证集上的表现。

经过微调的模型在该复杂遗传疾病相关基因预测任务上的表现大幅提高，证明了强化微调在生物信息和基因疾病诊断领域的潜力。

另外，OpenAI 也宣布强化微调 API 的 Alpha 的访问权限明年将开放给更多组织使用，尤其是那些解决复杂任务的研究组织，比如法律、保险、医疗和金融等领域。

附上申请地址：

https://openai.com/form/rft-research-program/

与昨日相呼应，本次直播依然以一个充满圣诞节日气氛的笑话收尾：

‍

‍关注 AI 第一新媒体，率先获取 AI 前沿资讯和洞察 ‍

‍

值得注意的是，最近风投公司 Menlo Ventures 最近深入调研了 600 名美国企业 IT 决策者，深入披露了目前 AI 产业的最新趋势。

在这份被视为业界风向标的报告中，有一组数据格外引人注目。

报道显示，OpenAI 的企业市场份额从 50% 跌至 34%，大批企业弃用 GPT-4 转投 Claude 3.5 Sonnet。基于此，Anthropic 则趁势崛起，市场占有率从 12% 暴涨至 24%。

可以说，市场份额是企业对 AI 技术最诚实的评分。但回合制较量的故事尚未结束，今天祭出的强化微调 API 有望再次点燃市场对 OpenAI 的关注度。

而就在 OpenAI 发布会召开前，Google 推出的新模型 gemini-exp-1206 在大模型竞技场 LMSYS Chatboat Arena 中再次登顶，力压 OpenAI 的 GPT-4o-1120。

与此同时，Meta 凌晨推出的 Llama 3.3 70B 模型也以成本更低的方式，实现了媲美 Llama 3.1 405B 的性能。

就这几天发布的新品而言，网络上褒贬不一。有人说失望，有人说惊喜，但无论如何，AI 的价值不在于模型有多复杂，而在于能解决什么实际问题。最好的评判标准永远是亲自上手体验。

近期资讯

长城汽车注资半导体公司成立，正与多家车企洽谈订单合作｜36氪独家

紫荆M100已处于上量阶段

徐蔡钰 2024-12-30

36氪与你一起走过的366天丨2024年度时 “氪”全记录

2024年，那些36氪与你相伴的点滴美好。

未来一氪 2024-12-30

自研国产零依赖前端UI框架实战006 实现表格分页的功能

前言通过前面的努力, 我们已经封装了第一个表格组件, 但是我们还没有实现分页的功能. 分页这个功能在web开发中属于比较常见的了, 我们最好不要和table组件放一块, 可以单独封装一下. 那么我们

Python私教 2024-12-30

Vue3+Tauri v2的项目中配置多翻译源文本翻译api

Hello🤩，经过数个月迭代更新，HuLa项目已经开始茁壮成长，现在来讲一下HuLa项目其中更新了一个功能点，实现了一个灵活的文本翻译系统，支持多个翻译服务提供商，目前主要集成了有道云翻

Dawn_H 2024-12-30

⚡ VueUse createGlobalState 之 effectScope 全面解读 🚀

为什么 vueuse 的 createGlobalState 使用 effectScope 去实现而不是一个单纯的闭包？

一路向北wow 2024-12-30

“投资家网·第十三届中国资本年会”在深圳隆重召开

第十三届中国资本年会聚焦股权投资业态。

未来一氪 2024-12-30

一文搞懂AMD、CMD、UMD、ESM和CommonJS

一、模块化的重要性在前端开发的演进历程中，模块化的出现堪称一场具有里程碑意义的变革。起初，JavaScript 主要负责相对简单的表单验证与简短交互，代码量少，组织形式简单，往往所有代码都写在一个文

五号厂房 2024-12-30

路由也疯狂：Vue Router带你玩转单页面应用，妈妈再也不怕我迷路了！

本文介绍了Vue Router的基本使用方法，包括路由配置、页面跳转、传参技巧以及二级路由的设置，助你快速上手Vue Router，实现高效的路由管理。

六个点 2024-12-30

Nuxt 添加 Redis 缓存

Nuxt 是什么 Nuxt.js 是一个基于 Vue.js 的开源框架，旨在为开发者提供一个简单的方式来构建高性能的 Vue 应用。它提供了许多功能，使得开发服务器端渲染（SSR）、静态站点生成（SS

limoonrise 2024-12-30

多项目管理不再难！从零开始：pnpm workspace 手把手教你打造灵活、可扩展的开发环境

探索多项目开发的新境界！通过 pnpm workspace，展示如何在一个代码库中高效管理多个独立运行的项目，同时实现样式和组件的共享，大幅提高代码复用率与维护效率。

青青很轻_ 2024-12-30

刚刚，OpenAI 又发布了一个「期货」

推荐体验

相关资讯