当前位置:首页|资讯|Sora|OpenAI

o1完整版、强化微调、SORA,一口气看完OpenAI发布会前3天内容

作者:思铺学院发布时间:2024-12-19

MOSS人工智能多模态挑战营

12月5日,OpenAI 官方X账户的一条推文将AI社区的期待值拉满了。这家世界头部AI公司宣布将在未来的 12 天进行12场直播,每天挤一点牙膏,发布一个新功能,或者进行一次演示。其中会有一些大型新产品,也会有一些“圣诞小礼物”。

DAY 1

o1完整版及CHATGPT pro服务

9月13号,OpenAI发布了一个全新的模型o1-preview,也就是o1的预览版。不同于之前的LLM在接收到问题后会立刻开始回答,o1-preview会像人的思维方式一样先分析问题,再将问题拆解成一系列子问题,然后分析每个子问题可以用哪些方案,并评估每个方案的可行性。

这次推出的o1模型完整版在之前的o1-preview上做了全面提升。o1现在不仅能处理文本,还能处理截图、照片、网页、上传的文件等等。此外,跟预览版比,这个版本的o1模型思考问题更简洁,速度提高了50%,而且在回答难题时,出错的可能性也降低了34%。

o1的最大创新不在于单纯的性能提升,而是在于它在处理问题时的“深度思考”能力。o1会在面对问题时花费更多时间进行推理和验证,这种做法让它能够在复杂问题上提供更为深入和多角度的解决方案,尤其是在科学实验设计和假设生成中的表现尤为突出,这种“深思熟虑”的方式其实有其革命性。

此外,OpenAI还推出了ChatGPT Pro服务。用户可以每个月花费200美金,来使用OpenAI最先进的模型和工具,包括OpenAI的o1、o1-mini、GPT-4o和Advanced Voice。该服务基于Self-play RL技术,有望在数学和编程等领域提供更精准的解决方案。

DAY 2

强化微调能力

(Reinforcement Fine-Tuning)

去年,OpenAI就已经为自家产品推出了监督式微调API。监督式微调要做的是让模型模仿它在输入文本或图像中找到的特征。这种强大的技术可用于修改模型的语气、样式或响应格式等等。

而强化微调(RFT)则是一种更进一步模型定制技术,可让开发者使用强化学习针对具体任务对模型进行进一步的微调,并根据提供的参考答案对模型的响应进行评分。也就是说,强化微调不仅会教模型模仿其输入,更是会让其学会在特定领域以新的方式进行推理。

简单来说,强化微调(RFT)就是给AI模型一个“专业培训课程”,可以用很少的实际案例(比如:几十个例子)来教这个AI模型成为一个领域的专家。比如在法律领域,律师可以使用经过强化微调的AI模型,更快地找到相关案例,进行初步的法律条文匹配,给律师提供决策参考,提高工作效率。目前,OpenAI 仅支持强化微调的Alpha测试申请,并且名额有限,个人用户至少得等到明年。

DAY 3

Sora

距离今年2月16日Sora的发布已经过去了近10个月的时间,在这次OpenAI 连更的第3个工作日,终于重磅发布了视频生成大模型Sora正式版。

此次发布的Sora Turbo,为原始Sora模型的全新高端加速版本,可以生成1080p、最长20秒的视频,支持横屏(16:9)、正方形(1:1)和竖屏(9:16)等多种常见比例。OpenAI开发了全新的界面,让使用文本、图像和视频来提示Sora变得更加容易,同时故事板工具让用户可以精准地指定每个帧的输入。

Sora团队负责人Aditya Ramesh称,它具备今年早些时候在技术报告中所提到的所有世界模拟能力。用户可以对生成的视频进行多种操作,包括:

风格预设

创建视频的风格等操作,比如气球世界、定格动画、纸板与纸艺等;

Remix(重混)

替换、删除或重构视频中的元素;

Re-cut(重新切割)

找到最佳的一帧进行延展,循环剪辑;

混合

将两段视频进行无缝合并剪辑;

故事板

精准指定每个帧的输入,生成几乎完美一致性的分镜,等等。

随着Sora的正式发布,OpenAI也公布了使用价格:

ChatGPT Plus(20美元/月)

最多50个优先视频(1000个积分),分辨率高达720p,时长为5秒

ChatGPT Pro(200美元/月)

最多500个优先视频(10000个积分)无限relaxed视频,分辨率高达1080p,持续时间为20秒,可并发生成5个下载无水印

人毫无疑问,AI仍将是2025年最受关注的技术。从会议室到教室、从医院到家中,AI只会越来越深入地融入我们的生活。

对此,思铺推出了AI makerathan人工智能创客马拉松(以下简称“创客马拉松”)品牌营地。作为以包含工程思维、开源硬件、创客工坊、算法研究、AI应用等跨领域的PBL 项目式学习和工程创新实践的平台,创客马拉松由浙江大学、同济大学、上海交通大学、美国火星学会青年科学家于2016年发起,项目以浙江大学控制学院SRTP(Student Research Training Program,科研训练计划)模式为基础,向具有创新梦想、立志成为杰出工程师的少年提供贯穿学科基础到产业前沿,从技术框架到项目管理,从任务挑战到创新实践的极致学习体验。

创客马拉松品牌营地项目下的MOSS人工智能多模态挑战营项目将根据真实的日常生活、学习交流等场景出发,深入了解人工智能和多模态交互技术,学习视觉、语音、文本、情感和动作的集成应用。掌握AI模型、进阶编程、机器学习、交付理解、提升创新思维和团队合作能力。

学员们在该项目中将会制作一台基于OpenAI算法的MOSS多模态拟合智能装置,体验人工智能与人机交互的乐趣,领略真正的、前沿的人工智能创客项目。

#MOSS

项目收获

基础知识强化与技能提升

AIGC人工智能、结构建模、智能装置与算法模型训练等理论学习与技能习得

成果延申与竞赛辅导

依托项目成果产出,开展能力评估,提供科创竞赛和课题辅导

前沿技术探索与创新思维

涵盖人工智能和多模态交互技术,拟合视觉、语音、文本、情感和动作的集成应用与创新设计

工程日志与双证书认定

多维度工程日志输出,获得结营证书以及项目评价双证书

#AeroMorph

适合学生

适合9-12年级对计算机科学、结构建模、人工智能感兴趣的学生

#AeroMorph

项目时间&地点

时间

2025年2月3日—2月8日

地点

杭州STEMHUB融合教育创新中心

#AeroMorph

报名及服务流程

■ 填写报名表格及入营资质审核

■ 签署营地报名协议并支付费用

■ 开通学习账户,完成预习打卡任务

■ 根据报道须知,准备开营个人物品

■ 指定时间、地址集合,开启创新历程

未来的热门专业,将不再是单一的技能或知识领域,而是能够融合多学科智慧,解决人类实际问题的跨学科专业。学生不仅要学到如何与AI共生,更能学到如何引领未来,成为AI时代不可替代的人才。

更多人工创客马拉松营地项目

← 可左右滑动海报查看 →


Copyright © 2025 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1