MOSS人工智能多模态挑战营
12月5日,OpenAI 官方X账户的一条推文将AI社区的期待值拉满了。这家世界头部AI公司宣布将在未来的 12 天进行12场直播,每天挤一点牙膏,发布一个新功能,或者进行一次演示。其中会有一些大型新产品,也会有一些“圣诞小礼物”。
DAY 1
o1完整版及CHATGPT pro服务
9月13号,OpenAI发布了一个全新的模型o1-preview,也就是o1的预览版。不同于之前的LLM在接收到问题后会立刻开始回答,o1-preview会像人的思维方式一样先分析问题,再将问题拆解成一系列子问题,然后分析每个子问题可以用哪些方案,并评估每个方案的可行性。
这次推出的o1模型完整版在之前的o1-preview上做了全面提升。o1现在不仅能处理文本,还能处理截图、照片、网页、上传的文件等等。此外,跟预览版比,这个版本的o1模型思考问题更简洁,速度提高了50%,而且在回答难题时,出错的可能性也降低了34%。
o1的最大创新不在于单纯的性能提升,而是在于它在处理问题时的“深度思考”能力。o1会在面对问题时花费更多时间进行推理和验证,这种做法让它能够在复杂问题上提供更为深入和多角度的解决方案,尤其是在科学实验设计和假设生成中的表现尤为突出,这种“深思熟虑”的方式其实有其革命性。
此外,OpenAI还推出了ChatGPT Pro服务。用户可以每个月花费200美金,来使用OpenAI最先进的模型和工具,包括OpenAI的o1、o1-mini、GPT-4o和Advanced Voice。该服务基于Self-play RL技术,有望在数学和编程等领域提供更精准的解决方案。
DAY 2
强化微调能力
(Reinforcement Fine-Tuning)
去年,OpenAI就已经为自家产品推出了监督式微调API。监督式微调要做的是让模型模仿它在输入文本或图像中找到的特征。这种强大的技术可用于修改模型的语气、样式或响应格式等等。
而强化微调(RFT)则是一种更进一步模型定制技术,可让开发者使用强化学习针对具体任务对模型进行进一步的微调,并根据提供的参考答案对模型的响应进行评分。也就是说,强化微调不仅会教模型模仿其输入,更是会让其学会在特定领域以新的方式进行推理。
简单来说,强化微调(RFT)就是给AI模型一个“专业培训课程”,可以用很少的实际案例(比如:几十个例子)来教这个AI模型成为一个领域的专家。比如在法律领域,律师可以使用经过强化微调的AI模型,更快地找到相关案例,进行初步的法律条文匹配,给律师提供决策参考,提高工作效率。目前,OpenAI 仅支持强化微调的Alpha测试申请,并且名额有限,个人用户至少得等到明年。
DAY 3
Sora
距离今年2月16日Sora的发布已经过去了近10个月的时间,在这次OpenAI 连更的第3个工作日,终于重磅发布了视频生成大模型Sora正式版。
此次发布的Sora Turbo,为原始Sora模型的全新高端加速版本,可以生成1080p、最长20秒的视频,支持横屏(16:9)、正方形(1:1)和竖屏(9:16)等多种常见比例。OpenAI开发了全新的界面,让使用文本、图像和视频来提示Sora变得更加容易,同时故事板工具让用户可以精准地指定每个帧的输入。
Sora团队负责人Aditya Ramesh称,它具备今年早些时候在技术报告中所提到的所有世界模拟能力。用户可以对生成的视频进行多种操作,包括:
风格预设
创建视频的风格等操作,比如气球世界、定格动画、纸板与纸艺等;
Remix(重混)
替换、删除或重构视频中的元素;
Re-cut(重新切割)
找到最佳的一帧进行延展,循环剪辑;
混合
将两段视频进行无缝合并剪辑;
故事板
精准指定每个帧的输入,生成几乎完美一致性的分镜,等等。
随着Sora的正式发布,OpenAI也公布了使用价格:
ChatGPT Plus(20美元/月)
最多50个优先视频(1000个积分),分辨率高达720p,时长为5秒
ChatGPT Pro(200美元/月)
最多500个优先视频(10000个积分)无限relaxed视频,分辨率高达1080p,持续时间为20秒,可并发生成5个下载无水印
人毫无疑问,AI仍将是2025年最受关注的技术。从会议室到教室、从医院到家中,AI只会越来越深入地融入我们的生活。
对此,思铺推出了AI makerathan人工智能创客马拉松(以下简称“创客马拉松”)品牌营地。作为以包含工程思维、开源硬件、创客工坊、算法研究、AI应用等跨领域的PBL 项目式学习和工程创新实践的平台,创客马拉松由浙江大学、同济大学、上海交通大学、美国火星学会青年科学家于2016年发起,项目以浙江大学控制学院SRTP(Student Research Training Program,科研训练计划)模式为基础,向具有创新梦想、立志成为杰出工程师的少年提供贯穿学科基础到产业前沿,从技术框架到项目管理,从任务挑战到创新实践的极致学习体验。
创客马拉松品牌营地项目下的MOSS人工智能多模态挑战营项目将根据真实的日常生活、学习交流等场景出发,深入了解人工智能和多模态交互技术,学习视觉、语音、文本、情感和动作的集成应用。掌握AI模型、进阶编程、机器学习、交付理解、提升创新思维和团队合作能力。
学员们在该项目中将会制作一台基于OpenAI算法的MOSS多模态拟合智能装置,体验人工智能与人机交互的乐趣,领略真正的、前沿的人工智能创客项目。
#MOSS
项目收获
■ 基础知识强化与技能提升
AIGC人工智能、结构建模、智能装置与算法模型训练等理论学习与技能习得
■ 成果延申与竞赛辅导
依托项目成果产出,开展能力评估,提供科创竞赛和课题辅导
■ 前沿技术探索与创新思维
涵盖人工智能和多模态交互技术,拟合视觉、语音、文本、情感和动作的集成应用与创新设计
■ 工程日志与双证书认定
多维度工程日志输出,获得结营证书以及项目评价双证书
#AeroMorph
适合学生
适合9-12年级对计算机科学、结构建模、人工智能感兴趣的学生
#AeroMorph
项目时间&地点
■ 时间
2025年2月3日—2月8日
■ 地点
杭州STEMHUB融合教育创新中心
#AeroMorph
报名及服务流程
■ 填写报名表格及入营资质审核
■ 签署营地报名协议并支付费用
■ 开通学习账户,完成预习打卡任务
■ 根据报道须知,准备开营个人物品
■ 指定时间、地址集合,开启创新历程
未来的热门专业,将不再是单一的技能或知识领域,而是能够融合多学科智慧,解决人类实际问题的跨学科专业。学生不仅要学到如何与AI共生,更能学到如何引领未来,成为AI时代不可替代的人才。
更多人工创客马拉松营地项目
← 可左右滑动海报查看 →
抹茶巧克力蛋糕奶昔 2024-12-26
万岳科技程序员小金 2024-12-26
芒果学姐来了 2024-12-26