当前位置:首页|资讯|OpenAI|Sora|人工智能|生成式AI

OpenAI SORA - AI 学科之路 (2) - SORA团队成员实习和工作经历、业界领先企业

作者:Foulard Rouge发布时间:2024-03-17

原标题:OpenAI SORA - AI 学科之路 (2) - SORA团队成员实习和工作经历、业界领先企业

OpenAI SORA 核心团队

Reserch Leads:(William)Bill Peedles & Tim Brooks

Systems Lead:Connor Holmes

其他团队贡献者:Charence Wing Yin Ng,David Schnurr,Eric Luhman,Joe Taylor,Li Jing,Natalie Summers,Ricky Wang,Rohan Sahai,Ryan O'Rourke,Troy luhman,Will DePue,Yufei Guo

团队成员 既往参与项目 - 目前公开信息收集

团队成员 既往工作经历 - 目前公开信息收集

OpenAI SORA - AI 学科之路 - 相关业界领先公司

Google Gemini 谷歌双子座 - deepmind .google /technologies /gemini /#introduction

1. 什么是谷歌双子座?

Google Gemini 是 Google 推出的最新 AI 模型。它代表了 Gemini 系列中的首款多模态 AI,提供三种不同的尺寸:Gemini Ultra、Gemini Pro 和 Gemini Nano。在这些变体中,Gemini Ultra 是最强大的型号,在大规模多任务语言理解基准测试中取得了令人印象深刻的 90% 分数。

2. 谁创造了双子座?

Gemini 由 Google、Alphabet(Google 的母公司)和 Google DeepMind 创建,Google DeepMind 为其开发做出了重大贡献。有不同的版本或变体,例如 Gemini Ultra、Gemini Pro 和 Gemini Nano,每个版本的功能和大小都不同。

3. 双子座时代:赋能未来创新

双子座时代标志着人工智能发展的重大飞跃,标志着谷歌开启了新的篇章,并不断追求负责任和迅速地推进模型能力。双子座取得的进步是巨大的。这些增强功能包括规划和内存方面的改进,以及拓宽上下文窗口。这些改进旨在使 Gemini 能够处理更多信息,从而提供更精细和改进的响应。这种创新的未来有望提升创造力、扩展知识、推动科学进步,并彻底改变全球数十亿人的生活和工作方式。双子座时代有望在塑造这个变革性的未来方面发挥重要作用。

Meta AI - ai.meta.com

Meta AI 是 Meta Platforms Inc.(前身为 Facebook, Inc.)旗下的人工智能实验室。Meta AI 开发各种形式的人工智能,开发增强现实和人工智能技术。Meta AI 是一个学术研究实验室,专注于为 AI 社区创造知识。这与Facebook的应用机器学习(AML)团队形成鲜明对比,该团队专注于其产品的实际应用。

Meta AI 最初是 Facebook 人工智能研究 (FAIR),在加利福尼亚州门洛帕克、总部、英国伦敦和曼哈顿设有新实验室。FAIR于2013年9月正式发布。FAIR由纽约大学的Yann LeCun执导,Yann LeCun是一位深度学习教授和图灵奖获得者。FAIR与纽约大学数据科学中心合作,最初的目标是研究数据科学、机器学习和人工智能,并“了解智能,发现其基本原理,并使机器更加智能”。FAIR 的研究开创了人脸识别、照片标记和个性化提要推荐的技术。

FAIR的初步工作包括学习模型支持的记忆网络、自监督学习和生成对抗网络、文本分类和翻译以及计算机视觉方面的研究。

计算机视觉 - Meta AI 的计算机视觉研究旨在从数字图像和视频中提取有关环境的信息。人工智能开发的计算机视觉技术的一个例子是全景分割,它可以识别前景中的物体,但也对背景中的场景进行分类。Meta AI 旨在改进视觉问答技术,其中机器使用周期一致性回答人类用户有关图像的问题,让机器在答案之外生成一个问题以解决问题中的语言差异。

自然语言处理和对话式人工智能 - 人工智能通信需要机器理解自然语言并生成自然语言。Meta AI 旨在改进这些技术,以改善安全通信,无论用户可能说什么语言。因此,一个中心任务涉及将自然语言处理(NLP)技术推广到其他语言。因此,Meta AI 积极致力于无监督机器翻译。Meta AI 试图通过开发闲聊对话的各个方面来改善自然语言界面,例如重复、特异性、响应相关性和提问,将个性融入图像字幕,并生成基于创造力的语言。

RunwayML - runwayml.com

Runway AI公司(也称为 Runway 和 RunwayML)是一家总部位于纽约市的美国公司,专门从事生成式人工智能研究和技术。该公司主要专注于创建用于生成视频、图像和各种多媒体内容的产品和模型。它最引人注目的是开发了第一个商业文本到视频生成式 AI 模型 Gen-1 和 Gen-2,并共同创建了流行的图像生成 AI 系统 Stable Diffusion 的研究。

该公司由智利人克里斯托瓦尔·巴伦苏埃拉 亚历杭德罗·马塔马拉和希腊人阿纳斯塔西斯·日耳曼尼迪斯在 纽约大学蒂施艺术学院 ITP 相识后于2018年创立。该公司在 2018 年筹集了 200 万美元,用于构建一个平台,在多媒体应用程序中大规模部署机器学习模型。

2023 年 2 月,Runway 发布了 Gen-1 和 Gen-2,这是第一个商业和公开可用的基础视频到视频和文本到视频生成模型,可通过简单的 Web 界面访问。2023年6月,Runway被《时代》杂志评选为全球100家最具影响力的公司之一。

Gen-1 是一种视频到视频生成式 AI 系统,它通过将图像或文本提示的构图和样式应用于源视频的结构来合成新视频。该车型于 2023 年 2 月发布。Gen-1 模型由 Runway 根据 Runway Research 的原始论文 Structure and Content-Guided Video Synthesis with Diffusion Models 进行训练和开发。Gen-1 是用于视频创作的生成式人工智能的一个例子。

Gen-2 是一个多模态 AI 系统,可以生成带有文本、图像或视频剪辑的新颖视频。该模型是 Gen-1 的延续,包括一种生成文本条件的视频的模式。Gen-2 是首批商用的文本到视频模型之一。

本篇高曝光大学 - 纽约大学 NYU www.nyu.edu


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1