当前位置:首页|资讯|ChatGPT|融资|微软|英伟达|大语言模型

AI创投周报|ChatGPT劲敌融资13亿美元,微软英伟达领投,要造全球最大AI超算

作者:阿尔法公社发布时间:2023-06-30

原标题:AI创投周报|ChatGPT劲敌融资13亿美元,微软英伟达领投,要造全球最大AI超算

AI创投周报是阿尔法公社推出的聚焦于以大语言模型和生成式AI为代表的人工智能新浪潮的资讯周报。阿尔法公社希望发现和投资非凡创业者(AlphaFounders),相信非凡创业者在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。

本周,我们观察到以下AI领域的新动向和新趋势:

1.本周连续出现两笔10亿美元级别的大交易:ChatGPT劲敌Inflection AI获得微软英伟达领投的13亿美元融资,估值40亿美元,它推出更人性化的AI助手Pi,并将打造全球最大的AI超算。380亿美元大数据独角兽Databricks以13亿美元价格收购MosaicML,要加速企业对生成式AI的采用。

2.AI+医疗的融资活跃:医疗保健领域的对话式人工智能Outbound AI获1600万美元的种子轮融资,帮助生物制药公司模拟临床试验的Altis获近600万美元的种子轮融资,为医疗AI开发提供数据的Flywheel获NVIDIA领投5400万美元D轮融资。

3.Midjourney和StableDiffusion均进行大更新:Midjourney推出5.2版本,它的新功能“zoom out”让用户无限扩展原始图像,Stable Diffusion XL 0.9使用双模型,能支持图像到图像的prompt,以及内画(重建图像的缺失部分)和外画(构建一个现有图像的无缝扩展)等功能。

人工智能初创公司的新融资

1.DeepMind联合创始人创立的Inflection AI获13亿美元巨额投资,估值达到40亿美元

官方网站:https://inflection.ai/

Inflection AI在2023年6月29日宣布,该公司在一轮新的融资中筹集了13亿美元,由Microsoft、Reid Hoffman、Bill Gates、Eric Schmidt和新投资者NVIDIA领投。这笔新的融资使该公司迄今为止筹集的总资金达到15.25亿美元,估值达到40亿美元。

Inflection AI正在与CoreWeave和NVIDIA合作,建造世界上最大的AI集群,包括22,000个NVIDIA H100 Tensor Core GPU。该公司已开发出一种先进的大型语言模型,使人们能够以简单、自然的方式与其个人AI Pi互动。

Pi是Inflection AI的首个产品,是一种新类别的AI,设计为友好和支持性的伴侣,通过文本和语音对话提供友好的建议和简洁的信息。

Inflection AI的目标是使个人AI可以为世界上的每个人提供服务。它是一家专注于创建个人A的“AI工作室”,成立于2022年初,由Mustafa Suleyman(DeepMind联合创始人), Karén Simonyan和Reid Hoffman(Linkedin联合创始人) 创立。

2.AIGC领域最大收购:Databricks以13亿美元价格买下MosaicML

Databricks已经以大约13亿美元的价格收购了AI初创公司MosaicML。这笔交易的核心目的是加速企业对生成式AI的采用。Databricks的CEO Ali Ghodsi表示,客户一直在寻求创建和拥有自己的生成式AI模型。

MosaicML是一家在这方面为企业提供帮助的公司,它允许企业使用其技术在自己的数据上训练模型。Ghodsi强调,模型的知识产权对于许多企业至关重要,因为它们希望通过使用自己的数据来获得竞争优势。MosaicML的CEO Naveen Rao认为,这笔交易是一个加速点,将为公司提供更多的资源和经验,以更快地推进其业务。

3.AI驱动的视频创意工具Captions获a16z、红衫等投资的2500万美元B轮融资

官方网站:www.captions.ai/

AI驱动的视频创意工具Captions获a16z, Kleiner Perkins, Sequoia Capital, SVA的2500万美元B轮融资。

Captins是一个可以帮助你简化创作过程并将你的故事讲述提升到新的高度的工具,它可以通过添加正确的音乐和效果来让你的观众沉浸在声音中。主要是为视频内容提供字幕服务,可以帮助视频内容的创作者和消费者更好地了解音视频。

使用语音识别和自然语言处理技术。语音识别技术可以将音频转换为文本,而自然语言处理技术可以将文本转换为字幕。同时使用一种图像识别模型“Show, Attend and Tell”,这是一种使用 “attention mechanism” 来解决图像中不同部分的重要性不同的问题。该模型在解释图像时能够更好地关注重要的部分, 从而提高识别准确率。并引入了attention机制考虑目标之间的关系, 从而提高识别准确率。

Captions的创始团队包括:Jinsoo An, Jaeuk Park, Jinwook Shin, Sanghoon Lee和Jungwoo Lee。他们均是韩国首尔国立大学的计算机科学博士。

4.开发AI语音合成软件的ElevenLabs获Ali Albazaz, a16z等1900万美元的A轮融资

官方网站:https://beta.elevenlabs.io/

ElevenLabs使用人工智能(AI)和机器学习(ML)为各行业的内容创作者、网络平台和制作工作室带来最强大的自动配音、语音转换和语音合成工具。

ElevenLabs的核心技术是能够利用AI合成声音、克隆声音或者创建全新的“人工”声音,将文本转化为语音。这些声音能够模仿不同性别、年龄和种族的人的声音,这样的创新技术让ElevenLabs在同类产品中独树一帜。

目前,ElevenLabs已经发布了一款合成语音检测工具AI Speech Classifier,该工具可以准确检测出用户上传的音频数据中是否包含ElevenLabs旗下语音合成AI生成的任何内容,该公司声称其“准确率超过99%”。

ElevenLabs由前谷歌工程师Piotr Dabkowski和前Palantir战略师Mati Staniszewski于2022年联合创立。Piotr Dabkowski拥有计算机科学博士学位,曾在谷歌担任机器学习工程师,他的研究方向主要是深度学习、自然语言处理和计算机视觉。

5.医疗保健领域的对话式人工智能Outbound AI获1600万美元的种子轮融资

官方网站:https://outbound.ai/

Outbound AI是一款专为医疗保健而创建的对话式AI。由独特的实时推理引擎和独特的认知能力驱动。他们的虚拟代理人组合经过训练和操作,可以在医疗保健工作职能的典型工作流程和活动中执行。

例如,他们的虚拟代理人完全有能力启动和进行电话行政工作,同时提供实时人类可见性和控制。Outbound AI可以利用他们广泛的医疗保健内容和连接器库,快速部署和集成到任何环境中,并且可以与遗留IT基础架构很好地协同工作。

Outbound AI于2021年从Madrona Venture Labs(MVL)中分离出来,由成功的医疗技术高管Stead Burwell和AI技术领导者Jonathan Wiggs创立。

6.帮助生物制药公司模拟临床试验的Altis获近600万美元的种子轮融资

官方网站:www.altislabs.com/

Altis Labs的使命是通过技术手段让人们能够更健康地活得更久。该公司的主要业务是开发生物技术,以恢复细胞的健康及它们对疾病、伤害甚至残疾的抵抗力。

Nota是Altis Labs的产品,它是一种计算成像平台,旨在推进精准医学。Nota可以帮助研究人员操作临床试验成像数据,访问预测性成像生物标志物,并在规模上加速研发。Nota的复杂工具集帮助用户高效地执行耗时、重复的过程,并使团队有效地协作。他们帮助研究人员更快地准备更高质量的数据,以便他们可以提高科学吞吐量并改善患者结果。

该公司的团队由来自加拿大、美国和欧洲的世界级专家组成,他们在计算机科学、医学成像、生物统计学和临床试验方面拥有丰富的经验。该公司的创始人之一是Dr. Michael R. Hayden是一位享誉全球的基因组学家,曾担任全球最大的生物技术公司之一的CSO和CEO,还是加拿大皇家学会和英国皇家学会的会员,并获得了加拿大勋章和英国勋章。

7.旨在打造神经接口平台的BIOS获Selvedge Venture, Y Combinator等融资

BIOS的目标是开发出一种可以直接与大脑交互的计算机芯片,以帮助人们克服各种神经系统疾病和损伤。

BIOS的产品和技术是研究神经接口的,旨在开发一种可以直接与大脑交互的计算机芯片,以帮助人们克服各种神经系统疾病和损伤。该公司的技术基于神经元和电子器件之间的接口,可以将电子信号转换为神经信号,并将神经信号转换为电子信号。这种技术可以用于治疗癫痫、帕金森氏症、失明、听力障碍等多种疾病。BIOS的技术还可以用于开发新型的人机交互界面,例如直接通过大脑控制计算机。

Oliver Armitage是BIOS的创始人和首席执行官。他在剑桥大学获得了物理学博士学位,并在牛津大学担任了一段时间的研究员。他还曾在英国国家物理实验室工作,负责开发新型的量子计算机。Armitage还是一位成功的企业家,曾创办过多家初创公司,并担任过多个初创公司的顾问和投资者。

8.利用AI技术简化银行业务的Cleareye.ai获JP Morgan融资

官方网站:https://cleareye.ai/

Cleareye.ai旨在通过提供由先进人工智能和机器学习驱动的技术解决方案来改善全球金融包容性。该公司的人工智能平台包括合规和监管变革管理、社交影响感知、人类互动、传统聊天机器人、高级文档摄取、验证等功能。

其人工智能平台包括合规和监管变革管理、社交影响感知、人类互动、传统聊天机器人、高级文档摄取、验证等功能。该公司的技术解决方案希望通过提供由先进人工智能和机器学习驱动的技术解决方案来改善全球金融包容性。

Mariya George是Cleareye.ai的联合创始人和首席执行官。她曾在美国银行、花旗银行、摩根大通等公司担任高管,拥有超过20年的金融服务经验。Sarath Sasikumar是Cleareye.ai的联合创始人、执行副总裁和首席运营官。他负责公司的生态系统战略、全球运营、人才管理和其他业务支持功能。

9.为医疗AI开发提供数据的Flywheel获NVIDIA领投5400万美元D轮融资

官方网站:https://flywheel.io/

Flywheel提供一个端到端的平台,自动化处理、管理和计算医疗成像数据,帮助医疗保健组织有效地扩展AI开发。该公司计划使用这笔资金扩大其业务规模,并帮助医疗保健和医学研究机构更加专注于AI项目。

Flywheel的系统由三个核心技术支持,包括管理成像数据、探索和分析数据以及浏览和使用预先整理的公共数据集。

Flywheel计划在公共部门和制药公司以外的更多医疗保健领域扩展,并在欧洲等关键地区增加其业务。AI在医疗保健行业的应用具有巨大潜力,包括新药的发现、疾病模式的识别以及患者护理的改进,Flywheel通过使用AI解锁医疗成像数据中的价值,为医疗保健行业带来创新。

人工智能产品和技术的新突破

1.Midjourney 5.2大更新,推出“zoom out”功能让用户无限扩展原始图像

Midjourney 5.2大更新,“zoom out”功能是其本次更新最大的亮点,允许用户无限地扩展原始图像,同时保持高清细节,创造出如同通过望远镜观察宇宙般的效果。

这个功能可以模拟从极近镜头到全开镜头的摄像机运动,为图像制作全新的大背景。此外,Midjourney 5.2还具有方形重构、标准变焦、自定义缩放重构、风格化、变化模式等功能,为艺术家和设计师提供了一个强大的工具来创造令人惊叹的图像和视频。

2.与Midjourney开战!Stable Diffusion XL 0.9重磅发布,使用35亿+66亿双模型

Stability AI近日发布了Stable Diffusion XL 0.9(SDXL 0.9),它是具有35亿+66亿双模型的AI图像生成工具,标志两个模型中,包括迄今为止最大的OpenCLIP模型(OpenCLIP ViT-G/14),以生成更逼真、更高分辨率(1024x1024)的图像。

此外,SDXL 0.9还支持图像对图像的prompt,内画(重建图像的缺失部分)和外画(构建一个现有图像的无缝扩展)等功能。SDXL 0.9可以在消费级显卡上运行,只需具备16GB内存和8GB以上显存的英伟达RTX 20系显卡。这使得SDXL 0.9不仅适用于专业设计师和艺术家,而且对普通消费者也非常友好。

3.OpenAI将推出史上最强「模型商店」,打通所有ChatGPT应用

OpenAI计划推出一个创新的“应用商店”式平台,以整合和打通所有基于ChatGPT的应用。这个平台将成为开发者和企业交流和获取大模型的中心,允许开发者出售定制的AI模型,同时使企业能够方便地浏览和选择适合自己需求的模型。这一举措有望加速AI模型的创新和应用,特别是对于小型开发者和公司,它提供了一个降低市场进入门槛并展示其AI模型的机会。

4.碾压GPT-4!谷歌DeepMind CEO自曝:下一代大模型将与AlphaGo合体

谷歌DeepMind即将推出一款革命性的AI模型,名为Gemini,它将AlphaGo的技术与大语言模型相结合。AlphaGo是一款以强化学习和树搜索为基础,曾击败人类围棋冠军的AI系统。Gemini模型将这些技术与语言处理能力结合,以增强其问题解决和规划能力。

DeepMind的CEO Hassabis表示,Gemini还在开发中,但已经展示了令人印象深刻的多模态能力。Gemini的开发预计将耗资数千万到数亿美元,与此前GPT-4的开发成本相当。Gemini不仅将整合AlphaGo的技术,还将融合来自其他领域如机器人和神经科学的创新。这个模型有望为AI领域带来重大突破,尤其在处理文本和解决复杂问题方面。

5.DragGAN正式开源,在GitHub近18k星,大象一秒P转身

DragGAN是一个使用生成对抗网络(GAN)的开源图像编辑工具,它通过简单的拖拽操作,使用户能够精确地编辑图像中的对象。这种技术的核心是基于特征的运动监控和一个新的点跟踪方法,它们共同工作,使用户能够对像素进行精确控制,从而编辑动物、汽车、人类、风景等多种类别的姿态、形状、表情和布局。

DragGAN不仅在图像操作和点跟踪任务中表现出色,而且具有强大的泛化能力,能够创建超出训练图像分布的图像。这意味着,即使在复杂和富有挑战性的场景下,DragGAN也能生成逼真的图像。

6.PandaGPT:首个横扫「六模态」的大型基础模型

由剑桥大学、奈良先端科学技术大学院大学和腾讯的研究人员开发的PandaGPT,是首个实现跨六种模态(图像/视频、文本、音频、深度、热量和IMU)执行指令遵循数据的基础模型。在没有明确多模态监督的情况下,PandaGPT展示了强大的多模态能力,能够处理复杂的理解和推理任务。

这一创新超越了传统的单模态分析,为AI的发展开辟了新的可能性。它能够生成详细的图像描述、编写受视频启发的故事、回答有关音频的问题,并进行多轮对话。这些功能的结合,使PandaGPT成为一个强大的工具,不仅为研究人员提供了更广泛的应用场景,也为实现更接近人类水平的AI理解和推理能力迈出了重要一步。

7.首个感知决策一体化自动驾驶通用大模型,商汤联合团队获CVPR 2023最佳论文

商汤科技联合上海人工智能实验室和武汉大学的团队开发的UniAD,是一款革命性的自动驾驶通用大模型,它在CVPR 2023上荣获最佳论文奖。

UniAD首次将检测、跟踪、建图、轨迹预测、占据栅格预测以及规划整合到一个基于Transformer的端到端网络框架下,实现感知决策一体化。

这一创新性的技术在多个复杂场景下展示了显著的优势,并标志着自动驾驶技术的重要突破。UniAD的开发不仅为自动驾驶技术和产业的发展提供了新的方向,而且展示了如何通过整合多个关键任务来实现更高效和可靠的自动驾驶系统。

8.比HuggingFace快24倍!伯克利LLM推理系统开源,让GPU砍半

UC伯克利近日开源了一款名为vLLM的大型语言模型推理系统,它通过使用一种名为PagedAttention的创新性注意力算法,显著提高了内存效率和吞吐量。PagedAttention算法允许在非连续的内存空间中存储连续的键和值,灵感来源于操作系统的虚拟内存和分页。

这种方法使vLLM在吞吐量上比HuggingFace/Transformers快24倍,同时减半了GPU的使用量。vLLM的推出为大型语言模型的推理和部署提供了一个高效、灵活的解决方案,具有广泛的应用前景。

9.清华第二代60亿参数ChatGLM2开源!中文榜居首,推理提速42%

清华大学的ChatGLM-6B自3月发布以来,在AI社区爆火,GitHub上已斩获29.8k星。如今,第二代ChatGLM来了。

这款名为ChatGLM2-6B的大型语言模型,通过使用一种新的注意力算法,显著提升了推理能力,并支持更长的上下文。这款模型在中文C-Eval榜单上以71.1分位居榜首,超过了GPT-4。ChatGLM2-6B的新版本增加了许多特性,包括更强大的性能,支持8K-32k的上下文,推理性能提升了42%,并且对学术研究完全开放。这一创新性的语言模型为自然语言处理领域的研究和应用提供了一个强大的工具,具有广泛的应用前景。

10.DeepSpeed ZeRO++:降低4倍网络通信,显著提高大模型及类ChatGPT模型训练效率

微软DeepSpeed团队开发的DeepSpeed ZeRO++是一种优化系统,可以显著提高大型AI模型(如Turing-NLG、ChatGPT和GPT-4等)的训练效率。ZeRO++相比ZeRO将总通信量减少了4倍,而不会影响模型质量。

它的优化主要有两个方面:一是加速大型模型预训练和微调,无论是在数千个GPU上预训练大型模型,还是在数百个甚至数十个GPU上对其进行微调,当每个GPU的batch size较小时,ZeRO++提供比ZeRO高2.2倍的吞吐量,直接减少训练时间和成本。二是加速ChatGPT类的RLHF训练,ZeRO++可以提高人类反馈强化学习 (RLHF) 等算法的效率,因为RLHF结合了训练和推理。

11.斯坦福训练Transformer替代模型:1.7亿参数,能除偏、可控可解释性强

斯坦福大学的研究者们开发了一种名为Backpack的新型神经架构,以解决大型语言模型的问题,如偏见。Backpack通过调整意义向量来干预语言模型的行为,从而引导模型输出预期结果。这种架构的预测是非上下文表征的对数-线性组合,允许更精确的干预,并能预测在所有上下文中的情况。

实验证明,Backpack在表现力上是强大的,并且通过调整意义向量可以有效地控制和解释模型的行为。这种方法在处理偏见和敏感主题方面具有特别的价值。

论文一作、斯坦福大学CS博士生John Hewitt表示,Backpacks是 Transformers的替代,它可以在表现力(expressivity)上进行扩展,并为通过控制实现可解释性提供一种新接口。一个backpack学习每个字词的k个非上下文意义向量,从而无监督地解耦字词的预测用途。

本文由阿尔法公社综合自多个信息源,并在ChatGPT的辅助下写作。

关于阿尔法公社


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1