AI创投周报｜DeepMind发布通用型AI智能体，AI程序员能力超GPT-4

作者：阿尔法公社发布时间：2024-03-15

GPT-4 生成式AI 人工智能融资

AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社发现和投资非凡创业者（Alpha Founders），相信非凡创业者们在技术、商业和社会方面的巨大推动力，他们指引着创投生态的风向。

本图由“千象”（网址：www.hidreamai.com）生成

本周，我们观察到以下AI领域的新动向和新趋势：

1.OpenAI和初创公司Figure合作推出人形机器人Figure 01，在新的演示视频中它能通过预训练模型理解其周围环境，使用常识推理做出决策，并将模棱两可的请求转化为具体行动。

2.全球首个AI程序员Devin亮相，它由Cognition公司研发，在模拟真实工作场景编程的测试SWE-bench上表现远超GPT-4等先进模型。Cognition由华人团队创办，团队成员共拥有10块IOI金牌。

3.DeepMind发布通用型AI智能体SIMA，这项研究为AI智能体完成需要高级战略规划和多个子任务才能处理的复杂任务打下基础。

人工智能产品和技术的新突破

1.能说会看会行动，OpenAI大模型上身人形机器人

OpenAI和机器人初创公司Figure合作推出的机器人Figure 01展现了惊人的能力，这款机器人能够理解周围环境，如识别桌子上的物品并在收到指令时递送苹果，展示了其对日常环境的理解和交互能力，重要的是，所有演示都是机器人原速执行，无人操控。

Figure 01通过将摄像头图像和语音文本转录输入到OpenAI的多模态大模型中，实现了高级规划和执行具体命令的能力。此外，Figure 01还能通过预训练模型理解其周围环境，使用常识推理做出决策，并将模棱两可的请求转化为具体行动。

此次开发不仅加速了人形机器人技术的进步，也为机器人在更多实际应用场景中的部署提供了可能，如在危险或人力资源紧缺的工作环境中代替人类执行任务。随着技术的持续发展和优化，期待未来这种人形机器人能够更加深入地融入人类生活中，成为助手和伙伴。

2.拥有10块IOI金牌的华人团队打造，全球首个AI程序员诞生

由Cognition公司研发的AI程序员Devin发布，它是全球首位AI软件工程师。它具备了全栈技能，并能自主学习、端到端构建和部署应用程序，自行发现并修复bug，甚至能训练和微调自己的AI模型。

Devin的能力在模拟真实工作场景编程的测试SWE-bench上得到了验证，其表现超越当前的顶尖AI模型，如Claude 2、Llama和GPT-4。

Devin的背后是由10人组成的华人团队，团队成员拥有10个IOI金牌的辉煌成绩，由Scott Wu和Neal Wu兄弟领衔。这个初创团队的目标是打造能够自动完成编码任务的AI，而Devin正是他们向这一目标迈出的重要一步。

3.改变游戏规则，Midjourney能让角色保持一致了

Midjourney最新推出的角色参照功能，这一更新使得用户可以通过特定的命令，在生成图像时让角色的面部、发型和着装保持一致，甚至可以在不同的风格中转换而不改变角色本身的特征，包括动漫风、写实风等多种风格。

用户们对这一功能的测试反应积极，通过多次实测，网友们展示了使用新功能后，无论是保持角色特征的一致性，还是在不同风格之间转换时的效果，都表现出色。这一功能不止能让用户创造自己的风格IP，还可能被用在电商领域。

4.最快最大的芯片面世，4万亿个晶体管，单机可训练比GPT-4大10倍的模型

芯片创业公司Cerebras最近发布一款拥有4万亿个晶体管的芯片—WSE-3，据称是最大最快的AI芯片，它使用5纳米工艺制造，拥有90万个AI优化的计算核心，能提供每秒125 petaflops的峰值AI性能。

配备WSE-3的Cerebras CS-3人工智能超级计算机理论上可以处理24万亿个参数的大型语言模型，这比目前最大的AI模型GPT-4的参数量高出一个数量级，这种超级计算机能简化AI模型训练工作流程，提高开发人员的工作效率。

此外，Cerebras的最新软件框架为PyTorch 2.0和最新的AI模型技术提供原生支持，使得CS-3成为目前唯一能为动态和非结构化稀疏性提供本机硬件加速的平台，极大地提高了训练速度。

5.苹果多模态大模型MM1发布：300亿参数、MoE架构

苹果公司近期正式公布了其在多模态大模型领域的研究成果—MM1模型。MM1是一个300亿参数的多模态大语言模型，采用了密集模型和混合专家（MoE）架构。

MM1模型的开发涉及了架构、数据、和训练程序等多个方面的决策。研究者进行了一系列消融实验，分析了模型架构决策和预训练数据选择对模型性能的影响，发现图像分辨率、视觉编码器损失和容量以及视觉编码器预训练数据是建模设计中的关键因素。

MM1模型在预训练指标中实现了最先进的性能，在多个多模态基准上经过监督微调后，也展现出了竞争力极强的性能。特别是在少样本设置下的字幕和问答任务上，以及在一系列监督微调后的多模态基准上，MM1模型均表现优异。

6.OpenAI官宣开源Transformer Debugger，不用写代码，人人可以破解LLM黑箱

OpenAI最近开源一款名为Transformer Debugger的工具，这款工具允许研究人员无需编写代码即可深入探索和分析Transformer模型的内部机制。

TDB整合了稀疏自动编码器和自动可解释性技术（利用大模型自动解释小模型）。该工具的推出意味着研究人员可以通过直观的界面查询模型输出、跟踪重要激活并分析上游激活，从而回答关于模型行为的具体问题。

OpenAI通过GPT-4展示了如何解析GPT-2的神经元活动，标志着向理解复杂模型行为迈出的一大步。Transformer Debugger的推出进一步降低了技术门槛，使得更多研究人员能够参与到模型分析中。TDB通过简化的用户界面提供对模型内部结构的深入分析，例如分析模型为何偏好特定的输出或注意力头为何关注特定的token。

Transformer Debugger的开发源于OpenAI对于解密神经网络和Transformer“黑箱”的持续探索，旨在确保人类可以安全地与AI共存。通过开源Transformer Debugger，OpenAI希望吸引更广泛的社区参与改进和利用这一工具，共同推动AI技术的健康发展。

7.智能体的ChatGPT时刻！DeepMind通用AI智能体向人类玩家进化，开始理解游戏

谷歌DeepMind推出能在3D虚拟环境中操作的通用AI智能体SIMA（Scalable Instructable Multiworld Agent），这标志着AI智能体在游戏理解和执行方面迈出了重要一步。

SIMA的独特之处在于其能够通过预训练的视觉模型感知游戏环境，并根据简单的自然语言指令执行任务，无需访问游戏的源代码或定制的API。它通过键盘和鼠标输出控制游戏中的角色，从而实现了与任何虚拟环境的交互。

此外，SIMA在跨游戏的泛化能力上展现了显著优势，受过多种游戏训练的智能体比仅学习如何玩一种游戏的智能体表现更好。DeepMind希望未来的智能体能够处理更需要高级战略规划和多个子任务才能完成的复杂任务。SIMA的研究不仅是为了获得游戏中的高分，而是为了让AI智能体在各种环境中遵从指令，展现出更大的作用。

人工智能初创公司的新融资

1.企业级通用人工智能员工开发商Ema获Accel等共同领投的2500万美元种子轮融资

官方网站：www.ema.co

近日，致力于开发企业级通用人工智能助手的Ema获Accel、Section 32、Prosus Ventures领投， AME Cloud Ventures、Firebolt Ventures、Frontier Ventures、The Maum Group、Venture Highway、Wipro Ventures参投的2500万美元种子轮融资。同时，众多硅谷知名个人投资人也参与投资，包括Meta前首席运营官Sheryl Sandberg、Snowflake首席执行官Sridhar Ramaswamy、雅虎联合创始人杨致远、Facebook首任首席技术官Dustin Moskovitz。

Ema的核心产品Universal AI Employee能够帮助企业以安全、合规的方式实现任何工作流程的自动化。Generative Workflow EngineTM（GWE）是Ema的核心技术之一，GWE可以通过将单一问题分解为子任务来生成带有问题对话描述的新工作流程。Universal AI Employee带有长期记忆，这使它们能够长期从人类用户那里获取反馈并加以整合以不断提高他们的绩效。

对于当前的AI应用容易产生幻觉和产生高昂计算成本的问题，Ema通过其专有的超过2万亿个参数的专家混合模型解决了这些问题。EmaFusionTM结合了30多种公共大语言模型（包括GPT 4、GPT-3.5、Claude 2.1、Gemini、Mistral-S、Llama2等），并支持自定义和特定领域模型的集成，以实现对每项任务进行优秀成本控制的同时实现工作效率和准确度的最大化。

Ema由Surojit Chatterjee（CEO）、Surojit Chatterjee、Souvik Sen联合创立，他们在此次创业前积累了丰富的产业经验。Surojit Chatterjee曾领导了Google移动广告和Google购物业务，将其规模扩大到数十亿美元，作为首席产品官参与了Coinbase的创业。Surojit Chatterjee是Palantir Technologies的投资人。Souvik Sen创建了惠普首款室内定位系统HP Location Aware的创建者，主导了Google的TrustGraph项目。此外，Surojit Chatterjee和Souvik Sen还分别拥有40余项和37项美国专利。

2.人工智能安全平台开发商RapidSOS获BlackRock领投的7500万美元追加C轮融资

官方网站：rapidsos.com

人工智能安全平台开发商RapidSOS近期完成的7500万美元追加C轮融资由BlackRock领投，Acrew Capital、BAM Elevate、Harmonic Growth Partners、Insight Partners、Manhattan Venture Partners、NightDragon跟投，使其C轮融资总额增至1.5亿美元。截至目前，RapidSOS的融资总额超3.5亿美元。

RapidSOS的平台将AI与人类洞察力无缝集成以主动管理紧急情况，提高救生工作的效率。RapidSOS的第一款产品是名为Haven的应用程序，用户可以通过该应用拨打911急救电话和发送急救短信，使急救员能够直接获取位置信息。随后RapidSOS推出了位置信息服务器和数据存储库RapidSOS Clearinghouse，能够汇集来自 iOS、Android、可穿戴设备和汽车设备的数据，免费提供给公共安全机构使用。

基于AI的RapidSOS平台可以智能支持预测事件感知和建模、武器检测、人群估计、地理编码服务、语言翻译、自动响应建议、事件验证和情绪分析。

2023年，RapidSOS的智能安全平台处理了训练有素的运营团队和急救人员使用的超过30亿条数据源，以管理1.71亿起紧急情况，覆盖超过99%的美国人口。

RapidSOS成立于2012年，总部位于美国纽约，创始人Michael Martin（CEO）是哈佛商学院的MBA，曾创立企业战略与融资咨询公司MS Consulting，并曾担任Braemar Energy Ventures的投资人。联合创始人Nicholas Horelik（CTO）硕士和博士均毕业于麻省理工学院核工程专业。

3.AI回收机器人提供商Glacier获Amazon’s Climate Pledge Fund和NEA共同领投的770万美元早期融资

官方网站：endwaste.io

近日，Glacier完成由Amazon’s Climate Pledge Fund和NEA领投，lleyCorp、Overture VC、VSC Ventures跟投的770万美元融资，该轮融资为其继种子轮后的第二轮融资。

Glacier致力于利用AI驱动的机器人进行可回收物分类与回收，并为回收公司和消费品牌收集回收流的实时数据以建立一个更有效的回收系统。

Glacier围绕两种主要产品，一种是部署在回收设施中的机器人，用于对不同的材料进行分类。另一种是人工智能扫描仪（正在亚马逊试点）。

空间限制、安装停机时间和资本要求常常限制自动回收设施，Glacier的回收机器人易于部署，其占地面积与人相同，安装时无需设施停机也无需重型机械，且一台Glacier机器人可以在不到一年的时间内收回投资。

在扫描方面，Glacier的产品能识别30多种不同的材料，不仅包括塑料瓶和铝罐，还能识别杂货袋和垃圾袋等传统回收技术很难进行分类的材料。

Glacier成立于2019年，总部位于旧金山湾区，联合创始人Areeb Malik本科毕业于康奈尔大学运筹学专业，曾在Facebook担任高级软件工程师超过5年，期间负责了将Facebook的企业广告平台转变为基于React的现代UI和架构。联合创始人Rebecca Hu曾在贝恩咨询公司担任高级咨询顾问。

4.AI驱动的数据可观测性平台Metaplane获Felicis领投的1380万美元A轮融资，Khosla Ventures和YC参投

官方网站：www.metaplane.dev

近日，AI驱动的数据可观测性平台Metaplane完成了1380万美元的A轮融资，本轮融资由Felicis领投，Khosla Ventures、Flybridge、Y Combinator、Stage 2 Capital、B37、SNR等知名机构参投。Khosla Ventures、Flybridge和Y Combinator还是其种子轮投资人。

随着企业数字化程度加深，数据管理、数据安全成为重中之重。当系统出现故障时，数据团队需要及时发现，否则此故障将会导致整个组织工作中断。Metaplane作为AI驱动的数据可观测性平台，仅需几分钟（而非几个月），就能连接客户的数据仓库，自动检测异常并提供针对性的修复建议。

随着时间的推移，Metaplane的AI模型会学习客户的数据模式，并提出越来越个性化的建议，以适应不同企业独特的数据生态系统。

2023年，Metaplane的客户数量翻倍，包括Klaviyo、Sigma、Census、GoFundMe、Bose、Ramp和ClickUp等领先公司的数据团队都在使用该公司的产品。截至2024年1月，Metaplane已帮助客户进行了超过5亿次数据质量检查。

Metaplane由Kevin Hu（CEO）、Guru Mahendran和Peter Casinelli于2019年创建，Kevin Hu博士毕业于MIT，拥有多篇高影响力论文；Guru Mahendran毕业于多伦多大学，是连续创业者。

5.AI治疗助理初创公司Limbic获得Khosla Ventures领投的1400万美元A轮融资

官方网站：limbic.ai

用AI技术赋能临床心理健康的Limbic AI获得由Khosla Ventures领投，Gaingels和llusian参投的1400万美元的A轮融资。

Limbic AI开发了人工智能心理健康聊天机器人和人工智能驱动的临床转诊软件，覆盖26万名患者。

Limbic为患者提供生成式AI心理健康护理伴侣，该伴侣可以在治疗期间为用户提供支持。由复杂的临床人工智能大脑提供支持的无缝聊天机器人界面可引导患者完成精选的100个主题活动和教育材料，按需提供具有临床严谨性的心理健康支持。

Limbic的AI聊天机器人旨在解决欧洲对心理健康支持的高需求与医疗保健服务能力不足之间日益扩大的差距。它的聊天功能可作为治疗过程之间的支持工具，使用评估软件向用户提问，了解患者遇到的心理问题，然后将这些见解发送给临床医生，为诊断过程提供信息。

Limbic由Ross Harper（CEO）和Sebastiaan de Vries（CTO）联合创立，Ross Harper硕士和博士均毕业于伦敦大学学院生物数学建模专业与计算神经学专业，曾创立应用程序开发公司Wriggle；Sebastiaan de Vries曾创立支付程序开发商Florin。

本文由阿尔法公社综合自多个信息源，并在ChatGPT的辅助下写作，封面图片由Hidream.ai的Pixeling（千象）生成。

关于阿尔法公社