埃隆·马斯克和OpenAI正面“怼”上了。
2024年2月29日,埃隆·马斯克以个人身份在加州旧金山高级法院起诉山姆·奥特曼(Sam Altman,OpenAI现任CEO)、格雷格·布罗克曼(Greg Brockman, OpenAI现任总裁)、OpenAI及其8家关联公司,请求法院判决OpenAI开发的AI研究和技术向公众开放,禁止利用OpenAI, Inc.或其资产为个人被告、微软或任何其他特定个人或实体的财务利益服务。
“想象一下,你向一家保护亚马逊雨林的非营利组织捐款,它却创建了一家营利性的亚马逊伐木公司,利用捐款成果来清除雨林。这就是OpenAI,Inc.的故事。”
这份长达46页的起诉书,以时间轴划出了148个要点,详述埃隆·马斯克自2015年参与OpenAI创办、捐赠和退出的过程。从创办初期的非营利组织形态,“技术造福公众”的初心,到2019年开始成立营利子公司,引入微软100亿美元投资,以及2023年11月Altman被罢免风波和董事会重组之后,公司放弃非营利的使命。
这是马斯克在数次公开指责OpenAI之外,第一次付诸法律行动。文书强调,“本案是为了迫使OpenAI遵守创始协议,回归其为人类利益开发AGI的使命,而不是为了个别被告和世界上最大的科技公司的个人利益。”
自2020年GPT-3发布之后,OpenAI不再发布关于模型开发和实现的技术论文,GPT-4更是一个完全封闭的模型,没有发布任何代码,只发布了一些关于其性能的新闻稿。
这与当下Meta、谷歌等纷纷开源大模型形成鲜明对比。谷歌在2024年2月21日开源的Gemma还允许商用,OpenAI却越来越封闭。
想想2015年创立协议中曾明确,“它将是开源的,只平衡反向的安全考虑,不会因专有商业原因而保持其技术的封闭和秘密”。作为创始捐赠者的马斯克,怒火中烧,付诸法律行动,着实也情有可原。
诉讼文书描述了OpenAI的结构近年来如何变得越来越复杂,提及微软高达68次,并称“OpenAI已经变成全球最大的技术公司微软的实际子公司”。
“虽然OpenAI,Inc.曾经是基于与公众的开放沟通进行安全、负责任的AGI开发的先驱,但现在它已经关闭了大门,将其营利子公司的最大投资者带到了一个只对人类负有唯一信托责任的董事会,并继续秘密地朝着可能对人类产生灾难性影响的利润为中心的未来前进。”
尽管此前马斯克对OpenAI的指责,总被人解读为“酸葡萄”心理,但是整份文书读下来,还是颇引人深思,OpenAI这8年多来是如何从开放走向封闭的呢?“安全”究竟是不是商业的遮羞布?
诉讼的结果未知,但值得所有关心AI发展的人们关注。
微软无疑是这一轮AI大潮中的最大赢家,而它最大的依仗就是投资并与OpenAI深度合作。假如微软被限制使用OpenAI技术,结果会是怎样?
2月26日,微软与有“欧版OpenAI”之称的Mistral AI建立合作关系。
2月29日,贝索斯、微软、英伟达、OpenAI等联合投给了人形机器人初创公司Figure AI 6.75亿美元,使其公司估值达到了26亿美元。作为协议的一部分,Figure还将与OpenAI合作,为人形机器人开发下一代AI模型。
这家2022年1月才成立的机器人公司,2024年1月发布的Figure 01机器人,已经实现了“自主冲咖啡”。它只需要观看咖啡制作的演示视频,再加上10个小时端到端的训练,就可以自主完成任务。
公司创始人Brett Adcock,是个有着20年创业经历的连续创业者,他此前的创业项目包括基于AI的在线人才市场Vettery,用于城市空中交通的电动垂直飞行器公司Archer Aviation,被称为“下一个马斯克”。
Figure AI,无疑也会是特斯拉人形机器人Optimus的直接竞争对手。
ICT前沿
印度批准了三个半导体工厂
2月29日,由纳伦德拉·莫迪(Shri Narendra Modi)主持的联合内阁,批准建立三个半导体工厂。
第一座为塔塔集团(Tata)与中国台湾力积电(PSMC)合作的晶圆厂,位于古吉拉特邦的Dholera,总投资9100亿卢比,预计月产能5万片晶圆。
第二座为塔塔集团在印度东北部阿萨姆邦建立的封测工厂,是由塔塔集团旗下的塔塔半导体组装公司(Tata Semiconductor Assembly)与Test Pvt Ltd合作建设的,总投资2700亿卢比,日产能可达4800万颗芯片。
第三座是印度CG Power与日本瑞萨电子、泰国Stars Microelectronics共同建设的封测工厂,总投资760亿卢比,日产能约1500万颗芯片。
这三个工厂将在未来100天内开始建设,属于印度“半导体和显示器制造生态系统”(Semiconductor and Display Manufacturing Ecosystem)的组成部分。印度联邦内阁于2021年12月15日批准该项综合计划,旨在为从事硅半导体晶圆厂、显示晶圆厂、化合物半导体/硅光子学/传感器(包括MEMS)晶圆厂、半导体封装(ATMP/ OSAT)和半导体设计的公司提供支持。印度政府为该计划拨款23万亿卢比(300亿美元),将印度定位为全球电子制造中心。
• 点评:除了欧美日韩中,印度也加入了全球半导体产业链扶持和争夺。毕竟,这是事关人类数智化未来的关键基础设施之一。(唐家乐)
阿里发布AI图生视频模型EMO
2月28日,阿里巴巴智能计算研究院推出一款图片驱动的音频生成视频的AI框架——EMO(Emote Portrait Alive)。用户输入一张参考图像和人声音频(如说话和唱歌),就能生成具有丰富表情和各种头部姿势的人声头像视频;且还能在保持角色身份稳定性的同时,根据输入音频的长度生成不同时长的视频。
EMO首先利用参考网络(ReferenceNet)从参考图像和运动帧中提取特征;再通过预训练的音频编码器处理音频嵌入,结合多帧噪声和面部区域掩码来生成视频。EMO技术细节的相关预印本论文,在2月27日发布于arXiv(未经同行评审)。
• 点评:不同于OpenAI的文生视频模型Sora,EMO是以“图+音频”方式生成视频,能根据音频的长度生成任意时长的视频,同时保持角色身份的一致性,在AI技术领域是一个进步。同时,如何检测出合成视频,以及如何谨防侵犯个人隐私、扭曲信息真相等技术滥用问题,也值得思考。(罗仙仙)
谷歌发布AI基础世界模型Genie
2月26日,谷歌旗下DeepMind推出AI模型“Genie”(精灵),一个能够生成交互式视频游戏的基础世界模型。它可以根据用户提示,将合成图像、真实照片、手绘草图等转换成多种可玩、动作可控的虚拟世界。
Genie有110亿个参数,由视频分词器、动态预测模型和简单且可扩展的潜在动作模型组成。Genie借助公开视频数据集进行训练,可以在没有任何动作标签数据时学习控制,还能推断出在生成环境中一致的潜在动作。因而,无需真实动作标签或特定领域要求,Genie便可以让用户在生成环境中逐帧操作。
此外,Genie学到的潜在动作可以转移到真实的人类设计的环境中。作为一种通用方法,Genie可以应用于多个领域,而不需要任何额外的领域知识。
DeepMind放出了Genie的论文论文地址:https://arxiv.org/pdf/2402.15391.pdf
• 点评:Genie是一种全新的生成式AI范式,仅凭一张图像,就能创造出互动性强、可玩的环境。说Genie是实现通用智能体的基石之作,并不夸张。正如Genie团队负责人Tim Rocktäschel所言,“Genie作为世界模型,是人类迈向AGI的旅途中非常重要的一步。”
AI-RAN联盟成立
2月26日,在巴塞罗那举行的2024年世界移动通信大会(MWC)上,AI-RAN联盟成立,旨在将人工智能(AI)融入蜂窝技术,进一步推动无线接入网(RAN)技术和移动网络的发展。创始成员包括亚马逊网络服务公司(AWS)、Arm、DeepSig、爱立信、微软、诺基亚、东北大学(Northeastern University)、英伟达、三星电子、软银集团、T-Mobile美国公司等10家企业和机构。
联盟即将聚焦提高移动网络效率、降低功耗和改造现有基础设施,为电信公司在5G和6G的推动下利用AI释放新的经济机遇创造条件。联盟中的网络运营商将率先测试和实施这些由成员公司和大学集体研究开发的先进技术。
• 点评:4G通信技术成就了移动互联网时代,AI与6G技术的融合又将给人类带来怎样的新生态?这需要更多的技术、企业、研究机构一起来探索。(李一跞)
生物医药
用光照刺激治疗阿尔茨海默病
2月28日,麻省理工学院(MIT)的蔡立慧(Li-Huei Tsai)教授研究团队在《自然》杂志发表论文Multisensory gamma stimulation promotes glymphatic clearance of amyloid。研究团队通过使用5XFAD的阿尔兹海默病(AD)遗传小鼠模型(表达人类APP和PSEN1转基因,共有五个与AD相关的突变),提出了一种40Hz刺激疗法的关键机制——40赫兹的声光刺激有助于刺激脑部类淋巴网络(glymphatic system),加速脑脊液(CSF)的流入和间质液(ISF)的流出,降低小鼠脑中淀粉样蛋白水平。
这是该团队在发现40Hz刺激疗法的持续研究结果。2016年,该团队首次发现,40赫兹的闪光能够在小鼠脑中激发出γ神经振荡(频率范围在30~100赫兹的一种脑内神经元同步化活动),减少β淀粉样蛋白斑块;到2019年,研究团队发现40赫兹的声音也能起到同样的效果,在小鼠疾病模型中减少海马体中的β淀粉样蛋白,并且提升动物的认知能力。
蔡立慧教授与MIT光遗传学先驱Edward Boyden教授在2016年联合创立生物科技公司Cognito Therapeutics,开发在人类中使用的声光刺激设备,并在2021年获得美国FDA的突破性设备认定;2023年,该设备2期临床试验中取得积极结果,与对照组相比,轻中度阿尔茨海默病(AD)患者在接受治疗6个月时,治疗组患者脑容量损失(MRI)减缓69%、功能衰退(ADCVS-ADL)减缓77%,没有严重的治疗限制副作用。
▲ Cognito's headset,通过非侵入性视觉和听觉刺激,激发出γ神经振荡。图片来源:Cognito Therapeutics。
• 点评:这一研究揭开了一项创新的淀粉样蛋白清除机制,为AD治疗带来新的思路。同时,使用40Hz刺激疗法于临床上治疗AD患者还有待更进一步的研究与验证,期待这项突破性研究带来真正的医学突破。(罗仙仙)
表观遗传编辑疗法疗效持久近一年
2月28日,《自然》刊发意大利IRCCS圣拉斐尔科学研究所团队论文Durable and efficient gene silencing in vivo by hit-and-run epigenome editing,接受单次注射表观遗传编辑疗法的实验小鼠,其体内低密度脂蛋白胆固醇(LDL-C)在一个月内显著下降;且用于降低LDL-C的靶点PCSK9(经过临床验证用于降低LDL-C水平的靶点,通过抑制LDL受体的回收和再利用)在血浆中的表达水平持续降低,效果维持近一年,验证了表观遗传编辑技术在沉默基因方面的长期效力。
• 点评:表观遗传学指的是一种可逆的遗传机制,可在不改变DNA序列的情况下,通过对DNA与组蛋白(histone)的修饰来影响基因表达。这项研究展示了表观遗传编辑疗法治疗疾病的潜力,也已经有初创公司开始专注表观遗传编辑疗法开发,一个新时代即将开始。(罗仙仙)
南方周末科创力研究中心
责编 黄金萍