全球科技早参丨Sora训练数据被质疑

作者：每日经济新闻发布时间：2024-03-18

｜2024年3月18日星期一｜

NO.1苹果推出MM1多模态大模型

近日，在一篇名为MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training的论文中，苹果正式公布MM1多模态大模型研究成果。该模型提供30亿、70亿、300亿三种参数规模，拥有图像识别和自然语言推理能力。它由密集模型和混合专家（MoE）变体组成，不仅在预训练指标中实现最优效果，在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。

点评：苹果的这一突破性技术展示了其在多模态AI领域的成果，有助于推动行业创新。

NO.2英伟达GTC2024即将揭幕

3月18日至21日，英伟达GTC大会将在圣何塞会议中心和线上同时举行。这是英伟达每年最重要的技术发布平台之一，被业界公认为“AI风向标”。据悉，英伟达有望在大会上发布Blackwell架构及B100芯片。作为Hopper架构H200芯片的下一代产品，英伟达早已在全球超算大会上展示过B100芯片的强劲性能，在训练GPT-3 1750亿参数模型的比较中，B100芯片以喷射式的性能提升幅度碾压H100和H200芯片。此外，英伟达或将发布一系列生成式AI应用。

点评：英伟达即将发布的新技术可能会进一步巩固其在高性能计算和AI领域的市场主导地位。

NO.3CAR-T疗法对实体瘤显示出效果

近日，两篇分别刊登于《自然-医学》和《新英格兰医学杂志》的研究结果表明，抗原嵌合受体T细胞（CAR-T）疗法在临床试验中表现出了针对实体恶性脑肿瘤——胶质母细胞瘤的治疗效果。据悉，胶质母细胞瘤是成人中最常见的脑部恶性肿瘤，即使是最好的治疗也收效甚微。过去利用免疫系统对抗该脑肿瘤的尝试均失败了，导致患者只能依靠传统药物、放疗和化疗，但平均生存率改善却不尽如人意。

点评：这一临床进展可能会开启实体瘤治疗的新篇章，对整个医疗行业产生深远影响。

NO.4奔驰汽车工厂试点Apollo机器人

近日，奔驰宣布和仿人机器人开发商Apptronik达成协议，双方将合作探索高科技机器人Apollo，主要从事搬运、装配零部件等繁重的低技能劳动。根据双方协议，奔驰将启动试点项目，在汽车制造过程中测试Apollo仿人机器人执行各种任务的能力。奔驰称，相比较全面升级汽车生产流水线，Apollo机器人的运用可以降低员工工伤情况，自动化复杂、重复和枯燥的任务，进一步释放生产力。

点评：奔驰的这一举措可能会提高生产效率，同时减少工人的劳动强度。

NO.5ChatGPT参数规模或被破解

近日，南加州大学研究人员使用一种方法，仅花费不到1000美元就将最新版GPT-3.5-turbo模型的参数规模破解出来。据该研究报告，研究人员破解出了未公布的GPT-3.5-turbo嵌入向量维度为4096或4608。几乎所有已知的开源大模型如Llama和Mistral，在嵌入向量维度为4096时，参数规模均为7B（70亿）。南加大研究团队指出，可以推测GPT-3.5-turbo的参数规模也在7B左右。

点评：此发现可能会促使AI领域对模型透明度和安全性的进一步探讨和改进。

NO.6Sora训练数据被质疑

近日，OpenAI CTO Murati在接受采访时对Sora训练数据支支吾吾，让Sora陷入版权争议。当记者问及Sora是用什么数据训练以及是否用到YouTube、Facebook和Instagram上的视频时， Murati对此语焉不详，称不太确定，并表示不会详细透露关于使用数据的细节，但强调该公司使用的是公开可用的以及经过许可的数据。此前，OpenAI已频繁陷入版权诉讼。去年年底，《纽约时报》已向OpenAI及微软提起侵犯版权诉讼，指控二者未经许可使用其数百万篇文章以训练模型。

点评：这可能影响OpenAI在AI领域的声誉，并加剧版权诉讼风险。

免责声明：本文内容与数据仅供参考，不构成投资建议，使用前核实。据此操作，风险自担。

每日经济新闻