刚刚过去的2024年3月,OpenAI最强人工智能(AI)大模型GPT-4发布了一周年,对于生成式 AI 的热度只增不减。
过去一个月内,OpenAI、谷歌、微软、英伟达、阿里等多家国内外大科技公司均发布多个关于 AI 的重要消息,动作不断,全球最强 AI 芯片B200引发关注,OpenAI创始人、CEO奥尔特曼(Sam Altman)被曝身价超过140亿美金,AMD“中国特供”AI 芯片出口或将受阻。
据彭博 AI 研究的最新统计显示,预计到2032年,全球生成式AI市场规模有望增长至1.3万亿美元,年复合增速达43%。
此次,钛媒体AGI 回顾并梳理了三月份通用人工智能(AGI)行业的重大新闻事件,帮助读者快速了解瞬息万变的 AI 技术领域,感受 AI 浪潮带来的全新科技革命。
3月2日
谷歌创始人称Gemini图像生成技术“一团糟”
谷歌联合创始人谢尔盖·布林(Sergey Brin)现身在一场以谷歌旗下大模型Gemini 1.5为主题的黑客马拉松活动上,他承认Gemini的图像生成“一团糟(messed up)”,推出前没有做充分的测试,并为此进行了道歉。
3月4日
OpenAI创始人被曝身价超过140亿
据彭博亿万富翁指数最新数据显示,今年38岁的奥特曼(Sam Altman)最新身价(净收入)至少为20亿美元(约合人民币143.93亿元),但这一数据并不包括他在OpenAI的任何股份。奥特曼曾多次表示,他不拥有OpenAI 的股权。而他大部分财富都存在于风投机构和初创公司投资项目中,包括Reddit IPO等。
阿里领投Minimax超6亿美元融资
通用大模型初创项目MiniMax正在进行新一轮大规模融资,总金额超过6亿美元,阿里为其中的核心领投方。此前,MiniMax已完成3轮融资,投资方包括腾讯投资等。
性能超越GPT-4的Claude 3大模型发布
近日,谷歌、亚马逊投资的OpenAI竞争对手——Anthropic公司发布最新Claude 3系列模型,包括Claude 3 Opus、Sonnet和Haiku三种,最强模型Opus是的性能超越OpenAI的GPT-4。
3月5日
AMD“中国特供”AI 芯片出口受阻
AMD即将向中国客户销售MI300系列“中国特供版”AI 芯片,被称为MI309,旨在满足美国政府的出口管制新规。但美国政府目前不同意这款特供芯片出口到中国。美国官员告诉 AMD公司,这款 MI309 AI 芯片性能仍然太强大、强于限制要求,该公司必须获得商务部工业和安全局(BIS)的许可才能出售该芯片。
3月6日
AI明星企业Perplexity估值达10亿美元
旨在挑战谷歌网络搜索主导地位的AI初创公司Perplexity即将敲定一笔新的融资交易,公司估值有望达到近10亿美元,较几个月前的最新融资估值大约翻番。
3月8日
意大利对Sora技术展开调查
意大利对OpenAI的新视频工具Sora展开调查。监管机构Garante要求OpenAI澄清其向用户和非用户告知其产品Sora使用的数据的方式是否符合欧盟法规。
3月9日
2032年AIGC规模高达1.3万亿美元
彭博最新报告认为,到2032年,生成式AI市场规模有望增长至1.3万亿美元,年复合增速达43%。
奥特曼重回OpenAI董事会
美国OpenAI公司发推文宣布,经过数月的调查,关于OpenAI联合创始人、CEO奥特曼被罢免事件得出最终结论,奥特曼在去年并未有不当行为,董事会解雇他是毫无根据的。因此,奥特曼将继续担任公司CEO、董事职务。
3月10日
ChatGPT被曝每日耗电超50万度
据报道,OpenAI的热门聊天机器人ChatGPT每天可能要消耗超过50万千瓦时的电力,以响应用户约2亿个请求。相比之下,美国家庭平均每天使用约29千瓦时电力,也就是说,ChatGPT每天用电量是家庭用电量的1.7万多倍。如果生成式AI被进一步采用,耗电量可能会更多。
3月13日
欧洲议会通过《人工智能法案》
欧洲议会3月13日以523票赞成、46票反对、49票弃权通过了具有里程碑意义的《人工智能法案》。该法案将禁止某些“威胁公民权利”的AI应用,包括基于敏感特征的生物识别分类系统,以及从互联网或闭路电视录像中无目标地抓取面部图像以创建面部识别数据库。操纵人类行为或利用人类弱点的AI也将被禁止。
全球首个AI程序员Devin诞生
初创公司Cognition AI推出全球首个AI程序员Devin,其最大突破在于大大提升计算机推理和规划能力。据了解,Devin掌握自学新技术、构建和部署应用程序、自主查找并修复Bug、训练和微调自己的AI模型等多项能力。
Figure首发OpenAI大模型加持的机器人
机器人初创公司Figure发布了自己第一个OpenAI大模型加持的机器人Figure 01 的演示。虽然只用到了一个神经网络,但却可以听从人类的命令,递给人类苹果、将黑色塑料袋收拾进框子里、将杯子和盘子归置放在沥水架上。视频显示,机器人整套操作的动作十分流畅。
3月14日
OpenAI称Sora于年内向公众推出
OpenAI首席技术官Mira Murati日前表示,Sora将于今年晚些时候正式向公众推出,“可能需要几个月”。OpenAI将在Sora中支持配备音效,并允许用户编辑Sora生成的视频内容。
Together AI估值12.5亿美元
Nvidia支持的生成式AI初创公司Together AI在新一轮融资中以12.5亿美元的估值筹集了1.06亿美元,本轮融资由Salesforce Ventures领投。Together AI公司成立于2022年,是一个开源平台,开发者可以用它来构建或定制自己的AI模型。
OpenAI将推出法语、西班牙语ChatGPT版本
OpenAI宣布,已与两家主要欧洲出版商、法国报纸 Le Monde 和西班牙集团 Promotora de Informaciones SA 或 Prisa 签署了许可协议,将把法语和西班牙语新闻内容引入 ChatGPT 并帮助训练OpenAI模型。
3月16日
消息称苹果已收购加拿大初创公司DarwinAI
苹果公司于今年早些时候收购了加拿大AI初创公司DarwinAI,DarwinAI的数十名员工已加入苹果的AI部门。
苹果推出300亿参数MM1多模态大模型
在一篇由多位作者署名的论文《MM1: Methods, Analysis & Insights from Multimodal LLM Pre-training》中,苹果正式公布自家的多模态大模型研究成果。这是一个具有高达300亿的多模态LLM系列,它由密集模型和混合专家(MoE)变体组成,不仅在预训练指标中实现最优水平,在一系列已有多模态基准上监督微调后也能保持有竞争力的性能。
3月18日
英伟达推出最强AI芯片B200
在美国加州圣何塞举办的英伟达GTC生态大会上,英伟达CEO黄仁勋宣布推出新一代GPU Blackwell,第一代Blackwell芯片名为GB200,将于今年晚些时候上市。Blackwell拥有2080亿个晶体管,采用台积电4nm制程。前一代GPU“Hopper”H100采用4nm工艺,集成晶体管800亿。
马斯克旗下xAI Grok-1模型宣布开源
马斯克旗下 AI 初创公司 xAI 宣布,其研发的大模型Grok-1正式对外开源开放,用户可直接通过磁链下载基本模型权重和网络架构信息。
3月20日
消息称OpenAI计划在今年年中推出GPT-5
相关报道援引匿名知情人士的消息称,OpenAI公司正计划筹备在今年年中推出GPT-5,预计时间是夏季。
3月21日
Stable Diffusion核心团队被曝集体离职
Stable Diffusion核心研究团队已集体辞职,名单包括研究团队领导、论文一作Robin Rombach,共同一作Andreas Blattmann,以及另一位作者Dominik Lorenz。知情人士爆料称,Stability AI正因入不敷出且融不到新资金而陷入困境。
月之暗面kimi智能助手宕机
经测试,月之暗面旗下大模型应用kimi的APP和小程序均无法正常使用。此前,月之暗面发布情况说明:从3月20日9:30开始,观测到Kimi的系统流量持续异常增高,流量增加的趋势远超其对资源的预期规划。这导致了从当天10:00开始,有较多的SaaS客户持续的体验到 429:engine is overloaded 的异常问题。
3月22日
Suno v3模型几秒钟生成完整歌曲
AI音乐创作创企Suno AI推出AI音乐生成模型Suno v3。这是首个能生成广播级品质音乐的模型,可在几秒钟内创建2分钟的完整歌曲。v4已在开发中。
百度或将为苹果最新国行手机提供AI功能
从知情人士处获悉,百度将为苹果今年发布的iPhone16、Mac系统和iOS 18提供AI功能。苹果曾与阿里以及另外一家国产大模型公司进行过洽谈,最后确定由百度提供这项服务。苹果预计采取API接口的方式计费。
3月25日
HeyGen正在募集6000万美元规模的新一轮融资,四个月内估值增长6倍
HeyGen正在募集6000万美元规模的新一轮融资,公司投前估值达到4.4亿美元,较4个月前的估值水平增长了6倍。据悉,曾投资Uber等公司的早期投资机构Benchmark,将领投HeyGen该轮融资。
3月26日
加拿大将加强对华 AI 等领域的外资审查
加拿大工业部长日前表示,据最新修订的《加拿大投资法》规定,非加拿大公司在投资或收购 AI 、量子计算等关键技术领域的加拿大实体之前,必须提前向政府发出通知。报道直指,加拿大政府的这一新措施,就是为了效仿美国,共同遏制中国资本的收购措施。
3月27日
OpenAI有望与好莱坞合作以变革电影行业
OpenAI近期正在好莱坞举办各种推广活动,希望能向电影制片厂、艺人经纪公司和高管展示名为Sora的最新款AI文字生成视频大模型的巨大潜力。有分析认为,这有可能是“好莱坞历史上意义最为重大的行业会议”,对全球电影工业的发展,或许会产生划时代的巨大影响。
1320亿开源大模型DBRX上线
Databricks 推出了一款通用大语言模型 DBRX,号称是“目前最强开源 AI”,据称在各种基准测试中都超越了“市面上所有的开源模型”。
3月28日
亚马逊向Anthropic追加27.5亿美元投资
亚马逊向AI初创公司Anthropic追加27.5亿美元投资,这是亚马逊迄今为止最大的一笔风险投资,加上去年12.5亿美元的投资,对Anthropic的总计投资规模达到40亿美元。
谷歌和斯坦福大学推出 AI 核查工具
谷歌DeepMind的研究团队发布了一项新研究,介绍了一种名为“Search-Augmented Factuality Evaluator (SAFE)”的AI系统。该系统利用大型语言模型将生成的文本分解成个别事实,并利用谷歌搜索结果来确定每个声明的准确性。
3月30日
微软和OpenAI拟投资1000亿美元造AI超算
微软和OpenAI计划投资1000亿美元建造“星际之门”(Stargate)AI超级计算机。OpenAI的下一版重大AI升级预计将在明年初落地。微软高管希望最早在2028年发布“星际之门”(Stargate)AI超级计算机。此外,微软和OpenAI计划为AI开发数据中心项目。
OpenAI 15秒复制原音的语音模型Voice Engine发布
OpenAI在官网首次展示了全新自定义音频模型“Voice Engine”。 用户只需要提供15秒左右的参考声音,通过Voice Engine就能生成几乎和原音一模一样的全新音频,在清晰度、语音连贯、音色、自然度等方面比市面上多数产品都强很多。
3月31日
美国打算禁用微软AI Copilot
美国众议院已严格禁止国会工作人员使用微软AI聊天机器人Copilot。网络安全办公室认为Copilot应用程序对用户构成风险,因为它可能会将众议院数据泄露给非众议院批准的云服务。
华人团队开发“人脸机器人”,照镜子自主模仿人类表情
哥伦比亚大学工程学院的华人研究团队近日发布了一款创新性的机器人—— Emo,该机器人具备预测并模仿人类面部表情的能力,还可以进行眼神交流。Emo的独特之处在于其自我监督学习框架,这一框架的运作原理类似于人类通过照镜子来练习面部表情。
(本文首发钛媒体App,作者|章橙,编辑|林志佳)