苹果或采用OpenAI大模型；国产类Sora复现方案开源；国内首个AI导演上岗；丨AIGC大事日报

作者：智东西发布时间：2024-03-26

苹果 OpenAI Sora ChatGLM

1、马斯克Grok大模型开源参数量3410亿

2、苹果谷歌和OpenAI商谈iPhone大模型使用

3、苹果新研究提升服务大模型效率

4、Open-Sora视频生成模型开源

5、AI程序员代码能力超Claude 2

6、月之暗面智能助手支持200万字上下文

7、斯坦福新研究提升大模型长视频理解能力

8、高通手机芯片支持100亿参数大模型

9、国内首个AI导演上岗

10、赛迪四川发布中国AI大模型20强报告

11、OpenAI CTO说不知道Sora训练数据出处

12、阿联酋AI投资公司考虑支持OpenAI万亿芯片计划

1、马斯克Grok大模型开源参数量3410亿

今天，马斯克的AI创企xAI正式发布了大模型Grok-1，其参数量达到了3140亿，超过OpenAI GPT-3.5的1750亿。这是迄今参数量最大的开源大语言模型，遵照Apache 2.0协议开放模型权重和架构。Grok-1是一个混合专家（Mixture-of-Experts，MoE）大模型。xAI称这是他们自己从头训练的大模型，Grok-1没有针对特定应用进行微调。

2、苹果谷歌和OpenAI商谈iPhone大模型使用

今天，据彭博社报道，有知情人士称，苹果公司正在与谷歌进行谈判，希望将谷歌的Gemini大模型能力应用在iPhone中，以支持今年iPhone即将增加的各类生成式AI功能。彭博社记者马克·古尔曼认为，这将是一项重大的协议，可能会撼动整个AI行业。该报道还提到，苹果最近与OpenAI进行了讨论，考虑使用其大模型。

3、苹果新研究提升服务大模型效率

3月14日，苹果研究人员发布论文，推出了一种用于大型语言模型中快速推测解码的Recurrent Drafter，这种改进后的推测解码方法可以提高服务大型语言模型的效率。Recurrent Drafter利用了双模型推测解码方法和单模型方法Medusa。研究人员通过实验证明了这种方法在几个主流开源大型语言模型上的有效性。

论文地址：

https://arxiv.org/pdf/2403.09919.pdf

HuggingFace地址：

https://huggingface.co/papers/2403.09919

4、Open-Sora视频生成模型开源

3月18日凌晨，潞晨科技创始人尤洋教授在X平台发文，潞晨科技旗下Colossal-AI团队开源了其Open-Sora 1.0视频生成模型，包括模型权重、训练源代码和详细的架构。该模型采用了Diffusion Transformer（DiT）架构。据了解，团队以使用了DiT架构的开源文生图模型PixArt-α为基础，引入了时间注意力层，并将其扩展到了视频数据上。

GitHub地址：

https://github.com/hpcaitech/Open-Sora

5、AI程序员代码能力超Claude 2

3月15日，AI创企Cognition对其团队发布的首个AI软件工程师Devin进行了技术解读，发布了关于Devin的SWE-bench基准测试技术报告。SWE-bench可以评估系统解决现实中代码库问题的能力。测试结果显示，Devin不需要人类辅助就可以解决570个问题中的79个问题，成功率为13.86%，高于SOTA 大模型（Claude 2）的4.80%。

GitHub地址：

https://github.com/CognitionAI/devin-swebench-results

6、月之暗面智能助手支持200万字上下文

今天，AI创企月之暗面（Moonshot AI）宣布其智能助手Kimi在长上下文窗口技术上取得突破，无损上下文长度提升至200万字。今天起，支持200万字上下文的Kimi已启动内测。据称，基于新版Kimi，用户上传几十万字的经典德州扑克长篇教程后，Kimi可以扮演德扑专家为用户提供出牌策略的指导。

7、斯坦福新研究提升大模型长视频理解能力

3月15日，斯坦福研究人员发布论文，推出了一种基于代理（Agent）的系统——VideoAgent，其将大型语言模型作为中央代理，迭代地识别和编译关键信息以回答问题，同时利用视觉语言基础模型作为翻译和检索视觉信息的工具。在EgoSchema和NExT-QA基准测试中，VideoAgent在零样本准确率上分别达到了54.1%和71.3%，平均仅使用了8.4和8.2帧。研究人员称，该测试结果表明该方法在效果和效率上优于当前最先进的方法，在提升长篇视频理解方面有应用潜力。

论文地址：

https://arxiv.org/pdf/2403.10517.pdf

GitHub地址：

https://wxh1996.github.io/VideoAgent-Website/

8、高通手机芯片支持100亿参数大模型

今天，高通正式发布了第三代骁龙8s芯片，其在端侧生成式AI能力方面进行了重点升级，支持Baichuan-7B、Gemini Nano、Llama 2和智谱ChatGLM等30多个大型语言模型和大型视觉模型，据称最高支持模型参数量为100亿。

9、国内首个AI导演上岗

据上海证券报报道，3月15日，湖南广电集团首个AI导演爱芒（英文名AIM）正式以助理导演的身份和观众、网友们见面。这也是国内首个正式上岗的AI导演。3月17日午间，该综艺超前企划播出，爱芒正式亮相。《声生不息》系列制片人洪啸说：“AI导演会倒逼着我们不断地去创新。”

10、赛迪四川发布中国AI大模型20强报告

智东西3月17日消息，3月15上午，赛迪工业和信息化研究院（集团）四川有限公司发布了《2024中国人工智能多模态大模型企业综合竞争力20强研究报告》，腾讯混元大模型排名第一、科大讯飞星火大模型排名第二、阿里巴巴通义千问排名第三、华为盘古大模型排名第四、智谱华章智普清言排名第五。

据称此次评价研究通过建立覆盖经济、技术、行业、商业等多维度指标的企业竞争力评价模型，对我国人工智能自研多模态大模型企业实力进行综合评估，最终形成人工智能多模态大模型企业综合竞争力20强评价结果。其评价体系包括经济抗衡力（15%）、行业影响力（30%）、技术竞争力（40%）、商业角逐力（15%）。

11、OpenAI CTO说不知道Sora训练数据出处

智东西3月17日消息，3月14日，《华尔街日报》记者Joanna Stern采访了OpenAI首席技术官Mira Murati，针对一段Sora生成的虚拟视频进行了讨论，Mira Murati解释了Sora的工作原理，但是回避了大部分有关该模型训练数据来源的问题，甚至在回答中出现了“我其实不太确定（I’m actually not sure about that）”的说法。

12、阿联酋AI投资公司考虑支持OpenAI万亿芯片计划

智东西3月17日消息，据英国《金融时报》报道，阿联酋阿布扎比一家由国家资助的投资公司MGX正在和OpenAI谈判，讨论支持此前由OpenAI CEO Sam Altman提出的“万亿芯片计划”。报道称，MGX 是一家今年1月刚刚成立的专注于AI的投资公司，代表了阿联酋希望在全球AI竞赛中实现领先的关键布局。

苹果或采用OpenAI大模型；国产类Sora复现方案开源；国内首个AI导演上岗；丨AIGC大事日报

推荐体验

相关资讯

Sora复现！全球首个类Sora模型开源！文生视频最火方案公开！

全球首个类Sora开源复现方案来了，全面公开所有训练细节和模型权重

Open Sora 发布！开源的高效复现类 Sora 视频生成方案

Midjourney中文版内测；OpenAI将开源新模型丨AIGC大事日报

苹果发布Transformer AI键盘；大模型AI芯片创企获新融资丨AIGC大事日报

近期资讯

变出无限可能人手一个的“随申码”还能这么用

荷兰皇家航空一波音客机因液压故障改道降落时冲出跑道

AI投资大爆发的一年！盘点2024年融资千万美元以上的50家美国AI初创公司

荣耀首席影像工程师罗巍展示手机“200X”变焦内部仿真效果

“AI教父”辛顿：30年内AI致人类灭亡几率达10%~20%

美国四大厂出手核电：微软重启三里岛，谷歌牵手核新秀，亚马逊将投5亿美元，Meta已发核电征集令

Jimenez JA-Nine紧凑型9毫米半自动专为隐蔽携带和自卫设计

腾讯新闻独家对话李想完整版：不想当车企CEO，AI是理想未来的全部

韩国失事客机最终确认 179 人遇难，仅 2 人幸存

跨年演讲赛道再次拥挤：雷军、张朝阳，还有他们

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响