当前位置:首页|资讯|Sora|编程|马斯克|微软

字节年终奖发放大赏;复现类Sora代码,全细节开源;网友透析马斯克开源Grok

作者:51CTO发布时间:2024-03-30

原标题:字节年终奖发放大赏;复现类Sora代码,全细节开源;网友透析马斯克开源Grok

商业圈

盒马、大润发辟谣被阿里出售给中粮:假的

近日有消息传出称阿里巴巴将把大润发和盒马出售给中粮集团。对此,盒马和大润发的负责人在个人社交平台上进行辟谣,称这一消息为假。

此前,网络上曾出现许多关于盒马关闭门店、无人送货等消息,并引发热议。对此,盒马官方回应表示,这些报道只是因为物业合同到期和个别商场经营不善等原因导致的关闭现象,并计划今年上半年关闭6-7家门店,同时寻找更好的物业以满足消费者需求。

此外,盒马还强调了其开店计划,表示今年计划新开70家门店,并且已经有超过360家门店正常运营。

英伟达GTC大会看点:B100,多款AI+机器人系列应用

据悉,英伟达GTC大会将于3月18日至21日期间,在圣何塞会议中心和线上同时举行。这是英伟达每年最重要的技术发布平台之一,被业界公认为“AI风向标”。

对此,浙商证券分析师刘雯蜀、李佩京在最新发布的报告中表示,英伟达有望在大会上发布Blackwell架构及B100芯片,硬件系列将全面升级。英伟达的机器人系列应用也有望迎来迭代。此外,英伟达还将发布一系列生成式AI应用,而这或成为其新增长点。

乔任梁父亲喊话:撕下AI复活明星伪善面具

AI“复活”死者成为新的流量密码。利用AI生成技术,通过深度学习以及图像、语音合成技术,已故明星的数字化复制品可以轻易地上传至网络并博得大量关注。然而,这种行为对逝者亲人已是一种冒犯和伤害。

近日,高以翔家人和乔任梁父亲相继喊话,要求下架相关的AI生成视频。正如乔任梁父亲所说,未经允许的AI“复活”,无异于“揭伤疤”,会让亲人再一次陷入悲伤的旋涡。

技术是把双刃剑,必须要在合乎道德和伦理的规范下使用。更不能打着缅怀的幌子,靠吃逝者的人血馒头来娱乐和引流。同时,有律师提醒,这类行为可能涉及侵权,并提醒公众注意相关的法律风险。

OpenAI CTO:不确定是否使用了社交媒体数据训练Sora

OpenAI首席技术官Mira近日在接受采访时,被问及OpenAI使用了什么数据来训练其视频生成模型Sora,以及是否使用了来自多个社交媒体平台的数据。

Mra表示,她并不确定OpenAI是否使用了社交媒体平台的数据。她强调OpenAI使用的是“公开可用的数据或得到许可的数据”,但她拒绝介绍更多细节。

产业圈

字节跳动年终开奖:m、e绩效持平

据公众号“大厂日爆”消息,TikTok、生服等部门从上周开始,陆续开始绩效+年终系数沟通,根据目前情况看:

绩效m:主流3个月,多的3.5个月,少数个例4个月

绩效m+:主流4个月,多的4.5个月,少数个例5个月

绩效e:6个月起,普遍7个月,多的8-10个月,少数个例10月以上

绩效m-:1-2个月;绩效i:0-1个月

如果是产品,m:6个月,m+:7-9个月,e可能10个月以上

总体而言:今年年终奖整体满足预期,m、e可能持平,部分m+相比去年可能打八折(以上不考虑0.839的时间系数,实际到手再打八折)

BOSS直聘向41名员工授予215万股奖励

据公告,BOSS直聘于2024年3月15日,根据首次公开发售后股份计划,向41名员工授予了总计215.55万份受限制股份单位,每份代表一股A类普通股。这些股份奖励将在授予日期的第一、第二、第三及第四周年分期等额归属,前提是承授人需保持与公司的持续服务关系。

此次股份奖励的授予并不受任何绩效目标的限制。存在一种回拨机制,即在特定情况下,如承授人终止服务关系、涉及诚信或诚实的刑事罪行被定罪,或严重行为不当等,公司有权收回已授予的股份。

BOSS直聘表示,此次授出股份奖励的目的在于奖励那些为公司发展做出不懈努力的员工,并以此提升公司及其股份的价值。通过这种方式,公司希望能够激励员工继续为公司的发展贡献力量。

“Apple ID”将成历史,传苹果将在 iOS 18 中更改新名称

科技网站MacRumors曾爆料苹果计划将“Apple ID”更名为“Apple Account”,此消息得到彭博社记者Mark Gurman确认。Gurman表示,新名称将于今年晚些时候在网络端和重大软件更新中启用,如iOS 18和watchOS 11。苹果已使用“苹果账户余额”称谓,内部存在“Apple Account”团队。预计“Apple ID”这一20年术语将逐渐被淘汰。更名原因尚不明,但“Apple Account”更易于理解。

马斯克将Grok开源,网友第一时间解析:314B,几乎最大的开源模型

3月18日,马斯克的AI创企xAI正式发布了此前备受期待大模型Grok-1,其参数量达到了3140亿,远超OpenAI GPT-3.5的1750亿,遵照Apache 2.0协议开放模型权重和架构。

截止发稿前已获得6.8k星。网友们:唯一的问题是Grok的性能不如其他AI模型。但可用的开源模型越多越好。

具体配置参数信息如下:

基础信息:314B 的模型,由 8 专家组成(2 活跃状态)86B 活跃参数,使用Rotary Embeddings

词汇量:131,072 个,与 GPT-4 持平,实际上是 2 的 17 次方

词嵌入维度:6,144(由 48 乘以 128 计算得来)

Transformer 层:64

Key value size : 128

上下文长度: 8192 个令牌,计算精度采用 bf16 格式。这里使用了 8 bit 量化。

旋转位置嵌入的维度为 6144,这与模型输入嵌入的维度一致。

遵循 Apache 2.0,即——

可商用:用户可以自由地将软件用于商业目的,不必支付许可费。

可修改和分发:用户可以修改源代码,并且可以在修改后的软件上施加同样的许可证进行再分发。

专利授权:该许可证自动授予软件用户任何专利权利,这意味着贡献者不能对软件用户提起专利诉讼。

保留版权和许可声明:在分发软件或其修改版本时,必须保留原有的版权声明和许可证声明。

不承担责任:提供一定的保障,但软件作者或贡献者不必为软件可能引起的任何损失承担责任。

一加Ace3V确定3月21日发布,首发多项 AI 功能

据一加官方消息,一加将会在3月21日19点举办新品发布会,发布一加 Ace3V 手机。

据悉,一加 Ace3V 手机将全球首发第三代骁龙 7+ 芯片,并全球首发多项全新 AI 功能。此外一加 Ace3V 手机将配有双电芯5500mAh 电池。一加中国区总裁李杰表示,一加 Ace 3V 也将成为年轻人的第一台 AI 手机。

技术圈

Open-Sora1.0发布:复现类Sora视频,所有训练细节均已开源

潞晨科技Colossal-AI 团队全面开源全球首个类 Sora 架构视频生成模型 「Open-Sora 1.0」,涵盖了整个训练流程,包括数据处理、所有训练细节和模型权重。

  • Open-Sora-v1 已发布。这里提供了模型权重。只需 400K 视频片段和在单卡 H800 上训200天(类比Stable Video Diffusion 的 152M 样本),我们就能生成 2 秒的 512×512 视频。
  • 从图像扩散模型到视频扩散模型的三阶段训练。每个阶段的权重已开放。
  • 支持训练加速,包括Transformer加速、更快的 T5 和 VAE 以及序列并行。在对 64x512x512 视频进行训练时,Open-Sora 可将训练速度提高55%。

同时,Github上还提供了该模型生成的逼真视频,感兴趣的朋友可移步:https://github.com/hpcaitech/Open-Sora/

ChatGPT 参数规模很可能只有 7B(70 亿)

南加州大学最新研究,ChatGPT 参数规模很可能只有 7B(70 亿)。南加大团队三位作者破解出了未公布的 gpt-3.5-turbo 嵌入向量维度(embedding size)为 4096 或 4608。而几乎所有已知的开源大模型如 Llama 和 Mistral,嵌入向量维度 4096 的时候都是约 7B 参数规模。其它比例的话,就会造成网络过宽或过窄,已被证明对模型性能不利。

因此南加大团队指出,可以推测 gpt-3.5-turbo 的参数规模也在 7B 左右,除非是 MoE 架构可能不同。数月前,曾有微软 CODEFUSION 论文意外泄露当时 GPT-3.5 模型参数为 20B,在后续论文版本中又删除了这一信息。(开源中国)

零一万物开放笛卡尔向量数据库搜索内核 Binary下载,免费商用

零一万物宣布决定全面开放笛卡尔向量数据库搜索内核,并免费商用。零一万物的笛卡尔向量数据库定位专注于大模型场景,能够执行超高精度、超快速度的检索,辅助大模型在 RAG、Agent 等方面达到更佳的性能从而提升整体效果。

零一万物向量检索技术全自研,从0开始研发,拥有完整且独立的知识产权。值得一提的是,负责该项技术的 Infra 团队成员从2013年开始进入向量引擎的研究,主导过多个头部大厂的向量检索技术,做出的向量检索技术服务过数千万级别DAU的产品应用。

链接:https://github.com/01-ai/Descartes

苹果“狂追”AI,首次发布多模态语言模型

近日,苹果在arxiv.org上发布MM1模型的论文(超半数作者是华人),“MM1:多模态LLM预训练的方法、分析与洞见”。它强调了结合多样化的训练数据和模型架构的重要性,以在多个AI基准测试中实现顶级性能。MM1模型在包括视觉和语言信息的多样化数据集上接受了训练,在图像字幕、视觉问答和自然语言推理等任务上表现出色。

MM1的关键发现之一是图像编码器和输入图像的分辨率对模型性能有重大影响,这表明提升视觉组件是未来改进的关键。最大的MM1模型拥有300亿个参数,展示了强大的上下文学习能力,这表明大型多模态模型能够解决需要语言理解和生成能力的复杂问题。

这一发展正值苹果加大AI投资之际,目的是要与谷歌、微软和亚马逊等竞争对手保持同步。据报道,苹果正在开发一个名为“Ajax”的语言模型框架和一个内部称为“Apple GPT”的聊天机器人,计划将这些技术整合到Siri、信息、苹果音乐和其他服务中。预计苹果将在6月的全球开发者大会上将揭示新的AI功能。

Fermyon:一个Kubernetes节点上运行超过5000个WebAssembly应用程序

Fermyon推出SpinKube,用于Kubernetes上开发和部署WebAssembly应用,同时推出适用于Kubernetes的Fermyon平台,该平台支持高密度部署。Spin框架支持多种语言编写WebAssembly应用,现已适配Kubernetes。

SpinKube是开源项目,包含Kubernetes操作符、Containerd Shim和运行时类管理器。Fermyon平台是无服务器平台,可大幅提升Kubernetes的pod运行数量。此外,还有针对Spin的Kubernetes插件。该项目得到Fermyon、Microsoft Deis Labs和SUSE等支持。

新版macOS 会导致Java意外终止,甲骨文建议暂缓更新

甲骨文公司称,macOS Sonoma 14.4版本存在漏洞,导致Java程序意外终止,建议Mac用户暂缓更新。此漏洞影响Java版本8以上及JDK 22抢先体验版,暂无临时解决办法。高级管理总监指出测试版未发现此问题,但创建新镜像或受影响。已通知相关方,Apple Silicon Mac用户需等待苹果修复。因Java被苹果标记为过时技术,此问题对普通用户影响有限。


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1