腾讯研究院AI速递 20240904

作者：腾讯研究院发布时间：2024-09-04

生成式AI

一、马斯克AI超级计算机再升级！再加10万张，一半H200

1. 马斯克的AI超级计算机Colossus已使用10万张H100 GPU，计划再增加10万张，包括5万张更先进的H200;

2. Colossus采用单一RDMA架构，所有GPU通过高速、低延迟网络连接，提高了协同工作效率;

3. 从建设到上线仅用122天，Colossus将用于训练包括自动驾驶在内的多种AI模型，对其他AI公司构成压力.

https://mp.weixin.qq.com/s/kA_ac9lsJM1uZEpKA_Priw

二、 OpenAI首颗芯片曝光：台积电1.6nm，为Sora应用打造

1. OpenAI首颗芯片采用台积电1.6纳米技术，专为AI视频生成工具Sora定制;

2. A16制程技术提供显著性能提升，包括8-10%的速度提升和15-20%的功耗降低;

3. OpenAI计划减少对外购AI芯片的依赖，尽管面临产能和技术挑战，但已开始自研芯片的初步步骤.

https://mp.weixin.qq.com/s/E1MC2gi86iqhDK3iWUgn7Q

三、无问芯穹融资5个亿，国内AI基础设施的最大单笔融资

1. 无问芯穹完成近5亿元融资，累计融资近10亿元，成为上海新兴的独角兽企业;

2. 投资方包括社保基金中关村自主创新专项基金、启明创投、洪泰基金等，其在AI基础设施领域得到强大支持和信任;

3. 由清华大学电子工程系汪玉教授领衔，专注于大模型软硬件一体化方案，推动AI基础设施的本土化和创新发展.

https://mp.weixin.qq.com/s/M4xpmNejPO2zNce3sv0mYg

四、噩耗！SD3、FLUX.1等开源文生图模型，可能将无法使用

1. AB-3211法案要求文生图模型嵌入详细、不可移除的元数据，用于识别AI生成图像并提供生成细节;

2. 法案对开源模型影响较大，主要为高成本的技术和法律要求，如来源数据嵌入、对抗性测试，增加开发者负担;

3. 大型科技公司支持法案，可能加剧开源与闭源模型间的不平等，对小型开发者和学术机构构成挑战.

https://mp.weixin.qq.com/s/Iz3oDiiMLrnIfihgUpzKuw

五、阶跃星辰图像生成大模型Step-1X，正式上线了！国风意境

1. 阶跃星辰推出图像生成大模型Step-1X，专注于生成具有深度语义对齐和细节表现的图像，特别优化了对中国文化元素的处理;

2. Step-1X支持长达2000字符的图片生成指令，适用于多种创作场景如广告、游戏美术和教育辅助;

3. 官方公布两个隐藏玩法提升生成效果，包括特定咒语增强写实程度和使用智能助手「跃问」完善Prompt.

https://mp.weixin.qq.com/s/bX9Ty1w8krNLK79dBzSlGw

六、李飞飞提出ReKep，实现具备空间智能，还能整合GPT-4o

1. 李飞飞团队提出ReKep框架，通过关系关键点约束实现机器人的空间智能，优化机器人与环境的复杂交互;

2. ReKep能与GPT-4o等多模态大模型整合，提高任务执行的精确性和适应性;

3. ReKep实现了多阶段任务的分解和优化，通过约束优化问题定义机器人操作任务，增强执行策略的泛化能力.

https://mp.weixin.qq.com/s/AdyOPA6RhFIu5sjra5cW2Q

七、专注游戏开发、性能测试、游戏体验，VideoGameBunny

1. VideoGameBunny (VGB) 是一款专为游戏环境设计的视觉AI助理，能够理解游戏场景并提供实时反馈，帮助玩家识别关键物品和解答问题;

2. VGB采用多层感知器网络，结合强预训练的视觉和语言模型，支持高达1152×1152像素的图像分辨率，有效捕捉游戏中的多尺度视觉元素;

3. 模型使用LoRA微调方法和PEFT库优化训练效率，处理超过185,000张游戏图像和39万个图像-指令对，生成详细的JSON格式数据以增强游戏体验和开发效率.

https://mp.weixin.qq.com/s/gS_8LZShO2eaSbJdvgV0HA

八、 8岁小孩哥用AI制作游戏，全程2小时，50多万人围观

1. 8岁孩子使用Claude AI和Cursor工具独立创建了多个项目，包括游戏和应用程序，每个项目耗时约2小时;

2. 孩子的父亲Meng To仅提供了技术设置支持，孩子利用AI工具自学完成项目，展示了AI编程工具的易用性和教育潜力;

3. 该事件引发了广泛关注和讨论，突显了AI工具如Cursor在降低编程门槛和提升开发效率方面的潜力.

https://mp.weixin.qq.com/s/Ked4SBTzsz5mnoF-kQz96Q

前沿科技

九、迈向「多面手」医疗大模型，上交大发布医疗大规模构建流程

1. 上海交通大学团队开发了MedS-Bench评估基准和MedS-Ins指令微调数据集，全面提升医疗大模型在临床任务中的应用能力;

2. MedS-Bench包括11类高级临床任务，超越传统的多项选择问答，更全面评估模型在实际医疗场景中的表现;

3. MedS-Ins数据集整合了多源医学文本，覆盖122个临床任务，用于训练医学大模型，提高其在复杂临床任务中的性能.

https://mp.weixin.qq.com/s/Z-l6I8v0q-pKx2JgAmOKBA

报告观点

十、张宏江在青腾全球私访：我对于AI和大模型的八点观察和看法

1. 张宏江认为大模型是新一代操作系统，将重塑软件生态，尤其是To B软件公司正在利用AI重写软件;

2. 提出大模型的核心是尺度定律，强调了从CPU到GPU为中心的计算重心转移，以及大模型在处理大规模数据时的效率问题;

3. 强调多模态大模型是实现通用人工智能（AGI）的关键，预测未来机器人将具备更广泛的思考和行动能力，推动自主智能的发展.

https://mp.weixin.qq.com/s/IG59wdNVZBfHipAa5uvSfQ

👇订阅下方合集，获取每日推送

近期资讯

通过批准，AirPods Pro 2成美国首款非处方助听器软件设备

FDA批准了启用该功能的软件更新。

智东西 2024-09-14

一线城市打工人的一日三餐，正在被县城餐饮品牌承包

县城餐饮品牌以性价比优势快速扩张至一线城市

红餐网 2024-09-14

逆势开店，还是关店止损？答案就在这五大核心问题中

究竟要如何开店?

奥纬咨询 2024-09-14

100亿，今年最大的险资LP投给深圳

险资大手笔下场

融资中国 2024-09-14

为了翻身，莉莉丝请出了“列祖列宗”

莉莉丝把曾经的明星产品，在2022年后进行了一比一复刻。

眸娱 2024-09-14

“剧后”荣耀加身，但优酷未到庆功时

有点猛，有点“疯”。

文娱先声 2024-09-14

中国太保产寿险业务分化，“三哥”地位争夺战打响

银保新保业务承压

全球财说 2024-09-14

暴跌42%，宝马，突然卖不动了

突然暴雷！年内暴跌36%，宝马股价，扛不住了！

侃见财经 2024-09-14

传OpenAI正谋求以1500亿美元估值融资70亿，阿联酋主权基金加入洽谈

OpenAI正与阿联酋投资基金洽谈70亿美元融资。

智东西 2024-09-14

无锡90亿母基金来了

江苏爆发缩影。

投资界 2024-09-14

腾讯研究院AI速递 20240904

推荐体验

相关资讯

腾讯研究院AI速递 20240304

近期资讯

通过批准，AirPods Pro 2成美国首款非处方助听器软件设备

一线城市打工人的一日三餐，正在被县城餐饮品牌承包

逆势开店，还是关店止损？答案就在这五大核心问题中

100亿，今年最大的险资LP投给深圳

为了翻身，莉莉丝请出了“列祖列宗”

“剧后”荣耀加身，但优酷未到庆功时

中国太保产寿险业务分化，“三哥”地位争夺战打响

暴跌42%，宝马，突然卖不动了

传OpenAI正谋求以1500亿美元估值融资70亿，阿联酋主权基金加入洽谈

无锡90亿母基金来了

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响