腾讯研究院AI速递 20240815

作者：腾讯研究院发布时间：2024-08-15

腾讯英伟达生成式AI 人工智能 AGI

生成式AI

一、超级AI诞生？史上最强超算9月上线，英伟达最强芯片加持

1. SingularityNET公司的新型超级计算机将于9月上线，配备英伟达最强GPU，旨在推动人类级别的人工智能（AGI）发展；

2. 超算采用多层次认知计算网，包括深度神经网络、大型语言模型（LLM）和多模态系统，支持复杂AI系统训练；

3. 超算网络使用先进硬件如NVIDIA L40S GPU和AMD处理器，结合新型神经-符号AI方法，减少资源需求，提高计算效率。

https://mp.weixin.qq.com/s/SrSdRY1_M-eOGsFIJuTTvQ

二、马斯克突然发布 Grok 2大模型，能解「9.8 和 9.11 哪个大」

1. Grok-2, 新一代大模型，已在性能上与GPT-4o相媲美，特别在编码、复杂问题解决及数学方面表现出色；

2. 模型包括Grok-2和Grok-2 mini两个版本，均已在X平台上向用户发布，展示了显著的进步和多模态理解能力；

3. xAI计划通过新的企业API平台发布Grok-2，强化安全功能，并通过新计算集群提升模型核心推理能力。

https://mp.weixin.qq.com/s/nBaY2srcMSzvEoecOyh1Cg

三、谷歌版Her，抢先OpenAI登场，高级语音模型Gemini Live

1. 谷歌推出Gemini Live语音模型，将在全球30亿安卓和22亿iOS设备上线，提供自然对话体验和多种声音选择；

2. Gemini深度集成安卓和Pixel设备，支持跨应用程序操作和上下文感知功能，提高用户交互便利性；

3. Gemini Live面临技术挑战，包括安全问题和实时演示中的技术故障，但谷歌决定快速推进以竞争市场领先地位。

https://mp.weixin.qq.com/s/mR5XpquGCcd6HNrptBnw0Q

四、最强智能体Agent Q发布！Llama 3零样本成功率提升340%

1. Agent Q是一个自监督智能体，能通过互联网任务进行自我对弈和强化学习，具备推理、规划和自我修复功能；

2. 利用Llama 3模型，Agent Q在一天内将零样本成功率提升340%，特别在真实世界预订任务中表现出色；

3. 结合引导式蒙特卡洛树搜索（MCTS）和直接偏好优化（DPO），Agent Q提高了多步推理任务的泛化能力和成功率。

https://mp.weixin.qq.com/s/xVB7ZiCsrNbCrQZKb2mwjA

五、没有等来OpenAI开源GPT-4o，等来了腾讯的开源版VITA

1. VITA是由腾讯优图等机构开发的首个开源多模态大语言模型（MLLM），能同时处理视频、图像、文本和音频，提供多模态交互体验；

2. 采用Mixtral 8×7B为基础，进行双语指令微调和多模态对齐，增强了视觉和音频能力；

3. VITA实现了非唤醒交互和音频中断的人机交互功能，通过复式部署模型，提高了环境输入的连续跟踪能力。

https://mp.weixin.qq.com/s/_ILH_GZaKMUlRaqsZBU0Eg

六、全球首个AI流媒体音乐App来了！一直生成一直听，国产

1. 昆仑万维开发的全球首个AI流媒体音乐App Melodio，提供无限流式AI生成音乐，支持中英文歌曲生成；

2. Melodio允许用户通过简单的Prompt输入生成音乐，同时提供歌曲参考模式，增强音乐生成的多样性和个性化；

3. 昆仑万维还推出了Mureka，一个AI音乐创作平台，使用类Sora架构，支持高质量音频生成，提升音乐创作的易用性和专业性。

https://mp.weixin.qq.com/s/30HmpWkChdG5jlAs2Bydjw

七、苹果大模型新成果：GPT-4o扮演用户，考察大模型工具调用

1. 苹果发布新开源Benchmark ToolSandbox，采用场景化测评方法，考察大模型在真实环境中的工具调用能力；

2. ToolSandbox测试包括对话交互和状态依赖场景，使用GPT-4o模拟用户与模型进行交互，提高测试的实际应用相关性；

3. 测试结果显示闭源模型如GPT-4o表现优于开源模型，尤其在多工具调用和多轮对话任务中，但所有模型在状态依赖任务和规范化场景中面临挑战。

https://mp.weixin.qq.com/s/O1uf5y0aCjVIvsvRVkdBBw

前沿科技

八、谷歌同步发布Pixel 9 ，让 Android 的 AI 体验抢先 iOS一步

1. Google发布Pixel 9系列，首次将大型多模态AI模型Gemini Nano整合进Android系统，提前于iOS实现设备内AI功能；

2. Pixel 9系列包括四款AI手机，具备高级语音功能Gemini Live，支持多应用跨界调用和AI图像功能；

3. 由Gemini Live提供自由流畅的交流体验，支持免提功能，允许用户在多种场景下无缝与AI进行互动。

https://mp.weixin.qq.com/s/w6BmotpEqxtgNZDtxvND8Q

报告观点

九、 “L2越厉害，就离L4越远”和楼天城聊Robotaxi和AI世界观

1. 楼天城认为L2自动驾驶技术的高度发展与L4自动驾驶技术的目标相距甚远，反之亦然；

2. 在自动驾驶技术发展中，数据的多少并非决定性因素，当自动驾驶技术超越人类水平后，过多的数据可能成为干扰项；

3. 自动驾驶的发展需要通过多个阶段，每个阶段都有其关键技术和挑战，例如从1000小时到10000小时的跳跃需要考虑如何降低其他车辆的风险。

https://mp.weixin.qq.com/s/0_wiRFV-ZTF9pWvk_CCkkQ

十、菲尔茨奖得主陶哲轩最新演讲：AI 将催生出一个大数学时代

1. 陶哲轩认为AI将推动数学进入一个新的大数学时代，尤其在数学证明和计算领域显示出巨大潜力；

2. 他指出AI在数学上的实现相对普通，主要通过输入数字和权重计算，但其对数学研究方式的潜在改变是革命性的；

3. 陶哲轩强调，尽管AI在生成准确结果方面有时会出现问题，但其在处理大规模数学项目和形式化验证方面的应用前景令人期待。

https://mp.weixin.qq.com/s/e0K_bfOqYew8H0_P1fPh2Q

👇订阅下方合集，获取每日推送

近期资讯

解决 Airtest 启动 APP 自动翻转屏幕问题的三种方法

在 Android 平台上，使用 Airtest 启动应用时，可能会遇到一个问题：即便应用启动前已经将手机屏幕方向锁定，使用 Airtest 启动应用时，屏幕仍然会自动翻转。这通常是由于设备的重力感应

pycode 2024-12-27

“胖东来的风”吹到了广州，永辉调改店员工月薪6千起

永辉“学习胖东来”调改店3店同开。

时代财经 2024-12-28

被美敦力收购，Fortimedix“柔性技术”获FDA批准，发力腹腔镜机器人

动脉网出品

动脉网 2024-12-28

Solid.js 最新官方文档翻译（11）—— Effects

Solid.js，一个比 React 更 react 的框架。每一个使用 React 的同学，你可以不使用，但不应该不了解。我同时搭建了 Solid.js 最新的中文文档站点：https://soli

冴羽 2024-12-27

uniapp使用vue3jsx封装弹窗组件的思考

前言在做程序的时候发现了一种现象，页面上需要多个弹窗依次弹出，于是就开始了引用多个弹窗定义多个isShow的情况，于是我这边就在思考有没有一种封装能够动态的渲染我需要的组件呢于是考虑了jsx的灵活

猩球中的木子 2024-12-27

“玄学”珠宝，拿捏焦虑的年轻人

2024致富密码：相信的力量

刺猬公社 2024-12-28

Android U WMS : 近期任务动画(1)

工作中，我处理过各种窗口动画异常，其中，以近期任务动画异常最为复杂。数月前，意外得到一次机会，公司愿意给我一个星

大胃粥 2024-12-27

分布式锁详解，谈谈分布式锁的高可用

分布式锁的主要目的是确保在多进程或服务实例之间对某个资源的互斥访问，以防止数据不一致或竞争条件的发生。

Serena 2024-12-27

Python包管理不再头疼：uv工具快速上手

Python 包管理生态中存在多种工具，如 pip、pip-tools、poetry、conda 等，各自具备一定功能。而今天介绍的uv 是 Astral 公司推出的一款基于 Rust 编写的 Py

databook 2024-12-27

深入Go错误处理：提升代码健壮性的实用技巧

Go 设计的错误就是值，错误处理就是值比较后作的决策。业务逻辑需要忽略错误，否则不要去忽视错误。这种设计理论上会让编程人员有意识的处理每一个错误，让程序更加健壮。

蔡蔡蔡云原生Go 2024-12-27

腾讯研究院AI速递 20240815

推荐体验

相关资讯

腾讯研究院AI速递 20240304

近期资讯

解决 Airtest 启动 APP 自动翻转屏幕问题的三种方法

“胖东来的风”吹到了广州，永辉调改店员工月薪6千起

被美敦力收购，Fortimedix“柔性技术”获FDA批准，发力腹腔镜机器人

Solid.js 最新官方文档翻译（11）—— Effects

uniapp使用vue3jsx封装弹窗组件的思考

“玄学”珠宝，拿捏焦虑的年轻人

Android U WMS : 近期任务动画(1)

分布式锁详解，谈谈分布式锁的高可用

Python包管理不再头疼：uv工具快速上手

深入Go错误处理：提升代码健壮性的实用技巧

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响