腾讯研究院AI速递 20240809

作者：腾讯研究院发布时间：2024-08-09

生成式AI

一、奥特曼秀5颗草莓疯狂暗示GPT-5？匿名超强新模型神秘现身

1. OpenAI可能正在开发代号为"Strawberry"的新模型，暗示为GPT-5；

2. 匿名模型"anonymous-chatbot"基于GPT-4架构，显示出在数学问题上的显著提升；

3. 社区通过各种暗示和线索，推测GPT-5可能在未来4-6周内发布。

https://mp.weixin.qq.com/s/LMNIKV7xWTGK5MZsSPT5Mg

二、最强国产多模态易主！腾讯混元把Claude-3.5/Gemini-1.5都超了

1. 腾讯混元模型在中文多模态大模型测评基准SuperCLUE-V中表现优异，超越了Claude-3.5和Gemini-1.5；

2. 混元模型具备强大的多模态理解和生成能力，能处理高分辨率和极端长宽比的图片；

3. 模型在实际应用中表现出色，如理解复杂图表、财报摘要，并能在多模态测试中准确识别和分析内容。

https://mp.weixin.qq.com/s/jEJxIc8SB1B_H3zdGNFIng

三、 OpenAI计划下注6000万美元，投资AI硬件Opal网络摄像头

1. OpenAI投资6000万美元于Opal，原为网络摄像头制造商，现计划开发由AI模型驱动的创意工具设备；

2. Opal将与OpenAI研究人员合作，几乎像研究实验室一样，为设备创意提供原型；

3. 尽管市场上AI硬件开发面临挑战，OpenAI及其CEO Sam Altman对AI技术驱动的物理设备持续投资显示出对该领域的强烈兴趣。

https://mp.weixin.qq.com/s/6GofBNHxFtaqw3ZkNtdg-A

四、谷歌发布大模型数据筛选方法：效率提升13倍，算力降低10倍

1. 谷歌Deepmind开发的JEST算法提升了大模型数据筛选效率13倍，降低算力需求10倍；

2. JEST通过批次级评分而非单个数据点评分，优化了数据选择过程；

3. 结合模型近似和多分辨率训练方法，进一步降低了算力需求，提高了处理效率。

https://mp.weixin.qq.com/s/sSzTWr8xEP8M8Wslqaj4qg

五、体验完腾讯元宝「深度阅读」，以后的论文和研报阅读有救了

1. 腾讯元宝的深度阅读功能显著提高了论文和研报的阅读效率，适合非专业人士快速获取关键信息；

2. 深度阅读模式包括精读大纲、精读提问和原文搜索，支持文图混排，保留格式和图片；

3. 尽管存在一些用户界面和交互设计的初期问题，整体体验仍然积极，显示出产品的潜力和改进空间。

https://mp.weixin.qq.com/s/vJf1KMmHXWMdtCxQa8VKQA

六、告别TTS！贾扬清领衔的Lepton AI推出实时语音交互功能

1. Lepton AI推出的实时语音交互功能实现了几乎无延迟的响应，大幅提升用户体验；

2. 技术创新包括将LLM和TTS合二为一，实现文本和语音的并行处理，显著减少首次音频时间（TTFA）；

3. Lepton AI的语音模式技术与多种开源LLM模型兼容，支持开发者自由选择和使用，提供高度定制化的应用可能。

https://mp.weixin.qq.com/s/4mNd43wTiUbffSkRRAkYCA

七、世界模型+数学证明，确保AI系统正常运作，深度学习巨头新动向

1. Yoshua Bengio加入Safeguarded AI项目，担任科学总监，项目由英国ARIA支持，预算达5900万英镑；

2. 项目目标是通过结合科学的世界模型和数学证明，构建能理解和降低其他AI Agent风险的系统；

3. Safeguarded AI分为三个技术领域：支架、机器学习和应用，旨在通过量化安全保障，提高AI系统的安全性和可靠性。

https://mp.weixin.qq.com/s/tDa46iKHeLqJS39PamnAPw

八、智驾一年10亿美元只是入场券，One Model端到端还有多远？

1. 国内厂家开始参考 FSD 的思路，采用基于端到端模型、VLM视觉语言模型和世界模型的自动驾驶技术架构，模拟人类思考和决策过程；

2. 端到端模型直接从传感器数据输出行驶轨迹，与业内分段式端到端模型有显著区别；

3. 理想汽车自动驾驶负责人表示，该技术投入巨大，预计未来每年训练花费将达到10亿美元，强调高质量数据和算力是关键。

https://mp.weixin.qq.com/s/gHonY0HXu71gLYXChkmagg

前沿科技

九、将 ChatGPT 植入人类大脑，瘫痪病人用意念控制 Vision Pro

1. Synchron开发的脑机接口技术通过血管植入，无需开颅手术，利用stentrode传感器网读取大脑信号；

2. 结合ChatGPT，该技术允许瘫痪患者通过思考控制外部设备，如Vision Pro，增强交互自然性和效率；

3. 系统通过学习用户偏好优化预测能力，提供个性化的交互选项，极大提升了用户的沟通效率和体验。

https://mp.weixin.qq.com/s/g9HStPJHnipu3Ja7gCnodQ

报告观点

十、国际劳工：ChatGPT等生成式AI，影响1700万工作岗位

1. 生成式AI如ChatGPT预计将影响拉丁美洲和加勒比地区的1700万个工作岗位，尤其在数据密集型行业如金融和保险；

2. 虽然只有2%到5%的岗位可能完全被AI替代，但大多数工作将转向人机协作模式，提高工作效率；

3. 生成式AI的应用将加剧现有的数字鸿沟，对教育和经济条件较好的群体带来更多好处，而对条件较差的群体则可能造成负面影响。

https://mp.weixin.qq.com/s/dQdm8hGhCQNEMRGgwzcAGA

👇订阅下方合集，获取每日推送

近期资讯

手写一个promise

原生Promise 首先，我们用原生的Promise实现一个简单的promise：运行上述代码，会进入promise的成功态resolve，输出“成功！！” 手写一个简单的Promise 接下来，我

ZZZzh 2024-12-30

01 自研zdpui项目的启动

01.目标我在后端有zdppy这个框架, 实现了零依赖这个伟大的目标, 实现了轻量级, 低代码开发, 能够极大的提高开发效率, 我现在想要在前端通过vue3来复现这一个伟大的目标, 而这个目标的起点

Python私教 2024-12-30

SQL语句`WHERE 1=1`，到底会不会影响性能？

本文探讨了 `WHERE 1=1` 在 SQL 查询中的作用和影响。通过分析其优缺点发现，`WHERE 1=1` 适用于动态 SQL 拼接，能提高代码可读性和一致性，且对现代数据库性能影响微乎其微..

四七伵 2024-12-30

小码编匠 2024-12-30

消除协同部门的工作阻碍 —— Mock 平台设计

前言随着业务团队不断扩大，往往一个项目中很多重要的接口都是其他团队提供的。例如我们日常的需求中，有些接口依赖风控团队提供，但是风控是一个单独的团队，他们的工作安排和我们的团队是不一致的，他们有自己的

暮色妖娆丶 2024-12-30

【JS逆向百例】某江 Hospital 逆向分析

声明本文章中所有内容仅供学习交流使用，不用于其他任何目的，不提供完整代码，抓包内容、敏感网址、数据接口等均已做脱敏处理，严禁用于商业用途和非法用途，否则由此产生的一切后果均与作者无关！本文章未经许

K哥爬虫 2024-12-30

沉浸式体验 Windows 10 安装过程

沉浸式体验 Windows 10 安装过程。购买 License，制作安装 U 盘，初始设置，正版激活。

Vic_wkx 2024-12-30

Pandas数据应用：天气数据分析

引言随着全球气候变化的加剧，天气数据的分析变得越来越重要。通过分析历史天气数据，我们可以预测未来的气候趋势，帮助各行各业做出更明智的决策。Pandas 是一个强大的 Python 数据处理库，广泛应

Jimaks 2024-12-30

腾讯研究院AI速递 20240809

推荐体验

相关资讯

腾讯研究院AI速递 20240304

近期资讯

手写一个promise

01 自研zdpui项目的启动

SQL语句`WHERE 1=1`，到底会不会影响性能？

攻克LeetCode 1055：探寻形成字符串的最短路径

3秒排版！这款免费工具让10万+公众号主都疯狂了

C# 异步编程技巧 Task 和 CancellationTokenSource 的妙用

消除协同部门的工作阻碍 —— Mock 平台设计

【JS逆向百例】某江 Hospital 逆向分析

沉浸式体验 Windows 10 安装过程

Pandas数据应用：天气数据分析

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响