腾讯研究院AI速递 20240627

作者：腾讯研究院发布时间：2024-06-27

腾讯生成式AI AI芯片

生成式AI

一、 Transformer专用芯片，史上最快AI芯片Sohu推理性能超H100二十倍？

1. Etched筹集了1.2亿美元，旨在挑战Nvidia，推出专注于Transformer模型的AI芯片“Sohu”；

2. Sohu芯片利用台积电4nm工艺，专为运行Transformer模型设计，相比传统GPU，在推理性能和能耗上具有显著优势；

3. 芯片市场对Transformer模型的需求激增，Etched的策略是通过专用ASIC芯片优化Transformer运行效率，提升AI处理速度和成本效率。

https://mp.weixin.qq.com/s/CMfbHcns0hB84o30AibYQA

二、 ChatGPTmacOS桌面版全面开放，支持读取屏幕、上传文件、快捷启动等

1. OpenAI发布了适用于macOS的ChatGPT桌面应用，可直接从其网站下载；

2. 新ChatGPT应用允许Mac用户通过键盘快捷键快速调用AI，支持文件上传、截图、图片输入，并处理复杂查询；

3. 支持包括最新的GPT-4o在内的多种模型；OpenAI将延迟推出预期的语音助手功能。

https://mp.weixin.qq.com/s/kfadq6guO5bapOXoe1PKrw

三、 Sora首部商业片《玩具反斗城的起源》亮相戛纳！引高度关注但仍存在争议

1. Sora的首部商业片《玩具反斗城的起源》由Nik Kleverov导演，利用OpenAI的Sora技术制作，亮相戛纳国际创意节；

2. 影片发布后，迅速吸引了近300万网友的关注，受到了网友的积极评价和讨论；

3. 尽管影片受到好评，也存在一些争议，例如影片的真实性和自然度，以及对AI在商业视频制作中角色的质疑。

https://mp.weixin.qq.com/s/NkTUSS64L3mFrDAgB1xASw

四、谷歌推出Modeling Collaborator：通过自然文本提示，快速训练视觉模型

1. 谷歌与密苏里大学开发的Modeling Collaborator方法能通过自然文本提示高效训练视觉模型，仅需100张图像即可完成训练；

2. 该方法利用大语言模型、图像描述生成模型和视觉问答模型的协同，实现复杂概念的自动化数据标注；

3. 通过知识蒸馏和主动学习技术，Modeling Collaborator显著提高了训练效率，减少了人工标注的需求，且在实验中展示了优于传统方法的准确率。

https://mp.weixin.qq.com/s/wqfbvUv-bLvAoMkUQLh_5A

五、帝国理工和剑桥联合训练EMethylNET模型，早筛13种癌症，准确率98.2%

1. 人工智能模型EMethylNET能够通过观察DNA甲基化模式准确识别13种不同的癌症类型，准确率高达98.2%；

2. 该模型目前还处于实验阶段，需要对更多样化的活检样本进行额外训练和测试，以便未来临床应用；

3. 研究重点在于提供可解释的人工智能模型，探索模型的内部工作原理。

https://mp.weixin.qq.com/s/RJ1jDLRGmyn1TPLZEv0ZcA

六、超越扩散模型！生图自回归范式再次被验证，STAR 2.9秒生成高质量图像

1. 中科大、哈工大和度小满共同开发的自回归模型STAR能在2.9秒内生成高质量图像，超越当前扩散模型如SDXL的性能；

2. STAR模型通过增强的文本引导和归一化旋转位置编码，有效提高图像生成的真实度和文本一致性；

3. 在MJHQ-30k和ImageReward基准测试中，STAR显示出优异的图像真实度和人类偏好匹配度，展现了自回归模型在图像生成领域的潜力和效率。

https://mp.weixin.qq.com/s/hpqCG3-jtlgQpdPZKz9Zgg

七、旷视开源的AI 人像视频生成框架 MegActor，输入照片即可模仿任意表情包

1. 旷视科技发布开源 AI 人像视频生成框架 MegActor，输入照片和视频即可生成表情丰富、动作一致的视频；

2. MegActor 使用公开数据集和原始视频驱动技术，捕捉细致表情和运动信息，解决ID泄露及背景干扰问题；

3. MegActor 采用条件扩散模型和新训练方法，实现高质量、长时段视频生成，并支持多种视频和画风，且完全开源。

https://mp.weixin.qq.com/s/xRsi-jyigd8XuykNoA4h3Q

前沿科技

八、模拟5亿年的进化信息，首个同时推理蛋白质序列、结构和功能的生物学大模型

1. ESM3是一种多模态生成语言模型，可同时推理蛋白质的序列、结构和功能，模拟超过五亿年的进化信息；

2. 该模型使用增强的文本引导和归一化旋转位置编码技术，提高生成蛋白质的准确性和适应性；

3. ESM3成功设计了具有较低同源性（58%）的新荧光蛋白esmGFP，展示出模型在生成非常规蛋白质序列和结构上的能力。

https://mp.weixin.qq.com/s/S_BRIJcFKuKk111Gomo7xQ

报告观点

九、 BVP 发布《State of the Cloud 2024》，万字总结 2024 年 AI Cloud 经济五大趋势

1. AI 基础模型成为资本关注焦点，占总AI领域风险投资的60%以上，表现为大科技公司之间的竞争；

2. 多模态模型和AI Agent的兴起，扩大了AI的应用范围，预计将在未来改变人类与软件的交互方式；

3. 垂直AI展现潜力，通过针对特定行业的应用，预计将大大超越传统SaaS模型，推动新的商业模式和市场增长。

https://mp.weixin.qq.com/s/GIUZrTPlo4tga0_RJXdfVw

十、 Anthropic创始人Dario 1.7万字访谈：新一代模型将在速度和成本效益上取得突破

1. Anthropic首席执行官Dario Amodei在访谈中强调了人工智能模型可解释性的重要性，指出这是了解和干预模型决策的关键；

2. Dario讨论了Anthropic最新的Claude3.5-Sonnet模型，称其在人性化和用户互动方面优于其他模型，并透露新一代模型将在速度和成本效益上取得突破；

3. Dario表示，未来人工智能的发展将对生物医学、生产力和社会效率产生巨大影响，并提出了关于AI安全、自我监管和国际竞赛的见解。

https://mp.weixin.qq.com/s/FQQJqXlc0628G8VpXl-TVw

👇订阅下方合集，获取每日推送

腾讯研究院AI速递 20240627

相关资讯

腾讯研究院AI速递 20240304

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响