当前位置:首页|资讯|腾讯|生成式AI|AI芯片

腾讯研究院AI速递 20240627

作者:腾讯研究院发布时间:2024-06-27

生成式AI

一、 Transformer专用芯片,史上最快AI芯片Sohu推理性能超H100二十倍?

1. Etched筹集了1.2亿美元,旨在挑战Nvidia,推出专注于Transformer模型的AI芯片“Sohu”;

2. Sohu芯片利用台积电4nm工艺,专为运行Transformer模型设计,相比传统GPU,在推理性能和能耗上具有显著优势;

3. 芯片市场对Transformer模型的需求激增,Etched的策略是通过专用ASIC芯片优化Transformer运行效率,提升AI处理速度和成本效率。

https://mp.weixin.qq.com/s/CMfbHcns0hB84o30AibYQA

二、 ChatGPTmacOS桌面版全面开放,支持读取屏幕、上传文件、快捷启动等

1. OpenAI发布了适用于macOS的ChatGPT桌面应用,可直接从其网站下载;

2. 新ChatGPT应用允许Mac用户通过键盘快捷键快速调用AI,支持文件上传、截图、图片输入,并处理复杂查询;

3. 支持包括最新的GPT-4o在内的多种模型;OpenAI将延迟推出预期的语音助手功能。

https://mp.weixin.qq.com/s/kfadq6guO5bapOXoe1PKrw

三、 Sora首部商业片《玩具反斗城的起源》亮相戛纳!引高度关注但仍存在争议

1. Sora的首部商业片《玩具反斗城的起源》由Nik Kleverov导演,利用OpenAI的Sora技术制作,亮相戛纳国际创意节;

2. 影片发布后,迅速吸引了近300万网友的关注,受到了网友的积极评价和讨论;

3. 尽管影片受到好评,也存在一些争议,例如影片的真实性和自然度,以及对AI在商业视频制作中角色的质疑。

https://mp.weixin.qq.com/s/NkTUSS64L3mFrDAgB1xASw

四、 谷歌推出Modeling Collaborator:通过自然文本提示,快速训练视觉模型

1. 谷歌与密苏里大学开发的Modeling Collaborator方法能通过自然文本提示高效训练视觉模型,仅需100张图像即可完成训练;

2. 该方法利用大语言模型、图像描述生成模型和视觉问答模型的协同,实现复杂概念的自动化数据标注;

3. 通过知识蒸馏和主动学习技术,Modeling Collaborator显著提高了训练效率,减少了人工标注的需求,且在实验中展示了优于传统方法的准确率。

https://mp.weixin.qq.com/s/wqfbvUv-bLvAoMkUQLh_5A

五、 帝国理工和剑桥联合训练EMethylNET模型,早筛13种癌症,准确率98.2%

1. 人工智能模型EMethylNET能够通过观察DNA甲基化模式准确识别13种不同的癌症类型,准确率高达98.2%;

2. 该模型目前还处于实验阶段,需要对更多样化的活检样本进行额外训练和测试,以便未来临床应用;

3. 研究重点在于提供可解释的人工智能模型,探索模型的内部工作原理。

https://mp.weixin.qq.com/s/RJ1jDLRGmyn1TPLZEv0ZcA

六、 超越扩散模型!生图自回归范式再次被验证,STAR 2.9秒生成高质量图像

1. 中科大、哈工大和度小满共同开发的自回归模型STAR能在2.9秒内生成高质量图像,超越当前扩散模型如SDXL的性能;

2. STAR模型通过增强的文本引导和归一化旋转位置编码,有效提高图像生成的真实度和文本一致性;

3. 在MJHQ-30k和ImageReward基准测试中,STAR显示出优异的图像真实度和人类偏好匹配度,展现了自回归模型在图像生成领域的潜力和效率。

https://mp.weixin.qq.com/s/hpqCG3-jtlgQpdPZKz9Zgg

七、 旷视开源的AI 人像视频生成框架 MegActor,输入照片即可模仿任意表情包

1. 旷视科技发布开源 AI 人像视频生成框架 MegActor,输入照片和视频即可生成表情丰富、动作一致的视频;

2. MegActor 使用公开数据集和原始视频驱动技术,捕捉细致表情和运动信息,解决ID泄露及背景干扰问题;

3. MegActor 采用条件扩散模型和新训练方法,实现高质量、长时段视频生成,并支持多种视频和画风,且完全开源。

https://mp.weixin.qq.com/s/xRsi-jyigd8XuykNoA4h3Q

前沿科技

八、 模拟5亿年的进化信息,首个同时推理蛋白质序列、结构和功能的生物学大模型

1. ESM3是一种多模态生成语言模型,可同时推理蛋白质的序列、结构和功能,模拟超过五亿年的进化信息;

2. 该模型使用增强的文本引导和归一化旋转位置编码技术,提高生成蛋白质的准确性和适应性;

3. ESM3成功设计了具有较低同源性(58%)的新荧光蛋白esmGFP,展示出模型在生成非常规蛋白质序列和结构上的能力。

https://mp.weixin.qq.com/s/S_BRIJcFKuKk111Gomo7xQ

报告观点

九、 BVP 发布《State of the Cloud 2024》,万字总结 2024 年 AI Cloud 经济五大趋势

1. AI 基础模型成为资本关注焦点,占总AI领域风险投资的60%以上,表现为大科技公司之间的竞争;

2. 多模态模型和AI Agent的兴起,扩大了AI的应用范围,预计将在未来改变人类与软件的交互方式;

3. 垂直AI展现潜力,通过针对特定行业的应用,预计将大大超越传统SaaS模型,推动新的商业模式和市场增长。

https://mp.weixin.qq.com/s/GIUZrTPlo4tga0_RJXdfVw

十、 Anthropic创始人Dario 1.7万字访谈:新一代模型将在速度和成本效益上取得突破

1. Anthropic首席执行官Dario Amodei在访谈中强调了人工智能模型可解释性的重要性,指出这是了解和干预模型决策的关键;

2. Dario讨论了Anthropic最新的Claude3.5-Sonnet模型,称其在人性化和用户互动方面优于其他模型,并透露新一代模型将在速度和成本效益上取得突破;

3. Dario表示,未来人工智能的发展将对生物医学、生产力和社会效率产生巨大影响,并提出了关于AI安全、自我监管和国际竞赛的见解。

https://mp.weixin.qq.com/s/FQQJqXlc0628G8VpXl-TVw

👇订阅下方合集,获取每日推送


Copyright © 2024 aigcdaily.cn  北京智识时代科技有限公司  版权所有  京ICP备2023006237号-1