生成式AI
一、 Transformer专用芯片,史上最快AI芯片Sohu推理性能超H100二十倍?
1. Etched筹集了1.2亿美元,旨在挑战Nvidia,推出专注于Transformer模型的AI芯片“Sohu”;
2. Sohu芯片利用台积电4nm工艺,专为运行Transformer模型设计,相比传统GPU,在推理性能和能耗上具有显著优势;
3. 芯片市场对Transformer模型的需求激增,Etched的策略是通过专用ASIC芯片优化Transformer运行效率,提升AI处理速度和成本效率。
https://mp.weixin.qq.com/s/CMfbHcns0hB84o30AibYQA
二、 ChatGPTmacOS桌面版全面开放,支持读取屏幕、上传文件、快捷启动等
1. OpenAI发布了适用于macOS的ChatGPT桌面应用,可直接从其网站下载;
2. 新ChatGPT应用允许Mac用户通过键盘快捷键快速调用AI,支持文件上传、截图、图片输入,并处理复杂查询;
3. 支持包括最新的GPT-4o在内的多种模型;OpenAI将延迟推出预期的语音助手功能。
https://mp.weixin.qq.com/s/kfadq6guO5bapOXoe1PKrw
三、 Sora首部商业片《玩具反斗城的起源》亮相戛纳!引高度关注但仍存在争议
1. Sora的首部商业片《玩具反斗城的起源》由Nik Kleverov导演,利用OpenAI的Sora技术制作,亮相戛纳国际创意节;
2. 影片发布后,迅速吸引了近300万网友的关注,受到了网友的积极评价和讨论;
3. 尽管影片受到好评,也存在一些争议,例如影片的真实性和自然度,以及对AI在商业视频制作中角色的质疑。
https://mp.weixin.qq.com/s/NkTUSS64L3mFrDAgB1xASw
四、 谷歌推出Modeling Collaborator:通过自然文本提示,快速训练视觉模型
1. 谷歌与密苏里大学开发的Modeling Collaborator方法能通过自然文本提示高效训练视觉模型,仅需100张图像即可完成训练;
2. 该方法利用大语言模型、图像描述生成模型和视觉问答模型的协同,实现复杂概念的自动化数据标注;
3. 通过知识蒸馏和主动学习技术,Modeling Collaborator显著提高了训练效率,减少了人工标注的需求,且在实验中展示了优于传统方法的准确率。
https://mp.weixin.qq.com/s/wqfbvUv-bLvAoMkUQLh_5A
五、 帝国理工和剑桥联合训练EMethylNET模型,早筛13种癌症,准确率98.2%
1. 人工智能模型EMethylNET能够通过观察DNA甲基化模式准确识别13种不同的癌症类型,准确率高达98.2%;
2. 该模型目前还处于实验阶段,需要对更多样化的活检样本进行额外训练和测试,以便未来临床应用;
3. 研究重点在于提供可解释的人工智能模型,探索模型的内部工作原理。
https://mp.weixin.qq.com/s/RJ1jDLRGmyn1TPLZEv0ZcA
六、 超越扩散模型!生图自回归范式再次被验证,STAR 2.9秒生成高质量图像
1. 中科大、哈工大和度小满共同开发的自回归模型STAR能在2.9秒内生成高质量图像,超越当前扩散模型如SDXL的性能;
2. STAR模型通过增强的文本引导和归一化旋转位置编码,有效提高图像生成的真实度和文本一致性;
3. 在MJHQ-30k和ImageReward基准测试中,STAR显示出优异的图像真实度和人类偏好匹配度,展现了自回归模型在图像生成领域的潜力和效率。
https://mp.weixin.qq.com/s/hpqCG3-jtlgQpdPZKz9Zgg
七、 旷视开源的AI 人像视频生成框架 MegActor,输入照片即可模仿任意表情包
1. 旷视科技发布开源 AI 人像视频生成框架 MegActor,输入照片和视频即可生成表情丰富、动作一致的视频;
2. MegActor 使用公开数据集和原始视频驱动技术,捕捉细致表情和运动信息,解决ID泄露及背景干扰问题;
3. MegActor 采用条件扩散模型和新训练方法,实现高质量、长时段视频生成,并支持多种视频和画风,且完全开源。
https://mp.weixin.qq.com/s/xRsi-jyigd8XuykNoA4h3Q
前沿科技
八、 模拟5亿年的进化信息,首个同时推理蛋白质序列、结构和功能的生物学大模型
1. ESM3是一种多模态生成语言模型,可同时推理蛋白质的序列、结构和功能,模拟超过五亿年的进化信息;
2. 该模型使用增强的文本引导和归一化旋转位置编码技术,提高生成蛋白质的准确性和适应性;
3. ESM3成功设计了具有较低同源性(58%)的新荧光蛋白esmGFP,展示出模型在生成非常规蛋白质序列和结构上的能力。
https://mp.weixin.qq.com/s/S_BRIJcFKuKk111Gomo7xQ
报告观点
九、 BVP 发布《State of the Cloud 2024》,万字总结 2024 年 AI Cloud 经济五大趋势
1. AI 基础模型成为资本关注焦点,占总AI领域风险投资的60%以上,表现为大科技公司之间的竞争;
2. 多模态模型和AI Agent的兴起,扩大了AI的应用范围,预计将在未来改变人类与软件的交互方式;
3. 垂直AI展现潜力,通过针对特定行业的应用,预计将大大超越传统SaaS模型,推动新的商业模式和市场增长。
https://mp.weixin.qq.com/s/GIUZrTPlo4tga0_RJXdfVw
十、 Anthropic创始人Dario 1.7万字访谈:新一代模型将在速度和成本效益上取得突破
1. Anthropic首席执行官Dario Amodei在访谈中强调了人工智能模型可解释性的重要性,指出这是了解和干预模型决策的关键;
2. Dario讨论了Anthropic最新的Claude3.5-Sonnet模型,称其在人性化和用户互动方面优于其他模型,并透露新一代模型将在速度和成本效益上取得突破;
3. Dario表示,未来人工智能的发展将对生物医学、生产力和社会效率产生巨大影响,并提出了关于AI安全、自我监管和国际竞赛的见解。
https://mp.weixin.qq.com/s/FQQJqXlc0628G8VpXl-TVw
👇订阅下方合集,获取每日推送