阿里 MIMO:AI 视频人物替换与动画生成 [链接] AI 视频换脸技术我们已经见得多了,但阿里推出的 MIMO[1] 直接允许用户对视频中的人物进行替换。它不仅支持根据骨骼动作生成动画,轻松实现 Animate Anyone[2] 的功能,效果更佳,还具备视频背景融合功能。不过,暂时没有开源,从演示视频来看,将二次元角色替换到视频中的效果非常不错,当然,经不住仔细看脸部和细节,真人角色的替换则更显生硬和鬼畜。 Molmo:超越 GPT-4 的多模态视觉模型 [链接] Molmo 是一系列开放权重的多模
LLaMAGPT-4
三花AI 2024-09-26
如果说 OpenAI 的 ChatGPT 拉开了「百模大战」的序幕,那 Meta 的 Ray-Ban Meta 智能眼镜无疑是触发「百镜大战」的导火索。自去年 9 月在 Meta Connect 2023 开发者大会上首次亮相,短短数月,Ray-Ban Meta 就突破百万销量,不仅让马克·扎克伯格直呼 Amazing,更促使了谷歌、三星、字节跳动等国内外大厂的纷纷入局! 时隔一年,Meta 再次在 Connect 开发者大会上推出了智能眼镜新产品 Orion,这是该公司推出的首款全息 AR 眼镜,扎克伯
LLaMAOpenAI谷歌字节跳动
HyperAI超神经 2024-09-26
智东西9月19日杭州报道,今日,阿里云推出全球最强开源大模型Qwen2.5-72B,性能“跨量级”超越Llama3.1-405B,再登全球开源大模型王座。这是阿里云继今年6月开源通义千问Qwen2系列、赶超当…
通义千问
智东西 2024-09-27
本文由 RTE 开发者社区成员通过社区网站投稿提供,如果你也有与实时互动(Real-Time Engagement,RTE)相关的项目分享,欢迎访问网站 rtecommunity.dev 发布,优秀项目将会在公众号发布分享。 [图片] 自从 OpenAI 展示了 GPT-4o 的实时对话能力后,感觉电影《Her》中的场景瞬间成了现实。受这种突破性多模态体验的启发,开发者们开始疯狂寻找构建实时对话 AI 智能体的方法。虽然现在有一些开源工具可以让大家轻松上手做点编排,但要真正构建一个多模态 AI
OpenAI
RTE开发者社区 2024-09-25
Colossal-AI采用了对训练收敛性影响较小的实时scaling方案,同时实现有着不输其他延迟scaling实现的性能。首先在H100单卡上进行了测试,以下测试中TransformerEngine(TE)…
编程AI大模型
量子位 2024-10-01
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1