腾讯开源了两个工具,一个叫MuseV,可以实现一张图变成视频;另一个叫MuseTalk,可以导入视频和音频,实现实时高质量唇形同步。两款工具结合,可以实现开源数字人,从而实现低阶版的Sora效果。当然,现阶段效果还比较粗糙,但考虑到是开源版本,能在本地部署,未来可期。MuseTalk 是由腾讯团队开发的先进技术,项目地址:https://github.com/TMElyralab/MuseTalk它是一个实时的音频驱动唇部同步模型。该模型能够根据输入的音频信号,自动调整数字人物的面部图像,使其唇形与音频内
腾讯数字人Sora
铁华团的黄金船 2024-05-23
5月17日,由搜狐主办的2024搜狐科技年度论坛在北京盛大开幕。多位院士、科学家与产业界人士齐聚一堂,激发智慧的深度碰撞,奔赴科技的星辰大海。
AI大模型
搜狐科技 2024-05-23
4月14日,中国科学院国家天文台人工智能工作组发布新一代天文大模型——“星语3.0”。“星语3.0”基于阿里云通义千问开源模型打造,目前已成功接入国家天文台兴隆观测站望远镜阵列–Mini“司天”。这是大模型在…
人工智能通义千问
全天候科技 2024-05-22
混元文生图包含了模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。据了解,目前腾讯已开源了超170个优质项目,均来源于腾讯真实业务场景,已覆盖了微信、腾讯云、腾讯游戏、腾讯AI、腾讯安全等…
Sora腾讯编程
AI财经社 2024-05-22
以Qwen1.5-72B为例,这个模型不仅登顶过HuggingFace开源大模型排行榜、OpenCompass开源基座大模型排行榜,而且在MT-Bench和Alpaca-Evalv2评测中也表现不俗,超过Cl…
GPT-4Hugging FaceLLaMAAlpaca
机器之心Pro 2024-05-22
[图片] 5月14日,腾讯旗下混元文生图大模型(下称:混元DiT,Scalable Diffusion Models with Transformers)宣布全面升级并对外开源,目前已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。腾讯混元文生图负责人卢清林表示,混元DiT开源的价值有两方面,一方面这是业内首个中文原生DiT架构,弥补了开源社区的空白;另一方面混元DiT为全面开放,与现网版本完全一致。 据卢清林介绍,之所
腾讯AI绘画编程Hugging Face
无言以对2012 2024-05-22
Pony 6的出现,是Stable Diffusion开源模型的一次革命,几乎重构了原生大模型的出图机制,能够更加方便的通过打分机制来实现更好的出图效果。但对于“过路型”玩家来说,这个机制又过于复杂了,如果不会打分,反而无法画出满意的画面。于是就有了针对打分机制的改良版本,作者称:增加了 pony-no_score 版本,它基本上是小马模型,但可以在没有 tag_score 的情况下保持 70-90% 的图像质量,但如果它仍然有 tag_score,效果会更好。特别说明:Pony v6 基础似乎在某些关键
Stable Diffusion
铁华团的黄金船 2024-05-22
Stability AI,在开源了号称是“迄今为止全球最牛逼的文生图模型”的SDXL 1.0后,又做了一件大事,在近期官宣重磅发布了Stable Diffusion 3,并面向会员开放了API。图片源于Stability AI官网图片源于Stability AI官网此次更新在文字到图像的生成领域,号称超越了DALL·E和Midjourney V6等行业内的领先模型,特别是在文本生成方面,Stable Diffusion 3.0能展现出更卓越的性能。和SDXL 1.0相比,SD 3.0的亮点在于:1、支持中
Stable DiffusionDALL·EMidjourneyStability AI
青椒云桌面 2024-05-22
AI大模型得到了前所未有的关注度与蓬勃发展,并在各类应用场景中产生了深远的影响。与之相应的是,对于高效、高可用的AI大模型推理系统的需求逐渐增长,成为许多企业的业务效率和成本挑战。潞晨科技公司为此打造了高效易用的Colossal-Inference推理引擎,可显著提高AI大模型吞吐速度,以应对推理场景中的性能瓶颈和成本挑战。该推理引擎集成了分块显存管理与分页注意力算法,预设与自定义模型优化策略,连续批处理调度。预设中提供高性能手写算子, 第三方的算子加速库;而在预设之外,用户可以通过使用基础算子与模型层,
潞晨科技官方账号 2024-05-22
在线可玩 开源多模态 SOTA 模型再易主! Hugging Face 开发者大使刚刚把王冠交给了 CogVLM2,来自大模型创业公司智谱 AI。 CogVLM2 甚至在 3 项基准测试上超过 GPT
Hugging Face
量子位 2024-05-22
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1