来了,人工评测效果可能已经超过收费的Stable Diffusion 3,仅次于收美刀的DALL-E3和收美刀的Midjourney的AI绘画模型出来了,而且是开源的,商业可用,由我们国内腾讯混元团队推出的HunyuanDiT,从名称就可以看到是用的和Sora同框架的DiT架构的模型,期待上comfyui或者webui。目前可以先用cli命令行版或者jupyter体验用用。 表面上看起来像是重复造轮子,但实际上采用这种架构的优势要比纯扩散模型的优势明显,主要是提示词的遵从度等层面。 明天给大家上测试视频。
MidjourneyStable DiffusionSora提示词
AI大师工作流 2024-05-15
引言:开源与闭源好像硬币的两面,如何发展就看你怎么翻AI联盟组成还是非常到位,从大学到企业,然而这一切的目的只为AI开源,大模型开源,从而撕裂来自OpenAI独家声音。【科技明说|全球云观察|全球存储观察|阿…
OpenAI
阿明观察 2024-05-15
5月14日,腾讯宣布旗下的混元文生图大模型全面升级并对外开源,目前已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用
腾讯SoraHugging FaceGitHub
光子星球 2024-05-14
混元文生图模型这个国产开源文生图大模型中实现了。由此,模型实现了更稳定的训练过程,更好的生态兼容,支持多分辨率生成、多轮绘画能力等效果。具体来看,该模型参数量15亿,目前已在HuggingFace平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,企业与个人开发者可免费商用。
证券时报 2024-05-14
腾讯混元文生图大模型全面开源!Sora同架构,更懂中文,可免费商用智东西2024-05-14 19:45发布于北京智东西官方账号智东西(公众号:zhidxcom)作者 ZeR0编辑 漠影智
腾讯Sora
智东西 2024-05-14
需求 掘金社区有不少文稿转视频的文章,但是往往依赖于Stable Diffusion等大模型(比如link),部署和使用都不太方便。于是就打算基于 Python 和开源库,做一个文章转视频的工具。
Stable Diffusion
Simford 2024-05-14
升级对标Sora,腾讯混元开源文生图大模型市界2024-05-14 18:58发布于北京市界官方账号5月14日,腾讯宣布旗下的混元文生图大模型全面升级并对外开源,目前已在 Hugging Face
SoraHugging Face腾讯
市界 2024-05-14
01Llama3简介 Llama3 是Meta最新发布的开源大语言模型(LLM), 当前已开源8B和70B参数量的预训练模型权重,并支持指令微调。详情参见:https://ai.meta.com/blog/meta-llama-3/ Llama3性能优异,8B和70B参数模型的性能在chatbot-arena-leaderboard中皆进入前十;LLama-3-70b-Instruct仅次于闭源的GPT-4系列模型。 排行榜链接:https://chat.lmsys.org/?leaderboard 魔搭
大语言模型LLaMAGPT-4
英特尔技术汇 2024-05-14
腾讯宣布混元文生图大模型开源:与Sora同架构,可免费商用腾讯科技2024-05-14 15:38发布于北京腾讯新闻科技频道官方账号腾讯科技讯 5月14日,腾讯宣布旗下的混元文生图大模型全面升级并
腾讯科技 2024-05-14
宣布旗下的混元文生图大模型全面升级并对外开源,目前已在HuggingFace平台及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。混元文生图模型效果远超开源的StableDiffusion模型,是目前效果最好的开源文生图模型;整体能力属于国际领先水平。
腾讯SoraHugging FaceGitHubStable Diffusion
时代周报 2024-05-14
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1