当前位置：首页|资讯|腾讯|AIGC|人工智能

能画画了！混元大模型开放文生图功能

作者：北京日报发布时间：2023-10-27

腾讯 AIGC 人工智能

北京日报客户端 | 记者袁璐

10月26日，腾讯宣布，腾讯混元大模型迎来全新升级，并正式对外开放“文生图”功能。腾讯方面称，升级后的混元大模型中文能力整体超过GPT3.5，代码能力大幅提升20%。作为实用级的通用大模型，目前，超过180个腾讯内部业务已接入该模型。

此外，今年9月首批通过备案后，混元大模型也已经面向消费端用户陆续开放体验，用户通过小程序或网页端，就能与该大模型对话。

文生图是AIGC（生成式人工智能）领域的核心技术之一，也是体现通用大模型能力的试金石，对模型算法、训练平台、算力设施都有较高的要求。自首次公开亮相以来，混元大模型进入了加速升级的轨道。记者注意到，文生图能力是此次混元大模型升级开放的最大亮点之一，据介绍，相比其他大模型，其文生图应用在人像真实感、场景真实感上有比较明显的优势，同时，在风景、动漫游戏等场景等生成上有较好的表现。

人脸画像生成在业界公认难度较高，但记者看到，输入提示词“生成可爱的亚洲4岁女孩穿着棉质连衣裙，大眼睛，古代中国，摄影风格，汉服”，混元大模型生成如下：

另外一个例子中，输入提示词“ 一个城市CBD办公楼，现代化设计，高层建筑，玻璃幕墙，近景拍摄，摄影风格，摄影照片”，混元大模型交出了如下作品：

更简单一些，输入提示词“轻舟已过万重山，水墨画风格”就可以得到下面的图片：

据悉，大模型文生图的难点体现在对提示词的语义理解、生成内容的合理性以及生成图片的效果。针对这三个技术难点，团队进行了专项的技术研究，提出了一系列原创算法，来保证生成图片的可用性和画质。

此外，在内容合理性方面，AI生成人体结构和手部经常容易变形，该大模型通过增强算法模型的图像二维空间位置感知能力，并将人体骨架和人手结构等先验信息引入到生成过程中，让生成的图像结构更合理，减少错误率。经过模型算法的优化之后，该大模型文生图的人像模型，包含发丝、皱纹等细节的效果提升了30%，场景模型，包含草木、波纹等细节的效果提升了25%。

大模型多模态交互能力被认为是通往通用人工智能的必由之路，也是不断扩充大模型能力象限的一个重要方向。记者获悉，目前混元大模型也正在不断强化图片、视频、音频等各类模态的处理能力，相关成果也将很快面向外界推出。

图片来源：混元大模型

推荐体验

相关资讯

腾讯混元大模型开放AIGC文生图这些上市公司也在强力布局

腾讯混元大模型开放AIGC文生图这些上市公司也在强力布局《科创板日报》10月27日讯（记者张洋洋）自9月7日简单亮相后，鲜少公开露面的腾讯混元大模型，昨日公布了最新的研发新进度。本次新

财联社 2023-10-27

升级对标Sora，腾讯混元开源文生图大模型

升级对标Sora，腾讯混元开源文生图大模型市界2024-05-14 18:58发布于北京市界官方账号5月14日，腾讯宣布旗下的混元文生图大模型全面升级并对外开源，目前已在 Hugging Face

Sora Hugging Face 腾讯

市界 2024-05-14

逐浪AIGC丨腾讯混元大模型迭代：新增“文生图”能力

10月26日，腾讯宣布混元大模型迎来升级，将正式对外开放“文生图”功能。根据当时披露的信息，腾讯混元大模型是由腾讯全链路自研的通用大语言模型，拥有超千亿参数规模，预训练语料超2万亿tokens。数据显示，经过模型算法的优化之后，混元文生图的人像模型，包含发丝、皱纹等细节的效果提升了30%，场景模型，包含草木、波纹等细节的效果提升了25%。

AIGC 腾讯大语言模型

21世纪经济报道 2023-10-26

中文原生文生图大模型来了！腾讯混元推出，Sora 同架构

宣布旗下的混元文生图大模型全面升级并对外开源，目前已在HuggingFace平台及Github上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。混元文生图模型效果远超开源的StableDiffusion模型，是目前效果最好的开源文生图模型；整体能力属于国际领先水平。

腾讯 Sora Hugging Face GitHub Stable Diffusion

时代周报 2024-05-14

腾讯混元文生图大模型开源：Sora 同架构，更懂中文

旗下的混元文生图大模型宣布对外开源，目前已在HuggingFace平台及Github上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。混元已布局文/图生3D，单图仅需30秒即可生成3D模型。问：为什么在今年这个节点做开源？

腾讯 Sora Hugging Face GitHub

极客公园 2024-05-17

近期资讯

性能新旗舰，一加Ace5Pro正式发布：骁龙8至尊版极致电竞体验

它搭载了高通骁龙8至尊版处理器，配备了高达16GB的LPDDR5T内存和UFS4.0闪存，这样的配置在同档位中极为罕见。此外，一加Ace5Pro还配备了6100mAh的大电池和支持100W超级闪充技术，能够在35分钟内快速补满电量。

小米地瓜 2024-12-26

华为Mate 70 Pro+通过三项航天级测试

据华为终端消息，华为Mate70Pro+成功通过模拟火箭360km/h冲击、28米高空跌落和-30度极端低温环境三项航天级测试。华为Mate70Pro+搭载高亮钛玄武架构，可提升手机在抗冲击、抗跌落、抗低温能力。

每日经济新闻 2024-12-26

博帝推出中端 PCIe 4.0 M.2 固态硬盘 P400 V4，6200MB/s 顺序读

IT之家12月26日消息，博帝Patriot今日宣布推出一款速度上属于PCIe4.0×4SSD中端级别的P400V4固态硬盘。该盘体采用M.22280单面外形规格，整体覆盖以石墨烯散热片。

IT之家 2024-12-26

微软解析“教育+AI”：小模型带来的智能硬件大爆发，教育亦有结合机会

来源|多知整理|王上摄|张子通近日，在多知OpenTalk第48期“全球起航!‘教育+AI’出海进行时”活动中，微软中国高级解决方案专家王剑白博士发表了主题演讲《GenAl浪潮下教育行业转型及出海的实践与思考》。

多知网 2024-12-26

「e公司观察」技术迭代的溢出效应

无人机变得越来越好用，越来越便宜，受益于汽车产业链，人形机器人变得越来越智能，则受益于大模型。大疆2015年推出第一代的农业植保机MG1时，锂电池保内寿命只有180次。如果以2015年的产品放在现在做吊运不到一个月电池就要报废。另外，大疆无人机还开始搭载激光雷达，激光雷达的发展，也受益于新能源汽车产业链的智能化。

证券时报 2024-12-26

一加平板发布：1999元起！首销送手写笔

快科技12月26日消息，在今天下午的Ace5系列发布会上，一加还正式发布了一加平板，起售价1999元，首销还赠送一根手写笔。外观方面，一加平板有苔原绿、深空灰两种配色，6.29mm厚，533g重，打游戏久握不累。

快科技 2024-12-26

红果短剧认真整改主动停更5天

红果短剧在接受广电主管部门约见后，高度重视，迅速响应，坚决落实好主管部门关于微短剧管理的有关规定和指导要求，进一步完善审核制度，即日起对平台上所有剧集进行逐一排查，对于发现的违规内容，立即采取下线等措施。

广电视界 2024-12-26

用Rust重构Win11内核！微软已开始行动

快科技12月26日消息，在2023的时候，微软就曾透露正在尝试使用Rust重构WindowsNT内核中的部分模块。如今在Windows1124H2版本中，终于可以初见微软的工作成果，在更新日志中，微软提到了一个使用Rust开发的新GDI区域。

驱动之家 2024-12-26

我国首个商用堆在线辐照生产同位素装置成功投运

12月26日，记者从国家原子能机构获悉，我国首个商用堆在线辐照生产同位素装置在中核集团秦山核电基地正式投运，在此生产的首批镥-177医用同位素也同步出堆，标志着我国成功掌握批量化在线辐照生产短半衰期同位素的关键技术，一举打破我国关键医用同位素长期依赖进口的局面。

观察者网 2024-12-26

中洲特材：高温合金产品尚未应用于机器人领域

金融界12月26日消息，有投资者在互动平台向中洲特材提问：董秘您好，请问贵公司合金系列产品是否直接或间接用于机器人或机器狗等产品中！如果没有公司未来是否考虑生产机器人结构部件产品！

金融界 2024-12-26

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1