作者 | 冬梅自 2021 年初以来,随着大量深度学习支持的文本到图像模型(例如 DALL-E-2、Stable Diffusion 和 Midjourney 等)的诞生,人工智能研究的进展发生了革命性的变化。近日,谷歌Muse AI 系统正式亮相。据谷歌 Muse AI 团队称,Muse 是一种文本到图像的 Transformer 模型,该模型可以实现先进的图像生成性能。我们提...【查看原文】
出品|开源中国自 2021 年初以来,AI 领域推出大量基于文本到图像的模型(例如 DALL-E-2、Stable Diffusion 和 Midjourney 等)。近日,谷歌也公开了一款名为 “Muse” 的基于文本生成图像的模型,声称可以实现最先进的图像生成性能。 下图均为 Muse 的基于文本生成的图像一群鱼在海里拼成 “MUSE” 字样嘴里叼着 “MU...
谷歌Stable DiffusionMidjourney
OSCHINA 2023-01-09
#元宇宙 12 月 7 日消息,谷歌官方宣布发布 Gemini1.0,这是其认为规模最大、功能最强大的人工智能模型,可以处理视频、音频和文本等不同内容形式的信息。#AI谷歌在多种任务上评估了两种模型的性能,从自然图像、音频、视频理解到数学推理,Gemini Ultra 在 32 个常用的学术基准的 30个上,已经超越 GPT-4。#大模型 #生成式AI #谷歌Gemini
谷歌AI大模型人工智能生成式AI元宇宙
元宇宙新声 2023-12-13
Stability AI宣布推出Stable Diffusion XL 1.0,这是一个文本到图像的模型,该公司将其描述为迄今为止“最先进的”版本。Stability AI表示,SDXL 1.0能生成更加鲜明准确的色彩,在对比度、光线和阴影方面做了增强,可生成100万像素的图像(1024×1024)。而且还支持在网页上直接对生成图像进行后期编辑。提示词也能比之前更简单了。这是因为SDXL 1.0的基础模型参数量达到了35亿,理解能力更强。对比基础版Stable Diffusion,参数量只有10
Stability AIStable Diffusion XLStable Diffusion提示词
AI研习所 2023-07-29
人工智能的发展让创作者保持警惕。每隔一周就会有一个新的 AI 工具、平台或功能可供探索。在我的列表顶部是为几个即将进行的项目制作动画人物面孔。我需要创建一致的、分层的或复杂的图像以用于这些项目。例如,D-ID是一款网络应用程序,它使用实时面部动画和高级文本到语音转换来创建身临其境的类人对话式AI体验。Midjourney 的“/describe”功能可让您将图像转换为文字。它会根据您上传的图片生成四种不同的描述,并且可以轻松生成新的变体。底部的四个数字是混音按钮——每个数字都与相应的描述相匹配。单击数字将
ChatGPTMidjourney人工智能
清大文森学堂 2023-04-18
DoNews12月6日消息,一支来自卡内基梅隆大学和HuggingFace的研究团队表示,不同的生成式AI模型在能耗方面也有不同的表现。据品玩报道,研究团队对聊天机器人、文本生成模型以及图片生成模型在内的各种模型的碳排放量和能耗进行了测量。
Hugging Face生成式AI
DoNews 2023-12-06
没那么简单,就能找到,辞退的理由
瞎说职场 2024-12-26
为什么大家都误会了「提示词」?
极客公园 2024-12-26
更无感,更精确。
雷科技 2024-12-26
人之所以为人,是因为人能在头脑中凭空想象出不存在的东西。
腾讯研究院 2024-12-26
谁还在买黄金?
时代周报 2024-12-26
新一年要做什么方向
游戏新知 2024-12-26
他们如何在应变中破浪前行,不仅关乎自身发展,更是MCN下半场的新故事所在。
中国是否会在不同领域出现更多大型和超大型的半导体集团?
半导体产业纵横 2024-12-26
2024年大模型融资火热,全球超4000亿。
智东西 2024-12-26
欧洲汽车部件供应商裁员潮,市场转型压力加剧。
36氪的朋友们 2024-12-26
Copyright © 2025 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1