作者 | 冬梅自 2021 年初以来,随着大量深度学习支持的文本到图像模型(例如 DALL-E-2、Stable Diffusion 和 Midjourney 等)的诞生,人工智能研究的进展发生了革命性的变化。近日,谷歌Muse AI 系统正式亮相。据谷歌 Muse AI 团队称,Muse 是一种文本到图像的 Transformer 模型,该模型可以实现先进的图像生成性能。我们提...【查看原文】
出品|开源中国自 2021 年初以来,AI 领域推出大量基于文本到图像的模型(例如 DALL-E-2、Stable Diffusion 和 Midjourney 等)。近日,谷歌也公开了一款名为 “Muse” 的基于文本生成图像的模型,声称可以实现最先进的图像生成性能。 下图均为 Muse 的基于文本生成的图像一群鱼在海里拼成 “MUSE” 字样嘴里叼着 “MU...
谷歌Stable DiffusionMidjourney
OSCHINA 2023-01-09
#元宇宙 12 月 7 日消息,谷歌官方宣布发布 Gemini1.0,这是其认为规模最大、功能最强大的人工智能模型,可以处理视频、音频和文本等不同内容形式的信息。#AI谷歌在多种任务上评估了两种模型的性能,从自然图像、音频、视频理解到数学推理,Gemini Ultra 在 32 个常用的学术基准的 30个上,已经超越 GPT-4。#大模型 #生成式AI #谷歌Gemini
谷歌AI大模型人工智能生成式AI元宇宙
元宇宙新声 2023-12-13
Stability AI宣布推出Stable Diffusion XL 1.0,这是一个文本到图像的模型,该公司将其描述为迄今为止“最先进的”版本。Stability AI表示,SDXL 1.0能生成更加鲜明准确的色彩,在对比度、光线和阴影方面做了增强,可生成100万像素的图像(1024×1024)。而且还支持在网页上直接对生成图像进行后期编辑。提示词也能比之前更简单了。这是因为SDXL 1.0的基础模型参数量达到了35亿,理解能力更强。对比基础版Stable Diffusion,参数量只有10
Stability AIStable Diffusion XLStable Diffusion提示词
AI研习所 2023-07-29
人工智能的发展让创作者保持警惕。每隔一周就会有一个新的 AI 工具、平台或功能可供探索。在我的列表顶部是为几个即将进行的项目制作动画人物面孔。我需要创建一致的、分层的或复杂的图像以用于这些项目。例如,D-ID是一款网络应用程序,它使用实时面部动画和高级文本到语音转换来创建身临其境的类人对话式AI体验。Midjourney 的“/describe”功能可让您将图像转换为文字。它会根据您上传的图片生成四种不同的描述,并且可以轻松生成新的变体。底部的四个数字是混音按钮——每个数字都与相应的描述相匹配。单击数字将
ChatGPTMidjourney人工智能
清大文森学堂 2023-04-18
DoNews12月6日消息,一支来自卡内基梅隆大学和HuggingFace的研究团队表示,不同的生成式AI模型在能耗方面也有不同的表现。据品玩报道,研究团队对聊天机器人、文本生成模型以及图片生成模型在内的各种模型的碳排放量和能耗进行了测量。
Hugging Face生成式AI
DoNews 2023-12-06
大模型分化发展方向
AI鲸选社 2024-12-30
破局之道在哪里
零态LT 2024-12-30
希望屏幕前的每个人都有升职加薪的能力,也有拒绝升职加薪的勇气,对自己有清楚的认知,对未来有清晰的规划,不被现实裹挟。
猎聘 2024-12-30
如果继续待下去,很可能未来的后路都没了。
张良计 2024-12-30
AI,正在成为新的工业驱动器。
雷科技 2024-12-30
写着写着就哭了,哭着哭着又笑了,这就是NFT玩家今年最真实的写照。
Odaily星球日报 2024-12-30
放下骄傲。
凤凰网汽车 2024-12-30
波音“雪上加霜”
36氪的朋友们 2024-12-30
韩国仁川机场全是来中国的韩国人
闻旅 2024-12-30
今年中国互联网产品中增长最快的产品之一。
骨朵网络影视 2024-12-30
Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司 版权所有 京ICP备2023006237号-1