不藏了,近期全网爆火的AI 写真项目 InstantID,正是来自小红书社区技术创作发布团队。
为了迎接龙年春节的到来,我们的InstantID全新推出「Spring Festival」新春风格!并与著名开源模型社区 Hugging Face 联手,在小红书 APP 上,特别策划「你的新春照我包了」有奖互动。只需上传一张照片,30 秒内轻松定制你的专属新春照。
活动时间:2 月 7 日 至 2 月 25 日
参与方式:
在小红书 APP 内分享你用 InstantID 生成的新春照。
(体验入口指路👉hf.link/iid)
带 #你的新春照我包了 话题发笔记,并关注和 @Hugging Face 小红书账号,让更多人看到你的创意。
晒出你的 Prompt,分享你的新年愿望和期待,邀请朋友和家人一起参与,拼出新春照一条龙。
让我们来看看InstantID的创意新春照效果:
跨越千年的问候,“兵马俑”给你拜年了!
蒙娜丽莎在长城练瑜伽,氛围感满满。
爱因斯坦也在故宫前吃起了饺子,恭贺新春。
那如何用 InstantID 制作新春照呢?操作很简单:
访问 Hugging Face Spaces 中的 InstantID 地址
hf.link/iid
上传一张照片,InstantID 默认风格为「Spring Festival」,点击 Submit 为你生成一个充满新春气息的照片。
当然,如果你想开启更多的创意玩法,还可以自定义添加 Prompt,风格自由搭配。
比如,这是费雯丽的照片,选择「Spring Festival」风格,未添加 Prompt 的效果。
为照片添加一些“魔法”——龙年春节自然少不了龙年元素,感受一下吃饺子、发红包、雪中赏梅的节日氛围。同一张照片,输入不同的 Prompt,30 秒照片焕新。
InstantID 很好地保留费雯丽的面部特征,仔细一看,甚至能还原手部动作、模拟飘雪时风吹动头发的动态效果。
不仅如此,我们还可以上传姿势图为参考,InstantID 生成的绝美侧仰照,很有神韵。
除新春主题外,InstantID 还有非常多的有趣玩法。比如让深度学习大牛、图灵奖获得者 Yann LeCun 变身为经典动漫角色,马里奥、海贼王...
按一年四季,随机生成你的动漫人格,脸部可幼态可成熟。
InstantID 尽情释放你的想象力,来套中国功夫对抗赛,也不是不可以~
InstantID 最独特的地方在于它只需要一张照片,不依赖模型,用时 30 秒就可以生成非常不错的风格效果。从效果和使用体验上来看,InstantID 作为一个高效的、轻量级、可插拔的适配器,赋予预训练的文本到图像扩散模型以 ID 保存的能力。
前不久,小红书技术团队的 5 位工程师发表论文,详细揭秘了 InstantID 背后的技术。
那为什么只需上传一张图 + 简单的提示,InstantID 就能实现高面部保真度,画面与人物统一得很和谐呢?
核心关键是 InstantID 不训练文生图模型的 UNet 部分,仅训练可插拔模块,在推理过程中无需 test-time tuning,在几乎不影响文本控制能力的情况下,实现高保真 ID 保持。
如图所示,我们通过一系列创新技术:弱对齐的 CLIP 特征替换为强语义的人脸特征、人脸图像的特征在 Cross-Attention 中作为 Image Prompt 嵌入、 以及 IdentityNet 来对人脸施加强语义和弱空间的条件控制,InstantID 在不牺牲文本控制能力的情况下,实现了高保真 ID 保持。
Instant 在多个方面展现出其独特优势,我们提出的主要贡献如下:
提供了一种全新的 ID 保留方法,有效弥补了训练效率与 ID 保真度之间的差距。
InstantID 是可插拔的,与目前社区内文生图基础模型、LoRAs、ControlNets 等完全兼容,可以零成本地在推理过程中保持人物 ID 属性。此外,InstantID 保持了良好的文本编辑能力,使 ID 能够丝滑地嵌入到各种风格当中。
实验结果表明,InstantID 不仅超越目前基于单张图片特征进行嵌入的方法(IP-Adapter-FaceID),还与 ROOP、LoRAs 等方法在特定场景下不分伯仲。它卓越的性能和效率激发了其在一系列实际应用中的巨大潜力,例如新颖的视图合成、ID 插值、多 ID 和多风格合成等。
还不赶紧上手体验一下,自定义你的春节写真。
Prompt 不知道怎么写?一些好用的“咒语”,拿走不谢~ 也欢迎在评论区晒出你的 Prompt。
01. Flat illustration, a Chinese girl, ancient style, wearing a red cloth, smile face, white skin, clean background, fireworks blooming, red lanterns.
02. A man riding a colossal fire-breathing dragon, engaging in a space battle against extraterrestrial beings.
03. A person dressed as a superhero, backed by a bizarre alliance of politicians, celebrities, and animals, defending Earth together.
04. A girl wearing cheongsam, Milky Way, wind, spring festival, cartoon, red backgroud, Red Lantern, fireworks, smile, dressed, Chinese dragon.
活动奖励:
我们将根据参与笔记的互动和创意,送出由 小红书技术REDtech 和 Hugging Face 提供的新年礼物!
优质笔记将获得专属活动流量扶持,惊喜多多。
我们相信,通过开源,InstantID 能够激发更多开发者的创造力,推动 AI 技术的进一步发展,同时也让更多人享受到科技带来的便利和乐趣。
准备好了吗?一起来玩 InstantID,这个新年,因你而不同!
论文标题:InstantID: Zero-shot Identity-Preserving Generation in Seconds
论文地址:https://arxiv.org/abs/2401.07519
代码地址:https://github.com/InstantID/InstantID
项目地址:https://instantid.github.io
Demo 新春体验:https://huggingface.co/spaces/InstantX/InstantID
原文链接:https://mp.weixin.qq.com/s/-r4Yah3NByUkJ8c60oihqw
本文由 Hugging Face 中文社区内容共建项目提供,稿件由社区成员投稿,经授权发布。文章内容不代表官方立场,文中介绍的产品和服务等均不构成投资建议。
如果你有与开源 AI、Hugging Face 相关的技术和实践分享内容,以及最新的开源 AI 项目发布,希望通过我们分享给更多 AI 从业者和开发者们,请通过下面的链接投稿与我们取得联系: https://hf.link/tougao
小红书技术REDtech 2024-02-18
小红书技术REDtech 2023-12-08