这几天俄罗斯人开发的绘图模型kandinsky推出了2.1版本,从性能评分来看,表现好于OpenAI的Dall-E2和stable diffusion 2.1。
技术路线仍然是扩散模型,模型目前开源,目前可以通过网页和colab笔记本使用,也可以去huggingface上由开发者部署的demo使用。
整体绘图水平和midjourney早一点的版本差不多。
网页应用
最简单的用法就是去
fusionbrain.ai
人多的时候要排队。
不过网页只提供俄语菜单,需要借助翻译工具。俄罗斯人也是大方,目前免费用,连注册都不要,打开就可以输入prompt开始画图。
也提供很多主题,比如真实,动漫,3d,数码绘图或者油画,还有苏联动画画风。
当然新东西刚出,功能比较缺失,比如网页上用不知道怎么改画面比例,始终是1:1,最大只能画768*768。每次只能画一张图,图生图也比较难操作。
Colab版本
colab版本倒是无需排队,也可以随便设置分辨率,采样步数,提示词相关性等参数,可以一次性生成N张,但是不能用画风(估计也可以用,但不知道触发词)。
colab笔记地址:https://colab.research.google.com/drive/1Ffa9AmggtJdBOLjKnMAeyUvcb98lRlWz?usp=sharing
(改过一些代码,加入了批量出图。)
huggingface版本
直接去抱抱脸搜索stable diffusion 2.1,就能搜到相关的space,进去就能用。
引用本文章内容请注明来源