人工智能技术得到了快速的发展,最近 ControlNet的出现也将会对文生图的工作流程进行更深层次的突破。而未来的多模态AIGC必然会对现有的内容形式产生更大的冲击。而凭借其独特定位获得了大量用户和活跃的社区的Midjourney,作为一个应用型产品,暂时是无法形成强大的技术壁垒的。
Midjourney是一个自主研发的实验室它可以让使用者在 Discord上和 Midjourney bot进行交互,然后提交“Prompt”来快速获取所需的图像。Midjourney采用订阅付费系统,在冷启动时,用户可以自由免费制作25幅图片。现在只有在订阅后,用户才可以使用 midjourney制作的照片的版权。
由于是最先公开测试的AI绘画产品,它可以用简单的 prompt制作出具有艺术性的图片,这吸引了大批的早期用户。Midjourney的用户数量迅速增加,收益也非常可观。该公司在 Discord上部署了该公司的bot,其频道超过1千万人,是 Discord目前使用人数最多的频道,每年的收入将达到1亿美金。Midjourney的概要短小精悍,充满了科幻感,由于画面精致,更具商业价值,锁定了庞大的客户群体,并有强烈的付费意愿,经过大量的实践,有效地提升了工作效率。
而与之相比,DALL-E2是现实主义的, Stable Diffusion没有任何的偏爱,但是为了得到好的画面,还需要更多的时间和更多的努力。社区的建立是 Midjourney火爆的一个重要的因素,互动的方式也是吸引和留住用户的重要因素。现在, Midjourney已经是 Discord中最大的频道。
Midjourney的商业化部分采用每月10到60美元的 订阅服务。虽然没有公布具体的付费用户数目,但是从客户的谈话中可以看出,他们的支付意愿很高。以现在的用户规模来看,每年的收入将会达到1亿美金左右。
如果和可画的用户相比,以 Midjourney的订阅价格,他们的收入将在23亿美金左右。2022年以前,文生图的模式主要是生成对抗网络(GANs)。
但是由于实际操作有很大的缺陷,不如直接使用 Photoshop之类的工具进行创作,而不能应用到商业上。随着 Disco Diffusion、 Stable Diffusion、DALL-E2、 Midjourney等公共文生图软件在公共场合进行了公开测试,并在社会媒体上引起了大量的讨论和作品的展示,使文生图的应用真正在 C端落地。除了像 Midjourney这样的普通的文生图软件之外,垂直类的应用程序也不断涌现。
不同的产业对图像生成的需求也不尽相同,并且都需要具体的数据集合来进行培训,这为垂直领域的初创公司带来了机遇。比如NovelAI专注于二次元的创作, Scenario专注于创造游戏资产, Lensa则专注于制作头部。
这些垂直类软件现在还不太可能成为大型企业,但是它们的利润却很高,比如 Lensa在上市后的几个星期里就实现了4,000万到5,000万美元的收入。一方面, Discord bot可以减少用户的体验门槛;另一方面,图像创作是一种不断重复的讨论,对他人的作品的鉴赏也有助于启发。
Holz还在采访中说,之所以没有直接开发 iOS应用程序,是因为大家都很享受这种创意。Midjourney很快就成为了 Discord上最受欢迎的服务器,其社区成员超过1千万。Midjourney最近扩展了它的应用领域,使得每个人都能在自己的 Discord服务器中安装 Midjourney,从而扩展了 Midjourney的应用能力。
在文生图软件中,迭代的速度是很关键的。SaaS的产品模型使得它的收益依赖于图像的效果和费用。随着基础技术的快速发展,模型的更新也是必不可少的。事实上,数据的质量和标注的质量,比模型更重要。
2022年3月V1版本中,仍然有大量的开放源码模式被引用;4、7、11月分别推出了V2、V3、V4,并在此基础上进行了迭代。第四章补充了生物、地点等信息;提高了对细节的辨识和多个对象/多个角色的视觉效果。总的来说,每一次迭代都是对产品性能的一次飞跃。在 ToC平台上,可以让工作流程变得简单,比如帮着设计师或者外包公司,为自己的社交媒体制作照片。
近期国内厂商推出了一款名为 metamind 的APP进行内测,metamind不仅可以体验类 Midjourney绘画能力,还支持多模态AIGC创作能力,包括类 ChatGPT对话聊天,AI绘画,AI写作,AI视频创作等。Midjourney类产品的发展也存在着诸如著作权等潜在的风险。DavidHolz承认, Midjourney所使用的公开资料中有数以百万计的未获作者许可的作品,这是很危险的一件事。现在,有 prompt的学习和交换网站,比如 promptoMANIA,在社区里也有公开的 prompt文档和教程。因为使用不同的 prompt得到的照片有很大的差别,以至于有了 prompt交易平台。
PromptBase是一种交易平台,包括 Midjourney,DALL-E2,GPT-3。目前 PromptBase拥有超过1万人的用户,其最流行的是商标、网站、服装等商业化设计场景,可以销售数百至数千次。尽管该小组已经表明了他们不在乎财政收益,但是 Midjourney却是一个非常赚钱的公司。现在, Midjourney公司的利润是80%左右。
Discord将 Midjourney建立在 Discord上, Discord将收取大约10%的费用。尽管 Midjourney的模型培训费用并不明确,但是在 Stable Diffusion中,总共有256个NvidiaA100,花费150000个小时,花费60,000美金。每一幅图片产生的推理都是在 GPU上进行的,制作一幅图片的花费大约为0.5美元,而且以后的费用还会继续缩减。与订阅收益相比,制作一张照片的花费可以被忽略。
虽然我们现在还不能看到这个产业的结局,但是我们相信, Midjourney以其特有的画面风格和艺术效果,以及活跃的 Discord社区所提供的良好的用户体验,也使我们对其未来的发展充满信心。另外大家想要体验国产最新的类 Midjourney产品的侯抬私我,希望国内在 AI方面能有更大的突破!