前面的教程预告已经过去好些天了,今天开始陆续更新我自己在学习和使用Midjourney的过程中掌握的相关知识、经验心得、资源工具。因为个人精力和时间的原因,更新频率无法保证,但我会尽力将自己的所学所知全部分享出来,希望能帮助使用或正在学习Midjourney绘画的朋友们。
今天分享的是有关Midjourney的一些背景信息。
AI绘画
绘画是人类一门很古老的艺术门类,人类通过实体的器具、画笔、颜色、颜料等反映客观世界和表达主观世界。
而AI绘画则是通过借助计算机机器学习算法和模型来生成绘画作品,人类只需要输入满足一定规则和规范的自然语言指令。这让人类脱离了实体工具的限制,借助二进制0和1就能“自动”且“无中生有”生成惊艳的图片,充分释放想象力和创意。
AI绘画是AIGC(人工智能生成内容)的重要领域,借助AI,我们已经看到了不同模态(文本、图片、视频、音频等)的自动生成,这种内容形态的颠覆式技术已经并将极大地改变商业形态和日常生活。
AI绘画的基本原理
AI绘画主要基于扩散模型,这是一种机器学习模型,具体原理对于很多小白很难理解,实际上对于使用Midjourney影响不大,但对于极客类AI绘画爱好者,了解Midjourney底层原理则是必要的。
前一段时间,我大量查阅了国内国外的AI绘画原理的文档和视频,很多教程都在讲正向添加噪点与逆向去噪的原理,但具体细节目前我还不是特别清晰,也没有找到一种浅显易懂的方式来解释,后面我会单拎出来一篇来具体讲讲。
想要学习和专研的朋友可以参考如下资源:
【中文】
●YouTube【李宏毅】【生成式AI】淺談圖像生成模型 Diffusion Model 原理
https://www.youtube.com/watch?v=azBugJzmz-o
●YouTube【李宏毅】【生成式AI】Diffusion Model 原理剖析 (1/4) (optional)
https://www.youtube.com/watch?v=ifCDXFdeaaM
●B站【子牧说】你的文字是怎么变成图片的?-AI绘画底层原理拆解
https://www.bilibili.com/video/BV1nc411p7D9/
●YouTube【氪学家】Stable Diffusion绘画底层原理 用一颗桃树为你讲清楚 知识点:AI绘图原理 | Diffusion扩散模型 | 采样器 | 采样步数
https://www.youtube.com/watch?v=ng8kZWksFyg
●B站【大白话AI】 | 图像生成模型DDPM | 扩散模型 | 生成模型 | 概率扩散去噪生成模型
https://www.bilibili.com/video/BV1tz4y1h7q1/
●【腾讯云开发社区】AI绘画火了!一文看懂背后技术原理
https://cloud.tencent.com/developer/beta/article/2149699
【英文】
●【YouTube】【Vox】The text-to-image revolution, explained
https://www.youtube.com/watch?v=SVcsDDABEkM
●【YouTube】How AI Image Generators Work (Stable Diffusion / Dall-E) - Computerphile
https://www.youtube.com/watch?v=1CIpzeNxIhU&t=862s
●【YouTube】Diffusion Models | Paper Explanation | Math Explained
https://www.youtube.com/watch?v=HoKDTa5jHvg&t=623s
●【YouTube】How does Stable Diffusion work? – Latent Diffusion Models EXPLAINED
https://www.youtube.com/watch?v=J87hffSMB60
AI绘画的价值与应用前景
AI绘画目前的火热已经从专业领域扩散到普通用户,甚至有些狂热。就像我之前说过的那样,尝鲜期很容易兴奋,但当这一波“热恋期”过去,我们真正应该思考的是——AI绘画如何与我们的日常生活和工作相结合,尤其是深度结合的点,否则你会很容易丧失新鲜感和目标感,AI绘画水平也会无法提高。
就我个人的观察和实际体验来看,AI绘画的价值主要体现在:
●个人表达
主要体现在充当社交货币(通俗讲就是装X、炫耀)、兴趣探索、表达自己的思想和创意、实用价值(个人IP形象、配图)
●商业应用
将AI绘画用在具体的工业、商业实践中,比如运营、设计、产品等岗位的低频图片需要,比如电商、游戏等行业的高频批量级商业应用。
●创新研究
这一类主要是研究人员、算法工作者等借助AI绘画开展算法训练与研发以及衍生方向的创新性探索,比如视频是图片的帧变化,AI绘画可以给视频生成提供参考。
最后,AI绘画毕竟表现形式就是图片,图片如何在日常生活和工作中发挥作用,这是值得大家思考的问题。
我们常说“AI不会取代你,但会AI的人会取代你”,但AI生成的图片在我们日常生活中扮演什么角色?如果你是插画师和设计师,那么你要危机感很重,因为这是直接侵蚀你的专业领域,你需要掌握AI绘画来提高产出效率,成为那个掌握AI的人;如果你是一个内容创作者,那么你不必焦虑,AI绘画可以给你赋能,你不必花很多时间在免费图库网站上寻找配图,写几段提示词让AI生成就行。
说这些主要想表达,不必贩卖焦虑,AI对普通人的影响不是均匀的,影响范围和程度是有差异的,这需要你结合具体场景来判断;在学习AI绘画的时候,务必结合个人专业领域来学习,这回给你沉下来,给你提供专研的方向和差异化优势。
主流工具:Midjourney VS Stable Diffusion
AI绘画大概去年夏天就开始大热了,此后很多AI绘画工具和模型出现,但就我知道的就要:Midjourney、Stable DIffusion、DALL·E、Leonardo.Ai、Adobe Firefly、Bing Image Creator、 Scenario、Red Squid。但目前最流行的还是Midjourney与Stable Diffusion。
关于Midjourney与Stable Diffusion的比较,可以下图:
但二者的基本原理和操作相似度很高,学习任意一种都容易切入另一种,当然Stable Diffusion操作和规则相对复杂一些。
基于此,对于如果你电脑性能不够,想体验和学习AI绘画,那么Midjourney就是一个最好的选择。只要你提供一个简单的提示词,你就会得到一个足够惊艳的图片!
参考资料:
Midjourney vs Stable Diffusion: Which one should you pick?
https://stable-diffusion-art.com/midjourney-vs-stable-diffusion/
Midjourney及其背后的团队
Midjourney的创立与迭代
Midjourney 的创始人 David Holz 是一名连续创业者,大学就读于北卡罗来纳大学教堂山分校(University of North Carolina--Chapel Hill)学习物理学和数学,曾在NASA 和 Max Planck 攻读流体力学博士学位。
2008年 David Holz创办了一家名为 Leap Motion的VR公司,2013 年B轮融资后其估值达到了 3.06亿美元,但后来市场不达预期,2019 年以 3000 万美元的价格卖给竞争对手 英国公司Ultrahaptics。
2021 年 8 月,David Holz创立自筹资金的独立AI实验室Midjourney。
2022年3月,Midjourney发布Discord封闭内测版本。由于大获成功,GPU计算量庞大,次月,Midjourney开始限制内测人数增长并开启货币化(付费)。
2022年4月18日,Midjourney发布V2版本,允许邀请用户
2022年6月,Midjourney登上《经济学人》杂志封面
2022年8月,39岁游戏设计师艾伦(Jason M. Allen)通过Midjourney生成并经Photoshop润色的绘画作品《太空歌剧院》在美国科罗纳州博览会(Colorado State Fair)上获得“数字艺术/数字修饰照片”一等奖,引发舆论巨大关注和争议。
2022 年 11 月 Midjourney发布V4 版本。
2023年3月,Midjourney发布V5版本,5月4日发布V5.1版本
Midjourney的团队
根据公开信息,Midjourney 团队成员十分精简,也就11个人撑起了如此海量规模用户群,着实让人惊叹。
除了 CEO David Holz之外,还有 8 位研究与工程师,2 位财务与法务。除此之外,还有 4 位编外顾问,以及 60 位兼职 Discord 运营。
团队整体比较年轻,甚至还有多位今年5、6月份才毕业的大学生,负责财务的是Nadia Ali是团队中年纪最长的,也是Leap Motion的老员工(财务和运营副总裁)。
Midjourney的商业模式
Midjourney采用付费订阅的商业模式,订阅分三档:基础会员(年付费8美元/月)、标准会员(年付费24美元/月)、专业会员(年付费48美元/月),有博主测算Midjourney年入2.5亿美元收入。
据公众号“海外独角兽”报道,Midjourney的用户群包括C端个人消费者以及SMB中小企业;成本方面,Discord 会收取约 10% 的手续费,而模型训练成本以及其他成本目前不知,但公众号“海外独角兽”称“Midjourney 的毛利率约为 80%”。
用户数据方面,根据公开资料,Midjourney 的 Discord 拥有 1450 万注册会员,约有 110 万 (7.5%) 随时在线且活跃。
有人指出,Midjourney 的增长很大一部分归功于其在美版贴吧 Reddit 上的活跃社区,Midjourney subreddit 目前拥有超过 275,000 名成员。
参考资料
【the Verge】‘An engine for the imagination’: the rise of AI image generators——An interview with Midjourney founder David Holz
https://www.theverge.com/2022/8/2/23287173/ai-image-generation-art-midjourney-multiverse-interview-david-holz
【中译版】
想象力的引擎|AI图像生成的兴起:专访Midjourney 创始人David Holz
https://mp.weixin.qq.com/s/X6ztt9OAprgUuykIP4fqOg
推特博主:Aakash Gupta
Midjourney创始人大卫·霍尔兹
https://mp.weixin.qq.com/s/k6MFzvDjJBFFP2PcUFbBxA
Midjourney:AIGC现象级应用,一年实现1000万用户和1亿美元营收
https://mp.weixin.qq.com/s/HiRGY1U-NwKF8jNVL-qQOA
Midjourney Statistics: Users, Polls, & Growth [May 2023]
https://approachableai.com/midjourney-statistics/
Midjourney statistics (Updated: May 2023)
https://photutorial.com/midjourney-statistics/
利尔达科技集团 2024-12-20
深圳市智物通讯科技 2024-12-20
可爱小豆豆豆 2024-12-20
办文绿软 2024-12-20
计算机毕设编程指导师 2024-12-20