“一个运作良好的思想市场,培育宽容,将使中国经济的发展以知识为动力,更具可持续性,而更为重要的是,通过与多样性的现代世界相互作用和融合,这能使中国复兴。”——科斯
随着ChatGPT的火爆,带动了大家对于人工智能(AI)的关注,各种项目也如雨后春笋般蓬勃兴起。
对于ChatGPT还不熟悉的,可以先看这篇文章:
教程 | ChatGPT 完全上手指南
但是由于目前的AI项目过于杂乱,今天想通过一些分类方法,总结一下目前AI的赛道与工具。
在展开分类和正文之前,先把结论前置。
任何一项新的技术,在奇点到来之前,都还没有彻底取代旧的技术或者是进入大众的工作和生活。就好像收音机没有取代报纸,电视没有取代收音机,结果在汽车普及之后,电台反而在早晚高峰堵车的时候市占率回暖了。
AI也是一样,在一段时间内,都还只是提升人类工作效率的工具而已,而这个工具的使用和掌握,还是需要一些门槛的,那么能够更好地使用好这些工具的人,无疑工作效率要略高一些。在AI浪潮来临的时候,除了想想哪些股票和AI有关,怎么蹭上这个风口,怎么通过AI制服,不如先想想,怎么能够让这些工具更好地辅助自己的工作和生活。
画了一张小图:
这其中包括升维、平维与降维(姑且这样简单分类吧,没找到更好的分类方法)。
平维或升维:
文字到文字(Text to Text, T2T)
文字到语音(Text to Audio,T2A)
文字到图片(Text to Image, T2I)
文字到视频(Text to Video, T2V)
图片到图片(Image to Image, I2I)
图片到视频(Image to Video, I2V)
视频到视频(Video to Video, V2V)
降维:
目前降维的使用场景并不如平维或升维的多。可能比如说,一篇很长的文章,我想让AI帮我总结一下要点。一个很长的连续剧,我想让AI帮我总结一下有哪些启发等。
语音到文字(Audio to Text, A2T)
图片到文字(Image to Text,I2T)
图片到语音(Image to Audio, I2A)
视频到文字(Video to Text,V2T)
视频到语音(Video to Audio,V2A)
视频到图片(Video to Image,V2I)
这里说明一下,图片到视频和图片到动画的区别,
当然未来的AI,肯定都是集大成者,现在也有一些AI直接可以语音控制,而且文字到语音和语音到文字这个过程已经相对比较成熟了。那么如果达成了语音到文字和文字到图像,其实也就相当于打通了语音到图像。那么接下来就针对重点赛道分别介绍一下常用的工具,由于现在这类项目蓬勃展开,有缺失的,还希望大家留言补充。
一、文字到文字:
目前大火的ChatGPT,就属于文字到文字这一赛道。其实文字到文字是一切AI逻辑上的基础,通过理解人类的文字表达进行处理,这种技术细分叫自然语言处理(NLP)。
一文看懂自然语言处理-NLP(4个典型应用+5个难点+6个实现步骤)
当然这其中又可以细分为很多类,比如说文字到代码、文字润色、文字提炼和总结等等。
二、文字到图片:
学画画的老徐总结了六款AI生成图片的工具:
学画画的老徐
大学教师,退休后零基础学画。用自己的原创作品,与您分享我的习画历程、分享画家故事及名画欣赏。
公众号
介绍几款 AI 图片生成器:
这18个AI绘画工具,一定不要错过!
设计领域革命,全球人工智能绘画大盘点|动察
再选重点的介绍一下(排名分先后):
Midjourney
一些 Midjourney 的入门指南与绘画经验
目前Midjourney还只能通过Discord互动的形式实现。
2. Stable Diffusion
Stable Diffusion的入门介绍和使用教程
Stable Diffusion的优点是可以自己部署自己的AI,缺点是比较吃机器的性能。
1秒出图,全球最快的开源Stable Diffusion出炉
还有小白不会用stable diffusion?史上最全的stable diffusion环境配置指南
人工智能,丹青圣手,构建Stable-Diffusion-WebuiAI绘画教程(Python3.10/Pytorch1.13)
3. DALL·E 2
Dall·E 2是与ChatGPT同一公司OpenAI的产品。是一个AI图片生成器。
AI画图师- DALLE 2
Chatgpt+Dalle2到底有多强
4. DeepAI
吹爆这个AI,3秒钟完成黑白照片上色,就连素描画都可以
https://deepai.org/machine-learning-model/text2img
DeepAI好像在黑白图片上色方面比较出众。
5. ArtBreeder
Artbreeder只会捏脸?作品集成果图1分钟完成,这些工具网站别错过了!
https://www.artbreeder.com/
结语:做好了文字到文字、文字到语音、文字到图片,那么可能剩下的就简单了。关键是一些细节的处理,比如说现在的ChatGPT,也有胡诌的时候。想要用好工具的第一步,是得去——用。