人工智能（AI）的赛道与工具

作者：奥尔特云云发布时间：2023-03-07

人工智能 ChatGPT

“一个运作良好的思想市场，培育宽容，将使中国经济的发展以知识为动力，更具可持续性，而更为重要的是，通过与多样性的现代世界相互作用和融合，这能使中国复兴。”——科斯

随着ChatGPT的火爆，带动了大家对于人工智能（AI）的关注，各种项目也如雨后春笋般蓬勃兴起。

对于ChatGPT还不熟悉的，可以先看这篇文章：

教程 | ChatGPT 完全上手指南

但是由于目前的AI项目过于杂乱，今天想通过一些分类方法，总结一下目前AI的赛道与工具。

在展开分类和正文之前，先把结论前置。

任何一项新的技术，在奇点到来之前，都还没有彻底取代旧的技术或者是进入大众的工作和生活。就好像收音机没有取代报纸，电视没有取代收音机，结果在汽车普及之后，电台反而在早晚高峰堵车的时候市占率回暖了。

AI也是一样，在一段时间内，都还只是提升人类工作效率的工具而已，而这个工具的使用和掌握，还是需要一些门槛的，那么能够更好地使用好这些工具的人，无疑工作效率要略高一些。在AI浪潮来临的时候，除了想想哪些股票和AI有关，怎么蹭上这个风口，怎么通过AI制服，不如先想想，怎么能够让这些工具更好地辅助自己的工作和生活。

画了一张小图：

这其中包括升维、平维与降维（姑且这样简单分类吧，没找到更好的分类方法）。

平维或升维：

文字到文字（Text to Text, T2T)

文字到语音（Text to Audio，T2A）

文字到图片（Text to Image, T2I）

文字到视频（Text to Video, T2V）

图片到图片（Image to Image, I2I）

图片到视频（Image to Video, I2V）

视频到视频（Video to Video, V2V）

降维：

目前降维的使用场景并不如平维或升维的多。可能比如说，一篇很长的文章，我想让AI帮我总结一下要点。一个很长的连续剧，我想让AI帮我总结一下有哪些启发等。

语音到文字（Audio to Text， A2T）

图片到文字（Image to Text，I2T）

图片到语音（Image to Audio, I2A)

视频到文字（Video to Text，V2T)

视频到语音（Video to Audio，V2A)

视频到图片（Video to Image，V2I）

这里说明一下，图片到视频和图片到动画的区别，

当然未来的AI，肯定都是集大成者，现在也有一些AI直接可以语音控制，而且文字到语音和语音到文字这个过程已经相对比较成熟了。那么如果达成了语音到文字和文字到图像，其实也就相当于打通了语音到图像。那么接下来就针对重点赛道分别介绍一下常用的工具，由于现在这类项目蓬勃展开，有缺失的，还希望大家留言补充。

一、文字到文字：

目前大火的ChatGPT，就属于文字到文字这一赛道。其实文字到文字是一切AI逻辑上的基础，通过理解人类的文字表达进行处理，这种技术细分叫自然语言处理（NLP）。

一文看懂自然语言处理-NLP（4个典型应用+5个难点+6个实现步骤）

当然这其中又可以细分为很多类，比如说文字到代码、文字润色、文字提炼和总结等等。

二、文字到图片：

学画画的老徐总结了六款AI生成图片的工具：

学画画的老徐

大学教师，退休后零基础学画。用自己的原创作品，与您分享我的习画历程、分享画家故事及名画欣赏。

公众号

介绍几款 AI 图片生成器：

这18个AI绘画工具，一定不要错过！

设计领域革命，全球人工智能绘画大盘点｜动察

再选重点的介绍一下（排名分先后）：

Midjourney

一些 Midjourney 的入门指南与绘画经验

目前Midjourney还只能通过Discord互动的形式实现。

2. Stable Diffusion

Stable Diffusion的入门介绍和使用教程

Stable Diffusion的优点是可以自己部署自己的AI，缺点是比较吃机器的性能。

1秒出图，全球最快的开源Stable Diffusion出炉

还有小白不会用stable diffusion？史上最全的stable diffusion环境配置指南

人工智能,丹青圣手,构建Stable-Diffusion-WebuiAI绘画教程(Python3.10/Pytorch1.13)

3. DALL·E 2

Dall·E 2是与ChatGPT同一公司OpenAI的产品。是一个AI图片生成器。

AI画图师- DALLE 2

Chatgpt+Dalle2到底有多强

4. DeepAI

吹爆这个AI，3秒钟完成黑白照片上色，就连素描画都可以

https://deepai.org/machine-learning-model/text2img

DeepAI好像在黑白图片上色方面比较出众。

5. ArtBreeder

Artbreeder只会捏脸？作品集成果图1分钟完成，这些工具网站别错过了！

https://www.artbreeder.com/

结语：做好了文字到文字、文字到语音、文字到图片，那么可能剩下的就简单了。关键是一些细节的处理，比如说现在的ChatGPT，也有胡诌的时候。想要用好工具的第一步，是得去——用。

相关资讯

UltimaMarkets（um）人工智能赛道风云：2024 年末的激烈博弈与挑战

2024年最后两个月，人工智能赛道竞争激烈，OpenAI和软银追加投资，马斯克推出xAI融资，人工智能领域资本热度高涨。

人工智能 OpenAI 融资马斯克

你不知道的新鲜事 2024-12-19

人工智能水印技术入门：工具与技巧

近几个月来，我们看到了多起关于“深度伪造 (deepfakes)”或人工智能生成内容的新闻报道：从泰勒·斯威夫特的图片、汤姆·汉克斯的视频到美国总统乔·拜登的录音。这些深度伪造内容被用于各种目的，如销售产品、未经授权操纵人物形象、钓鱼获取私人信息，甚至制作误导选民的虚假资料，它们在社交媒体平台的迅速传播，使其具有更广泛的影响力，从而可能造成持久的伤害。在本篇博文中，我们将介绍 AI 生成内容加水印的方法，讨论其优缺点，并展示 Hugging Face Hub 上一些可用于添加/检测水印的工具。什么是

人工智能 Hugging Face

HuggingFace 2024-02-28

长沙晚报 2023-02-12

人工智能（AI）的赛道与工具

推荐体验

相关资讯

UltimaMarkets（um）人工智能赛道风云：2024 年末的激烈博弈与挑战

人工智能水印技术入门：工具与技巧

Xbox与Inworld AI合作构建人工智能游戏开发工具

人工智能赛道，算力先行

长沙，人工智能赛道未来可期

近期资讯

这十年，吃谷阵地的大变迁

聊聊数据湖、数据仓库和 Lakehouse

百年“老字号”靠AI上市，IPO估值10亿美元

2024年十大网红城市：10种爆火，背后都有高人

回顾2024年，谈谈社交产品的2025

「始祖猫」「BB男装」引领平替风潮，滑雪服“卷”向百元时代

两天两起安全事件，韩国将全面检查101架737-800机型

江苏老乡为什么从喝洋河，改喝今世缘？

小米与蔚小理结盟背后：车圈补能热战正酣，能源公司才是终极赢家

宋仲基代言的药妆品牌要被卖了

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响