从“NLP技术”到“AI大模型”

作者：人人都是产品经理发布时间：2024-05-08

自从AI大模型问世以来，仿佛很少有人提及NLP技术这个词了。昨天休息的时候突然在想一个问题，AI大模型已经如此强大了，还需要传统的NLP技术吗？

传统的NLP技术指：从分词（ws）、词性标注（pos）、命名实体识别（ner）、依存句法分析（dp）、语义角色标注（srl）等过程。

传统的NLP技术主要应用一些基于规则、统计学的机器学习模型来实现。而AI大模型核心是基于词嵌入技术来进行实现，相当于是一种暴力解题的方式，通过超大规模参数来达到模型涌现的能力。

二者最核心的区别在于2个：一个是训练所需的数据不在同一个一个数量级上，传统的NLP技术处理的更多的是企业内部定向任务的数据，而AI大模型则应用全网数据来实现；另一个则是在技术实现的抽象层次不同。

NLP技术是直接应用人力可以理解的语言规则来实现；而AI大模型则是将语言规则抽象成向量，然后通过深度神经网络来进行训练，在神经网络中面对抽象后的高维向量，人力已无法理解，这也是AI大模型的解释性比较差的原因。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

在让机器理解人类语言这件事儿上，现在看来可以划分为2个阶段：NLP技术阶段、和AI大模型阶段，每个阶段都有其独特的技术特点和里程碑事件。以下是这两个阶段的技术演变过程的详细梳理。

一、传统NLP技术阶段

1. 早期方法（1950s – 1990s）

早期的NLP主要依赖于规则-based的方法和基于词典的系统。技术包括语法分析、模式匹配、关键词提取等。

2. 统计学习方法的兴起（1990s – 2000s）

统计学习方法开始应用于NLP，如隐马尔可夫模型（HMM）和条件随机场（CRF）。这些方法能够处理序列数据，并且对标记数据的需求较少。

3. 浅层和深层学习（2000s – 2010s）

特征工程和机器学习方法（如支持向量机SVM）在这一时期得到了广泛应用。出现了一些重要的NLP任务，如情感分析、命名实体识别、机器翻译等。

4. 语义角色标注和语义解析（1998 – 2000s）

FrameNet和语义角色标注的提出，推动了浅层语义解析的发展。共享任务和评估标准（如CoNLL）促进了核心NLP任务的研究。

二、AI大模型阶段

1. 词嵌入的革命（2013年前后）

Word2Vec和GloVe等词嵌入技术的提出，使得NLP能够更好地捕捉词汇的语义信息。词嵌入技术的出现为后续的深度学习模型奠定了基础。

2. 神经网络的突破（2013年 – 2014年）

循环神经网络（RNN）、卷积神经网络（CNN）、长短期记忆网络（LSTM）开始应用于NLP任务。这些网络能够捕捉文本数据中的序列特征和局部依赖关系。

3. 预训练语言模型的兴起（2018年前后）

BERT、GPT、XLNet等预训练语言模型的出现，极大地推动了NLP技术的发展。这些模型通过在大规模文本数据上进行预训练，学习到了丰富的语言表示。

4. Transformer架构的普及（2017年 – 至今）

Transformer架构的提出，特别是在BERT和GPT系列模型中的应用，成为了NLP领域的核心技术。Transformer能够有效处理长距离依赖问题，并且支持多任务学习和迁移学习。

5. 大模型的挑战与创新（2022年代）

大模型虽然在多个NLP任务上取得了显著的性能提升，但也面临着诸如可解释性、偏见、伦理和隐私等挑战。研究人员和开发者正在探索如何设计和训练更加安全、可控和可解释的大模型。

三、总结

传统的NLP技术是人类探索机器理解自然语言的一个过程，如果没有这个过程，那么后面的词嵌入、预训练模型、以及AI大模型可能就不会诞生了，正是由于传统NLP技术在应用层的惰性，才激发了研究人员的新思考，做出重大突破。

所以，回到文初的那个问题：AI大模型已经如此强大了，还需要传统的NLP技术吗？

当然如果你是从事应用层工作的人员，个人觉得不需要再去研究传统的NLP技术了，直接从词嵌入阶段开始了解即可。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

而如果你是偏科研方面的工作人员，则非常有必要去研究一下，传统的NLP技术，知其因，才能更好的解其果，这是奠定科研工作的基础。‍‍‍‍‍‍‍‍‍

本文由人人都是产品经理作者【长弓PM】，微信公众号：【AI产品经理社】，原创/授权发布于人人都是产品经理，未经许可，禁止转载。

题图来自Unsplash，基于 CC0 协议。

相关资讯

猎云网 2023-11-03

从预训练模型到微调：使ChatGPT适应您自己的NLP任务

ChatGPT是一种预训练语言模型，它在自然语言处理领域中有着非常广泛的应用。但是，在处理特定的NLP任务时，使用预训练模型并不总是能够得到最佳性能。因此，微调技术可以帮助您使ChatGPT适应您自己的NLP任务。本文将介绍如何从预训练模型到微调ChatGPT，并提供示例代码。1. 预训练模型ChatGPT是基于Transformer架构的预训练语言模型。在使用ChatGPT进行微调之前，您需要先选择一个合适的预训练模型，并使用Transformers库和Tokenizer类将文本进行编码以转换为模型可以

ChatGPT 编程

山城程序猿 2023-03-06

2024大模型之战：从技术浪漫到落地求生

AI大模型技术商业化探索与竞争加剧。

AI大模型

中国企业家杂志 2024-10-08

从“NLP技术”到“AI大模型”

推荐体验

相关资讯

免费下载，NLP入门书籍《掌握NLP：从基础到大语言模型》

【NLP从入门到大模型】4.图解GPT2

APUS大模型：从AI技术中来，到应用中去

从预训练模型到微调：使ChatGPT适应您自己的NLP任务

2024大模型之战：从技术浪漫到落地求生

近期资讯

国科微8K超高清芯片获“音视频领域关键技术突破一等奖”

一加平板发布：11.6 英寸 LCD 屏、天玑 8350，首发价 1999 元起

荣耀Magic7系列升级大王影像后，荣耀罗巍称手机拍照只有2家友商可比

199元！特斯拉Bot人形机器人开售即抢光：二手平台溢价超百元

性能新突破，一加Ace5值得买吗：第三代骁龙8+6400mAh，仅2299元

无人机飞上飞下，“这里是‘未来世界’的起点。”

我国首个国家级海上风电研究与试验检测基地传动链平台建成投运

站在风口的AI玩具：价格不菲仍卖爆，是儿童“新宠”还是智商税

机构：折叠屏增速放缓华为保持领先地位

苏州易来科得申请多层涂布的降阶模型电化学仿真专利，解决传统模型无法仿真的问题

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响