今天分享的是AIGC系列深度研究报告:《AIGC专题:ChatGPT项目实战-理解真实业务场景中, ChatGPT的使用方式》。
(报告出品方:黑马程序员)
报告共计:63页
海量/完整电子版/报告下载方式:公众号《人工智能学派》
以一个人名为输入, 使用模型帮助我们判断它最有可能是来自哪一个国家的人名。
这在某些国际化公司的业务中具有重要意义, 在用户注册过程中, 会根据用户填写的名字直接给他分配可能的国家或地区选项, 以及该国家或地区的国旗, 限制手机号码位数等等。
以一个人名为输入, 使用模型帮助我们判断它最有可能是来自哪一个国家的人名, 这在某些国际化公司的业务中具有重要意义, 在用户注册过程中, 会根据用户填写的名字直接给他分配可能的国家或地区选项, 以及该国家或地区的国旗,限制手机号码位数等等。
用户注册过程中,会根据用户填写的名字直接给他分配可能的国家或地区选项等。
文本分类、文本摘要、问答系统、机器翻译、文本纠错等等。
文本分类问题。
数据获取:
如何读取数据?
模型构建与训练:
模型构建:RNN系列模型+全连接层;模型训练:模型预测值和真实值Loss;(计算损失,反向传播,梯度更新,模型保存)。
数据处理:
目的:将文本数据处理成符合模型输入的文本;文本张量化:将文本转化为符合模型输入x以及对应标签y(lucy---English);原因:人名属于短文,同时字母之间的联系不紧密(如:lucy,zhangsan) ;构建数据迭代器:将上一步数据源进一步封装,方便模型输入。
模型评估:
作用:检验模型效果 (实例化模型,加载保存模型,模型预测)。
数据获取,数据处理,模型构建与训练,模型预测,模型评估。
将文本数据处理成符合模型输入的文本采用的是文本张量化(字符张量化),通过onehot解决。
RNN(Recurrent Neural Network), 循环神经网络;一般以序列数据为输入;通过网络内部的结构设计有效捕捉序列之间的关系特征;一般也是以序列形式进行输出。
输入层,隐藏层,输出层; 每一个时间步的输入有2个;每一个时间步的输出有2个。
因为RNN结构能够很好利用序列之间的关系,因此针对自然界具有连续性的输入序列,如人类的语言,语音等进行很好的处理。
广泛应用于NLP领域的各项任务,如文本分类,情感分析,意图识别,机器翻译等。
循环神经网络。
针对自然界具有连续性的输入序列,进行很好的处理如人类的语言,语音等。
报告共计:63页
海量/完整电子版/报告下载方式:公众号《人工智能学派》