当前位置：首页|资讯|GPT-4|ChatGPT

非专业的AI 前沿技术理解与思考（一）

作者：yoda_asuka发布时间：2023-12-21

RAG (Retrieval-Augmented Generation) 检索增强生成

这里使用gpt4来阅读论文，帮助我们理解最近爆火的RAG

RAG ，最早来源于Facebook 2020年的一篇论文 Retrieval-Augmented Generation forKnowledge-Intensive NLP Tasks。

首先基于ResearchGPT（需要chatgpt plus）来了解RAG的核心原理：通过检索来增强生成效果:

ResearchGPT的回答（来源于多个论文的摘要），回答均标注引用来源

接着分析本篇论文，使用prompt优化工具promptperfect，得出完善的prompt

上传论文，prompt gpt来总结

实验部分总结的不太好，继续prompt

简单概括，RAG解决的问题即如何让语言模型使用外部知识（向量化的文本，图像，甚至视频）进行生成，来降低大模型知识更新的成本（没有RAG，每次知识更新都需要重新微调，训练）、提高知识密集型任务（例如编程文档问答）的准确性，真实性。

RAG流程架构

论文的核心思路

让gpt来分析一下

完整的RAG需要 LLM (gpt4等) + 外部知识存储（外部知识通过embedding模型vector化后，存储到向量数据库(chroma等)）+ 当前问题对应外部知识的召回（检索）

总结工作流程如下：

接收查询：对于一个给定的查询（如一个问题或者要验证的事实），RAG模型首先接收这个输入。
查询编码：通过查询编码器将输入查询转换成一个查询向量。
文档检索：使用最大内积搜索（MIPS）或其他算法，检索器在一个预建立的文档索引中查找与查询向量最相关的文档。
生成预测：选取的文档作为上下文，连同查询一起输入到生成器中(即通过prompt喂给llm)。生成器负责基于这些信息产生一个输出，如回答一个问题或生成文本。
边缘化：对于检索到的不同文档，模型将这些文档视为潜在变量，然后对生成器给定不同文档时的预测结果进行边缘化，对检索到的不同文档进行整合，从而产生最终预测。在RAG模型中，边缘化有助于提高答案的准确性和丰富性，因为它允许模型不仅仅依赖单一的文档，而是综合多个文档的信息来生成答案。这种方法特别适用于那些需要广泛知识和多个信息源来生成准确回答的复杂问题。
端到端训练：整个模型从查询编码到生成预测的过程是可微的，并通过反向传播算法进行训练。

推荐体验

相关资讯

有关ChatGPT的一些非专业认知

当然，更是因为AI行业的极致开放，AI研究没有秘密可言，这才让AI技术发展迅速，日新月异在这里不是形容词，一些榜单成绩的刷新甚至以天来计算。可以确定地说，中国版的ChatGPT的推出只是时间问题，几个月或者最…

虎嗅APP 2023-02-09

（非专业娱乐向）AI辅助写作的未来？

有些人可能已经知道了，novelai大概在年底之前会出一个媲美chatgpt（仅仅是这么一说，我不能确定他们真的能做到）无过滤模型，大家大概已经看过chatgpt写的东西是怎么个效果了，我试着分析一下chatgpt写作的缺点和“理想”状态下的同参数无过滤模型可能改进的东西。情感通过微调或许可以让同参数的模型不那么“理中客”，写出更富有情感的文章，但我们没怎么过见那样大的无过滤模型（有个可以用群计算运行的花瓣模型，但质量非常差），潜力有多大是个未知数。创意我相信这一点上，无过滤模型可以显著解放自己的联想能力

魔蓝_magicblue 2023-04-10

解读：2023年科技与IT行业最新前沿技术

2023年科技与IT行业最新前沿技术，其中包括但不限于人工智能（AI）、区块链技术、云计算、5G技术、物联网、边缘计算、量子计算、人机交互、自动化测试、块链与物联网的结合、无人驾驶技术、人脸识别技术、虚拟助理技术、AI集成开发环境、语音翻译技术、数字孪生技术等前沿技术。解读：2023年科技与IT行业最新前沿技术1. 人工智能（AI）：AI是近年来互联网领域最热门的技术之一，包括机器学习、自然语言处理、计算机视觉等领域。它已被广泛应用于行业如医疗、金融、制造等，并且在未来的发展中仍有巨大的潜力。人工智能（A

人工智能医疗金融机器学习

互联网研学社 2023-04-20

ChatGPT推出视频通话及屏幕理解功能，近屿智能邀您共探AI前沿技术

北京时间12月13日凌晨，OpenAI在第六天直播活动中宣布为 ChatGPT 的高级语音模式带来视频输入和屏幕理解功能，同时，为了迎接即将到来的圣诞节，OpenAI还限时推出了充满节日氛围的圣诞老人模式。 [图片] 直播一开始，几位团队成员便借由ChatGPT最新推出的高级语音模式中的实时视频通话特性，向遍布全球的观众热情地挥手致意。追溯ChatGPT的成长轨迹，之前引入的DAN模式（意为“即刻行动”）已彰显出极高的类人化特征，不仅实现了低延迟沟通，还能精准模拟人类说话时的情感语气。如今，ChatGPT

bili_51686386460 2024-12-13

卢菁多模态大模型LLM与AIgc前沿技术实战

特征提取：视觉的提取，大多用的是Faster R-CNN： 1.1 直接提取视觉向量； 1.2 进行目标检测，输出bounding box和对应位置； 1.3 进行目标检测，提取类别特征。潜在问题：提取的信息有冗余和噪音，对下游任务有益的视觉信息没有被有效提取，和对应的文本信息有语义鸿沟，不好做视觉-文本对齐等。文本一般会用BERT或者Roberta做初始化，大规模训练集会从头开始训练。 Early fusion：特征提取后，一般是直接concat，进入transformer； Late f

拼课找me-起飞 2024-01-25

近期资讯

七彩虹首次杀入固态U盘！1秒传1GB文件、1TB只要439元

快科技12月31日消息，近些年来，七彩虹的产品版图不断拓宽，尤其是在游戏本、存储领域收获颇丰，现在又发布了旗下首款高速固态U盘，型号为“SC600K PRO”。这款固态U盘属于七彩虹定

上方文Q 2024-12-31

降温狂促真维斯三合一冲锋外套+加绒加厚冲锋裤：券后99元

阿里自营店【淘宝内购会】真维斯三合一冲锋外套日常售价为 199.9 元，加绒加厚冲锋裤日常售价为 99.9 元，各加入购物车一件后，领取 200 元优惠券，到手价为 99.8 元 2 件。购买链接：淘宝(

2024-12-31

B站跨年晚会节目单出炉：《黑神话》音乐演出来了

快科技12月31日消息，还剩最后几小时，2024年就将远去，各大卫视、网络视频平台也将在今晚举办跨年晚会。据了解，2024年B站（哔哩哔哩）跨年晚会将在今晚19:30举办，目前节目单已经出炉。在

拾柒 2024-12-31

《射雕英雄传》电影六大人物海报：武林绝技出神入化

今日(12月31日)电影《射雕英雄传：侠之大者》六大人物海报发布。各路英豪齐聚一堂，武林绝技，出神入化。除了由肖战饰演的郭靖与庄达菲扮演的黄蓉，还包括欧阳锋、华筝、大汗以及托雷等角色

2024-12-31

去哪儿CEO陈刚新年信：“卷得赢也躺得平” 春节放假11天

快科技12月31日消息，2024嗖的一声即将丝滑地结束，今天下午，去哪儿CEO陈刚给“小驼们”发新年信回顾一年来所取得的成绩。陈刚在新年信中表示，今年旅游业挺卷的，但去哪儿的业绩挺

秋白 2024-12-31

北京集中治理大数据杀熟等问题对美团、百度调研座谈

快科技12月31日消息，据“网信北京”公众号，近期，按照中央网信办等四部门联合发布的“清朗·网络平台算法典型问题治理”专项行动有关工作部署，北京市委网信办牵头

拾柒 2024-12-31

荣耀笔记本X14 2025战斗版首发3299元：13代i5+金属机机身

快科技12月31日消息，荣耀笔记本X14 2025战斗版目前已经上架，首发3299元。据悉，新款笔记本采用超轻薄金属机身，薄至16.5mm，重量仅有1.4kg。屏幕为14寸IPS雾面屏，1920*1200分辨率，60H

鹿角 2024-12-31

东航第10架C919交付入列：机身涂装“闪耀中国红”

快科技12月31日消息，今日，中国东航第10架C919身披央视新闻“闪耀中国红”涂装正式入列。上午9时59分，这架C919执行MU500调机航班，从上海浦东国际机场起飞，10时14分抵达上海虹桥

建嘉 2024-12-31

骁龙8s Elite最强劲敌联发科新U性能激进：仅次于天玑9400

快科技12月31日消息，博主数码闲聊站爆料，联发科将在2025年上半年推出全新的旗舰平台天玑9350，它可以看作是天玑9300+的升级版，由一加手机搭载，硬刚同期上市的骁龙8s Elite处理器。据悉，天

振亭 2024-12-31

怪不得有的车厘子会红到发黑：背后原因揭开

12月31日消息，据媒体报道，车厘子虽然吃起来甜，但总含糖量不算高，约为12.8克/100克，由于其中约5.3克为果糖，口感才会偏甜，车厘子的升糖指数只有22，比苹果（36）、梨（36）和葡萄（43）等绝

振亭 2024-12-31

推荐体验

AIGC重要产品

AI对话：类ChatGPT产品体验

好用的AI绘画工具

火热的AIGC产品

AIGC近期要闻

大公司发布的大模型产品都有哪些？

政府对AIGC的扶持政策

AIGC对就业的影响：我们会失业吗？

AIGC产业影响

AIGC对内容创作的影响

AIGC对绘画设计领域的影响

AIGC对各行各业的影响

意见反馈

Copyright © 2026 aigcdaily.cn 北京智识时代科技有限公司版权所有京ICP备2023006237号-1