RAG(检索增强生成)是一种融合了信息检索和自然语言生成的新一代语言模型技术。其核心理念在于利用海量文本知识库增强语言模型的知识获取能力,从而能够根据给定的问题或上下文,生成更加丰富、准确和连贯的自然语言文本。RAG通过对海量文本数据进行编码构建索引,根据用户的输入检索出最相关的知识片段,并将其作为额外的输入传递给语言生成模型,指导模型生成更加知识驱动的输出。相比传统的纯生成式模型或纯检索式模型,RAG能够兼顾知识的广度和生成的灵活性,在知识密集型任务如问答、对话、摘要等方面取得了显著的性能提升。