LLM 幻觉现象及 RAG 解决方案

张开发

• 2026/6/4 11:08:11 • 15 分钟阅读

分享文章

1. RAG 简介RAG, 检索增强生成 (Retrieval-Augmented Generation.将外部知识检索与 LLM 生成结合起来。当用户提问时系统先从一个外部知识库中检索相关文档片段然后将这些片段作为“ 上下文” 输入给 LLM再回答。应用场景有企业智能客服基于产品手册、FAQ法律/医疗咨询助手基于法规条文、临床指南内部知识库问答系统2. LLM 的幻觉等局限性LLM 的局限性:幻觉Hallucination一些回答看似合理但有事实性错误。缺乏新知识: 如 GPT-4 知识截止于 2023 年无法获取之后的新信息。无法访问私有数据比如想给些例子作 few-shot, 能检索专有样例会更好.这些即 RAG 的必要性.其中幻觉(hallucination) 问题比较重要, 即回答中有编造成分或错误.例子: 比如问 “tensorflow 1.12 版本有 xxx 这个api 么”, 模型回答 “有”, 其实没有.原因训练语料质量低, 本身有错误答案存在.LLM 的训练并不关注 “事实是否正确”, 自然不能保证生成答案一定符合事实.推断期间引入错误,3. RAG 方案LLM 有表达力但不可信单纯查数据库又太死板无法理解自然语言RAG 恰好填补了这道鸿沟。步骤为:用户提问Query检索用向量搜索 / 关键词搜索从知识库里找到 Top-K 条相关内容Chunks合成 Prompt把原有系统提示用户输入检索到的知识拼成一个新的输入送给 LLM 输出答案流程简介将文本分块然后使用一些 Transformer Encoder 模型将这些块嵌入到向量中将所有向量放入索引中最后创建一个 LLM 提示告诉模型根据我们在搜索步骤中找到的上下文回答用户的查询。未来趋势:与 Agent 结合RAG LLM 工具调用真正的“AI 助理”3.1 索引构建[原始文档]↓ 分块Chunking → 将大文档切分为小段落如每段 256 token↓ 向量化Embedding → 用嵌入模型将每个文本块转为向量vector↓️ 存入向量数据库Vector DB → 建立可搜索的索引分块Text Chunking最简单的是固定长度分块. 推荐使用 LangChain 中的 RecursiveCharacterTextSplitter支持智能断句。向量化Embedding使用预训练的语言模型将文本转换为高维向量通常是 384~1024 维使得语义相似的文本在向量空间中距离更近。比如 “苹果公司发布了新 iPhone” 和 “Apple 发布了新款手机” 虽然字面不同但在向量空间中会很接近。向量数据库Vector Database存储所有文本块的向量并支持高效的近似最近邻搜索Approximate Nearest Neighbor, ANN。常见的有 Chroma, FAISS 等.3.2 索引查询用户提问 → 同样用相同模型向量化问题↓ 相似度匹配 → 在向量空间中找最近邻k-NN↓✅ 返回 top-k 最相关文本片段 → 输入给 LLM 生成答案相似匹配通常用余弦相似度.4. 检索结果回写 promptPrompt 指令上下文检索结果问题一个典型的 RAG 增强后的 Prompt 结构如下【系统指令】你是一个智能助手。请根据以下提供的参考资料回答问题。如果信息不足以回答请说“无法确定”。【参考资料】 1. {检索到的文本片段1} 2. {检索到的文本片段2} 3. {检索到的文本片段3} 【问题】 {用户提问} 【回答】

更多文章

前端开发 2026/6/4 11:07:46

Bifrost：三星固件处理的跨平台工具解决方案

Bifrost：三星固件处理的跨平台工具解决方案【免费下载链接】SamloaderKotlin 项目地址: https://gitcode.com/gh_mirrors/sa/SamloaderKotlin 在三星设备的维护与开发过程中，固件管理始终是核心环节。无论是官方系统更新、自定义ROM开发还是设备…

张开发

前端开发 2026/6/4 11:07:17

探索开源代码解释器：OpenCodeInterpreter

探索开源代码解释器：OpenCodeInterpreter 【免费下载链接】OpenCodeInterpreter OpenCodeInterpreter is a suite of open-source code generation systems aimed at bridging the gap between large language models and sophisticated proprietary systems like t…

张开发

前端开发 2026/6/4 11:06:44

HTML5语义化元素完全解析：提升SEO与可访问性的最佳实践

HTML5语义化元素完全解析：提升SEO与可访问性的最佳实践【免费下载链接】awesome-html5 :memo: A curated list of awesome HTML5 resources 项目地址: https://gitcode.com/gh_mirrors/aw/awesome-html5 HTML5语义化元素是现代Web开发的核心技术&#xff0c…

张开发

前端开发 2026/6/4 11:07:39

如何快速上手 Electron Webpack Dashboard：10分钟完成安装与配置

如何快速上手 Electron Webpack Dashboard：10分钟完成安装与配置【免费下载链接】electron-webpack-dashboard Electron Desktop GUI for Webpack Dashboard 项目地址: https://gitcode.com/gh_mirrors/el/electron-webpack-dashboard 想要提升你的 Webpack…

张开发

前端开发 2026/6/2 15:47:29

揭秘SQLFlow核心架构：从SQL到Kubernetes工作流的无缝转换全指南

揭秘SQLFlow核心架构：从SQL到Kubernetes工作流的无缝转换全指南【免费下载链接】sqlflow Brings SQL and AI together. 项目地址: https://gitcode.com/gh_mirrors/sq/sqlflow SQLFlow是一个将SQL与AI完美融合的强大工具，它允许用户直接使用SQL语…

张开发

前端开发 2026/6/2 21:03:43

BepuPhysics2快速入门：10分钟搭建你的第一个物理仿真场景

BepuPhysics2快速入门：10分钟搭建你的第一个物理仿真场景【免费下载链接】bepuphysics2 Pure C# 3D real time physics simulation library, now with a higher version number. 项目地址: https://gitcode.com/gh_mirrors/be/bepuphysics2 想要在C#项目中实…

张开发

前端开发 2026/6/2 21:04:39

NES.css性能对比：轻量级框架的加载速度终极测试指南

NES.css性能对比：轻量级框架的加载速度终极测试指南【免费下载链接】NES.css NES-style CSS Framework | ファミコン風CSSフレームワーク项目地址: https://gitcode.com/gh_mirrors/ne/NES.css NES.css作为一款独特的8位像素风格CSS框架，以其复…

张开发

前端开发 2026/6/2 21:04:23

3分钟掌握Mem Reduct：让你的Windows内存管理说中文

3分钟掌握Mem Reduct：让你的Windows内存管理说中文【免费下载链接】memreduct Lightweight real-time memory management application to monitor and clean system memory on your computer. 项目地址: https://gitcode.com/gh_mirrors/me/memreduct 还在为…

张开发

前端开发 2026/6/2 21:06:34

终极指南：探索DreamBerd中Int9与Int99类型的二进制整数表示及应用

终极指南：探索DreamBerd中Int9与Int99类型的二进制整数表示及应用【免费下载链接】GulfOfMexico perfect programming language 项目地址: https://gitcode.com/GitHub_Trending/dr/GulfOfMexico GitHub推荐项目精选（dr/GulfOfMexico&#xff09…

张开发

前端开发 2026/6/2 21:03:46

Seldon Core 2性能调优终极指南：10个关键指标提升推理速度300%

Seldon Core 2性能调优终极指南：10个关键指标提升推理速度300% 【免费下载链接】seldon-core An MLOps framework to package, deploy, monitor and manage thousands of production machine learning models 项目地址: https://gitcode.com/gh_mirrors/se/seldon…

张开发

前端开发 2026/6/2 20:54:41

5G NR物理层控制信令实战：从PDCCH盲解码到DCI格式解析

5G NR物理层控制信令实战：从PDCCH盲解码到DCI格式解析在5G新空口（NR）系统中，物理层控制信令是实现高效资源调度和可靠数据传输的核心机制。作为无线通信协议栈开发工程师和网络优化人员，深入理解PDCCH盲解码机制、COR…

张开发

前端开发 2026/6/2 20:54:41

解锁AlienFX Tools：Alienware设备个性化控制完全指南

解锁AlienFX Tools：Alienware设备个性化控制完全指南【免费下载链接】alienfx-tools Alienware systems lights, fans, and power control tools and apps 项目地址: https://gitcode.com/gh_mirrors/al/alienfx-tools 想要摆脱官方软件的束缚，实…

张开发

LLM 幻觉现象及 RAG 解决方案

最新文章

别再为SaaS多租户数据隔离头疼了！用MyBatis-Plus Dynamic-Datasource 3.3.1，5分钟搞定SpringBoot多数据库切换

2026届毕业生推荐的降AI率方案推荐

Real-Anime-Z部署教程：Linux服务器一键拉起7860端口WebUI服务

2026届毕业生推荐的十大降AI率工具解析与推荐

告别杂乱点云：PCDViewer地面滤波与智能标注功能详解（附城区车载点云处理实例）

#VCS# 编译选项+vcs+initreg+random实战解析：从后仿困境到高效验证

推荐文章

相关文章

分享文章

更多文章

Bifrost：三星固件处理的跨平台工具解决方案

探索开源代码解释器：OpenCodeInterpreter

HTML5语义化元素完全解析：提升SEO与可访问性的最佳实践

如何快速上手 Electron Webpack Dashboard：10分钟完成安装与配置

揭秘SQLFlow核心架构：从SQL到Kubernetes工作流的无缝转换全指南

BepuPhysics2快速入门：10分钟搭建你的第一个物理仿真场景

NES.css性能对比：轻量级框架的加载速度终极测试指南

3分钟掌握Mem Reduct：让你的Windows内存管理说中文

终极指南：探索DreamBerd中Int9与Int99类型的二进制整数表示及应用

Seldon Core 2性能调优终极指南：10个关键指标提升推理速度300%

5G NR物理层控制信令实战：从PDCCH盲解码到DCI格式解析

解锁AlienFX Tools：Alienware设备个性化控制完全指南