HyperAI超神经

如何让ChatGPT等大型语言模型（LLM）回答特定数据源中的问题？答案在于一种称为检索增强生成（RAG）的技术。它能通过以下几个步骤使LLM更智能地处理你的文档、PDF、网站或企业知识。什么是RAG（检索增强生成）？ RAG技术通过从用户的数据中检索相关信息，增强语言模型的输入提示，最终生成与上下文相关的答案。简单来说，它为原本缺乏长期记忆的AI天才提供了“记忆”。 1. 数据摄入——加载你的文档首先，你需要将原始数据（如200页的PDF、整站内容等）转换成可以被LLM处理的文本格式。这可以通过使用不同类型的文档加载器来实现。常用的加载器包括： TextLoader：用于加载普通文本文件。 PyPDFLoader：专门处理PDF文件。 WebBaseLoader：可以从指定网站抓取内容。 WikipediaLoader：检索维基百科上的相关条目。 ArxivLoader：获取arXiv上的学术论文。加载器示例代码： ```python from langchain.document_loaders import TextLoader, PyPDFLoader, WebBaseLoader, WikipediaLoader, ArxivLoader 文本文件 text_loader = TextLoader("data/notes.txt") docs_text = text_loader.load() PDF文件 pdf_loader = PyPDFLoader("data/report.pdf") docs_pdf = pdf_loader.load() 网站 web_loader = WebBaseLoader("https://example.com/blog") docs_web = web_loader.load() 维基百科 wiki_loader = WikipediaLoader(query="Generative AI", load_max_docs=3) docs_wiki = wiki_loader.load() arXiv arxiv_loader = ArxivLoader(query="1706.03762", load_max_docs=2) docs_arxiv = arxiv_loader.load() ``` 2. 切分——将文本切分为小块由于LLM有令牌限制，直接输入整个文档可能会导致处理超时或失败。因此，需要将文本切分为更小的块，这些块称为“切片”。切片通常会有一些重叠，以保持上下文的连贯性。示例代码： ```python from langchain.text_splitter import RecursiveCharacterTextSplitter splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=100) chunks = splitter.split_documents(docs_pdf) # 或者任何加载的文档 ``` 3. 嵌入——将文本转换为数字嵌入是将文本转换为向量表示的过程，这样AI就能“理解”文本的含义。常用的嵌入模型包括OpenAI和Hugging Face提供的模型。示例代码： ```python from langchain.embeddings import OpenAIEmbeddings embedding_model = OpenAIEmbeddings(model="text-embedding-3-large") embeddings = embedding_model.embed_documents([chunk.page_content for chunk in chunks]) 调整向量维度 embeddings = OpenAIEmbeddings(model="text-embedding-3-large", dimensions=1024) 示例查询 text_query = "这是示例文本" result = embeddings.embed_query(text_query) 使用Hugging Face嵌入模型 from langchain_huggingface import HuggingFaceEmbeddings embeddings = HuggingFaceEmbeddings(model_name="all-MiniLM-L6-v2") text = "这是测试文档" query_result = embeddings.embed_query(text) ``` 4. 向量数据库——存储和搜索嵌入为了使应用具有“记忆”，你可以使用向量数据库如FAISS、Chroma、Weaviate或Pinecone。这些数据库允许基于语义相似性搜索文本。示例代码： ```python from langchain.vectorstores import FAISS vectorstore = FAISS.from_documents(chunks, embedding_model) 保存到磁盘 vectorstore.save_local("vector_index") ``` 5. 检索——为LLM获取相关上下文当用户提问时，检索器会从向量数据库中找到与问题最相关的几个切片，并将其传递给LLM，以便生成更有针对性的回答。示例代码： python retriever = vectorstore.as_retriever(search_kwargs={"k": 3}) 业内评价 RAG技术自推出以来，受到广泛好评。许多科技公司和研究机构认为，RAG不仅提高了LLM的实用性和准确性，还为企业提供了定制化应用的机会。特别是在处理大规模企业数据时，RAG能够确保生成的答案更加贴合用户的实际需求。公司背景 LangChain是一家专注于开发RAG及相关技术的公司，其工具和框架已经广泛应用于多个行业中。通过其高度模块化的库，开发者可以轻松构建复杂的AI应用，从而推动AI技术在各个领域的创新发展。

如何用RAG打造个性化的AI助手：从文档到智能问答的全流程指南

Related Links