【RAG 入门】简单实现 RAG

参考教程：ollama-rag：60行代码实现一个基于Ollama的RAG系统

预备知识

RAG 系统架构

简化实现：

Embedding 模型使用的是 Ollama 提供的文本转向量服务；
向量库使用的是 faiss 而不是 PostgreSQL；
LLM 模型使用的也是 Ollama 提供的大模型服务。

Ollama 模型下载

1 2	`ollama pull nomic-embed-text:latest # 文本转向量的模型 ollama pull qwen:4b # 千问大模型`

环境配置

requirements.txt：

1
2
3

ollama
faiss-cpu==1.8.0
tqdm

Anaconda Prompt：

1
2
3

conda create -n rag Python==3.8
conda activate rag
pip install -r requirements.txt

代码实现

洗衣机常见错误编码及解决办法.txt：

E1 错误代码：E1 错误代码表示水位探测器故障。可能的原因包括水位开关、排水问题和其他电路问题。如果出现这种情况，建议关闭电源，检查洗衣机电路和水管，如有必要，清理管道和过滤器。如果问题依然存在，需要请专业维修人员进行维修。
E2 错误代码：E2 错误代码表示水阀故障。这可能是由于电路问题、水阀故障或水压过低造成的。解决方法是首先检查洗衣机水管是否有漏水问题，是否有别的水源可以上，同时检查电路和水阀。如果其他办法不能解决问题，最好请专业人员进行检修。
E3 错误代码：E3 错误码表明电机故障。可能的原因包括电路问题、电机电路问题和其他问题。如果出现这种情况，建议检查洗衣机电路和电机，如果有必要，更换电路或电机。
E4 错误代码：E4 错误代码表示放水泵问题。可能的原因包括电路故障、水泵故障或水箱堵塞。解决方法是清洗洗衣机水箱和过滤器，检查水泵和电路，并更换有问题的零件。
E5 错误代码：E5 错误代码表示电机过热故障。这可能是由于电路问题、风扇故障、电路板故障或其他问题引起的。解决方法是检查洗衣机电路和电机，检查散热器和风扇是否正常工作。如果有必要，更换故障零件。
E6 错误代码：E6 错误代码表示电路板故障。这可能是由于电源问题、电路板故障或其他问题引起的。解决方法是检查电源和电路板，如有必要，更换故障零件。

main.py：

import faiss  # 创建和操作向量索引
import ollama  # 生成文本嵌入
from tqdm import tqdm  # 显示进度条
import numpy as np  # 处理数值计算

# 将文本转换为嵌入向量
def encode(text):
    return ollama.embeddings(model = 'nomic-embed-text', prompt = text)['embedding']

# 读取文档并分段
chunks = []  # 初始化一个空列表来存储文本分段
file = open("洗衣机常见错误编码及解决办法.txt", encoding = 'utf-8')  # 打开文档
for line in file:  # 逐行读取文档
    line = line.strip()  # 去除每行的前后空白
    if line:  # 如果行不为空
        chunks.append(line)  # 将处理后的行添加到chunks列表
file.close()  # 关闭文档

# 计算每个分段的embedding
chunk_embeddings = []  # 初始化一个空列表来存储嵌入向量
for i in tqdm(range(len(chunks)), desc = '计算chunks的embedding'):  # 遍历chunks列表，并显示进度条
    chunk_embeddings.append(encode(chunks[i]))  # 将每个分段的嵌入向量添加到chunk_embeddings列表
chunk_embeddings = np.array(chunk_embeddings)  # 将嵌入向量列表转换为NumPy数组
chunk_embeddings = chunk_embeddings.astype('float32')  # 确保数组的数据类型为float32

# 建立faiss索引
faiss.normalize_L2(chunk_embeddings)  # 对嵌入向量进行L2归一化
faiss_index = faiss.index_factory(chunk_embeddings.shape[1], "Flat", faiss.METRIC_INNER_PRODUCT)  # 创建一个faiss索引
faiss_index.add(chunk_embeddings)  # 将嵌入向量添加到索引中

# 循环等待用户输入
while True:
    # 提示用户输入一个问题
    question = input("请输入一个问题: ")
    print(question)

    # 将问题编码为嵌入向量
    question_embedding = encode(question)

    # 检索到最相关的top1分段
    question_embedding = np.array([question_embedding])  # 将问题嵌入向量转换为NumPy数组
    question_embedding = question_embedding.astype('float32')  # 确保数组的数据类型为float32
    faiss.normalize_L2(question_embedding)  # 对问题嵌入向量进行L2归一化
    _, index_matrix = faiss_index.search(question_embedding, k = 1)  # 在索引中搜索最相关的分段

    # 构造prompt
    prompt = f'根据参考文档回答问题，回答尽量简洁，不超过20个字\n' \
             f'问题是："{question}"\n' \
             f'参考文档是："{chunks[index_matrix[0][0]]}"'  # 构造一个包含问题和参考文档的prompt
    print(f'prompt:\n{prompt}')  # 打印构造的prompt

    # 获取答案
    stream = ollama.chat(model = 'qwen:4b', messages = [{'role': 'user', 'content': prompt}], stream = True)  # 使用ollama库获取答案
    print('answer:')  # 打印答案前缀
    for chunk in stream:  # 遍历ollama返回的答案流
        print(chunk['message']['content'], end = '', flush = True)  # 打印答案内容
    print()  # 打印换行符

报错：

缺少“packaging”：在 rag 环境下安装 pip install packaging

读取 txt 时 gbk 错误：open 函数添加 encoding = 'utf-8'

新手入门

#RAG #LLM

【RAG 入门】简单实现 RAG

http://xuan-van.github.io/新手入门/【rag-入门】简单实现-rag/

作者

文晋

发布于

2024年10月16日

许可协议

【RAG 入门】LLM 应用开发上一篇

【终端入门】常用知识汇总下一篇