Rag 自主式 RAG
上一节我们介绍了 RagFlow 中的表,这一节我们来介绍 Ragflow 中的表操作。Ragflow 将表操作定义在了不同的 Service 中,这些 Service 定义在 api\db\services
1. LLM 参数配置 1 2 3 4 5 6 7 8 9 10 { "temperature": 0.5, "top_k": 50, "top_p": 0.9, "repetition_penalty": 1.2, # 对数几率偏差,永久调整 token 被选中的概率,比如说避免脏话 "logit_bias": { "50256": -100 } } 这些参数通常出现在基于生
1. 文本分块 智能分块的方法: 语义分块: 需要计算每一个句子与前一个句子的相似度,如果相似则合并为一个分块。 基于大语言模型的分块: 使用大语言模型直
1. 检索核心技术 现代检索系统主要采用两种搜索技术 语义搜索(Semantic Search): 通过理解文档含义进行匹配 关键词搜索(Keyword Search) 搜索过程: 两种
在深入到具体业务代码之前,我们先来看看 ragflow 都定义了哪些表。 1. Ragflow 定义的表 Ragflow 定义了以下表,这些表位于 api\db\db_models.py 表名 主要字段/关联 作用说明 user id,email,language,timezone 用户账号信息与