上一节我们讲解了 Ragflow 增强的相关内容。这一节我们讲解文档 embedding 和结果上传相关的内容。 1. 内容回顾 前面我们整理了 ragflow 文档处理的调用链。 1 2 3 4 5 6 7 8 9 10
内容很多,我们先回顾一下,在介绍 do_handle_task 的处理流程时,我们总结了五个问题: TenantLLMService.model_instance 如何实例化模型 如何根据文档的类型选择不同的 chunker 关键词生成、问题生成、文档
前面我们介绍了 RagFlow 的模型实例化,这篇文章我们来介绍一下 RagFlow 的 Chunk 的过程。 1. Parser ragflow 会根据不同的文档类型,选择不同的 Parser 进行处理。所有的解析器定义在 rag\app 模块
这一节我们看前一节遗留的第一个问题,TenantLLMService.model_instance 如何实例化模型。 1. TenantLLMService 1.1 用户模型配置获取 model_instance: 首
前两节我们介绍了 ragflow task exector 的启动流程,以及 ragflow 中的表以及 ORM 相关的代码,至此我们已经对 ragflow 中的数据以及如何操作数据有了一定的了解。这一节我们来看 task exector do_handle_task
1. RAG 可观测性平台 RAG 可用的可观测性平台包括: Phoenix LangSmith Langfuse 系统监控工具: DataDog 和 Grafana。 2. 自定义数据集 创建包含系统处理过的系统提示词的自定义数据集