RAG知识库学习
1.rag流程
① 文档接入
② 文档解析(Loader)
③ 文本切分(Chunking)
④ 向量化(Embedding)
⑤ 向量存储(Vector DB)
⑥ 检索(Recall)
⑦ 重排序(Rerank)
⑧ Prompt构建(Prompt Engineering)
⑨ LLM生成(推理)
⑩ 流式返回(Streaming)架构图
前端(Vue/React)
↓
Spring Boot(API层)
↓
RAG服务层
├── Embedding服务
├── 检索服务
├── Rerank服务
├── Prompt服务
└── LLM调用
↓
数据层
├── 向量库(Milvus)
├── ES(关键词)
└── MySQL(元数据)LangChain4J springAi框架生态
版权声明:
本站所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自
晓!
喜欢就支持一下吧