1.rag流程

① 文档接入
② 文档解析(Loader)
③ 文本切分(Chunking)
④ 向量化(Embedding)
⑤ 向量存储(Vector DB)
⑥ 检索(Recall)
⑦ 重排序(Rerank)
⑧ Prompt构建(Prompt Engineering)
⑨ LLM生成(推理)
⑩ 流式返回(Streaming)

架构图

前端(Vue/React)
    ↓
Spring Boot(API层)
    ↓
RAG服务层
    ├── Embedding服务
    ├── 检索服务
    ├── Rerank服务
    ├── Prompt服务
    └── LLM调用
    ↓
数据层
    ├── 向量库(Milvus)
    ├── ES(关键词)
    └── MySQL(元数据)

LangChain4J springAi框架生态

文章作者:
版权声明: 本站所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自
喜欢就支持一下吧