
30.终极RAG副业系统上线!0代码自动处理任意文档

工作流使用地址:
https://xiangyugongzuoliu-n8n.zeabur.app/form/xiangyu-rag-account
整个 n8n 工作流的精密架构如下:
该工作流构建了一套从用户输入到结果交付的全流程闭环服务链。系统通过原生表单实现多格式批量上传,通过动态路由精准分发到不同子工作流,再结合高效的加载、分片、嵌入与向量索引模块,最终支持智能检索式问答与多模态分析子流程,真正实现高性能、高并发的知识检索与处理。
1. 原生表单模块:
使用 n8n Form Trigger 节点,提供一站式任务创建界面。用户可在同一页面选择“类型”(纯文本/PDF/图片/Office)、粘贴文本或批量上传文件,一键启动,极简操作。
2. 路由分发模块:
利用 Switch 节点根据用户选择的“类型”动态分发任务,分别触发对应子流程。新增格式或新功能只需在此节点增加分支,灵活扩展零改代码。
3. 多格式解析与智能分片:
• 纯文本:ConvertToFile + Default Data Loader → Recursive Character Text Splitter;
• PDF:Merge + Default Data Loader → 同上分片;
• Office:调用 Unstructured API 进行文档解析 → ConvertToFile → 分片;
• 图片:Agent 节点智能提取视觉元素与表格结构,输出结构化数据。
每种格式均可并行处理,实现批量高效拆分与预处理。
4. 向量化嵌入与索引模块:
多路 Embeddings OpenAI 节点并行生成文档/分片向量,通过 Pinecone Vector Store(针对纯文本/PDF/图片/Office 四大索引)批量插入,支持千级并发写入,确保索引与检索的高吞吐。
5. 检索式问答与结果交付:
• 聚合与完成通知:Aggregate、Merge、Form 节点汇总各子流程结果,统一输出提示和下载链接;
• 智能问答:Chat Trigger + MultiQuery Retriever + Vector Store Retriever + ChainRetrievalQA 构建的 QA 对话界面,允许用户基于已上传内容实时提问,回答中带出处,真正实现上下文检索闭环。

发表回复