RAG 实战|用 StarRocks + DeepSeek 构建智能问答与企业知识库

人工智能 创建于:06-14 00:09

文章作者:

石强,镜舟科技解决方案架构师

赵恒,StarRocks TSC Member

👉 加入 StarRocks x AI 技术讨论社区 https://wx.focussend.com/weComLink/mobileQrCodeLink/33412/2b42f

RAG 和向量索引简介

RAG(Retrieval-Augmented Generation,检索增强生成)是一种结合外部知识检索与 AI 生成的技术,弥补了传统大模型知识静态、易编造信息的缺陷,使回答更加准确且基于实时信息。

RAG 的核心流程

检索(Retrieval)

  • 用户输入问题后,RAG 从外部数据库(如维基百科、企业文档、科研论文等)检索相关内容。

  • 检索工具可以是向量数据库、搜索引擎或传统数据库。

生成(Generation)

  • 将检索到的相关信息与用户输入一起输入生成模型(如 GPT、LLaMA 等),生成更准确的回答。

  • 模型基于检索内容“增强”输出,而非仅依赖内部参数化知识。

上图展示了 RAG 的标准流程。首先,图片、文档、视频和音频等数据经过预处理,转换为 Embedding 并存入向量数据库。Embedding 通常是高维 float 数组,借助向量索引(如 HNSW、IVF)进行相似性搜索,加速高效检索。

向量索引通过近似最近邻(ANN)算法优化查询效率,减少高维计算负担。语义搜索匹配用户问题与知识库中的相关内容,使回答基于真实信息,从而降低大模型的“幻觉”风险,提升回答的自然性和可靠性。

关于向量检索的更多介绍,可以参考 腾讯大数据基于 StarRocks 的向量检索探索 这篇文章。这里不再展开说明。

StarRocks + DeepSeek 的典型 RAG 应用场景

DeepSeek 负责生成高质量 Embedding 和回答,StarRocks 提供实时高效的向量检索,二者结合可构建更智能、更精准的 AI 解决方案。

企业级知识库

适用场景:

  • 企业内部知识库(文档搜索、FAQ)

  • 法律、金融、医药等专业领域问答

  • 代码搜索、软件开发文档查询

方案:

  1. 文档嵌入(DeepSeek 负责): 将企业知识库、FAQ、技术文档等数据转换为向量。

  2. 存储+索引(StarRocks 负责): 使用 HNSW 或 IVFPQ 存储向量存储在 StarRocks 中,支持高效检索。

  3. 检索增强生成(RAG 负责): 用户输入问题 → DeepSeek 生成查询向量 → StarRocks 进行向量匹配 → 返回相关文档 → DeepSeek 结合文档生成最终回答。

AI 客服与智能问答

适用场景:

  • 智能客服(银行、证券、电商)

  • 法律、医疗等专业咨询

  • 技术支持自动问答

方案:

  1. 客户对话日志嵌入(DeepSeek 负责): 训练 LLM 处理用户意图,转换历史聊天记录为向量。

  2. 存储+索引(StarRocks 负责): 采用向量索引让客服系统能够高效查找相似案例。

  3. 检索增强(RAG 负责): 结合历史客服对话 + 知识库 + DeepSeek LLM 生成答案。

示例流程:

  • 用户问:“我如何更改银行卡预留手机号?”

  • StarRocks 检索到 3 个最相似的客户服务记录

  • DeepSeek 结合这 3 条历史记录 + 预设 FAQ,生成精准回答

操作演示

系统组成

  • DeepSeek:提供文本向量化(embedding)和答案生成能力

  • StarRocks:高效存储和检索向量数据(3.4+版本支持向量索引)

实现流程:

1.环境准备

1.1 DeepSeek 本地部署

Tips: 以下内容使用的是 macbook 进行 demo 演示

1.1.1 使用 ollama 安装本地模型

在本地部署 DeepSeek 时,Ollama 主要起到模型管理和提供推理接口的作用,支持运行多个不同的 LLM,并允许用户在本地切换和管理不同的模型。

  • 下载 ollama:https://ollama.com/

  • 安装 deepseek-r1:7b

Tips: 如果想使用云端 LLM(如 DeepSeek 的官方 API),需要获取并填写 API Key

访问 DeepSeek 官网(https://platform.deepseek.com)后注册账号并登录;在仪表盘中创建 API Key(通常在 “API Keys” 或 “Developer” 部分),复制生成的密钥(如 sk-xxxxxxxxxxxxxxxx)。

1.1.2 Deepseek 初步使用

启动 deepseek

1.1.3 Deepseek 性能优化

直接在命令行设置参数:(参数单次生效)

1.1.4 deepseek 使用

显而易见:直接使用 deepseek 进行问答,返回的答案是不符合预期的,需要对知识进行修正

1.2 StarRocks 准备工作

1.2.1 集群部署

版本需求:3.4 及以上

1.2.2 配置设置

打开 vector index

1.2.3 建库建表

建库:

建表:存储知识库向量

Tips: DeepSeek 的 deepseek-r1:7b 模型(7B 参数版本)默认生成高维嵌入向量,通常是 3584 维

2.将文本转成向量

测试通过 deepseek 将文本转为 3584 维向量

下面将转化的向量数据保存在 StarRocks 中

3.知识存储 (存储向量到 StarRocks)

操作演示

4.知识提取 (检索向量 & 输出结果)

执行效果

5.加入 RAG 增强

5.1 将查询知识库的结果,返回给 DeepSeek LLM ,优化回答质量

5.2 创建 RAG 过程表:

用于记录用户问题、检索结果和生成回答,保存上下文,方便进行长对话,至于长对话,用户可自行探索。

customer_service_log 表建表语句如下:

6.优化后的版本

6.1 知识提取代码

6.1.1 知识提取

6.1.2 操作演示

总结一下 RAG 增强后的执行流程:

  1. 输入:用户输入问题

  2. 数据向量化:DeepSeek Embedding

  3. StarRocks 向量索引,在 enterprise_knowledge 表中检索最相似的知识

  4. 增强(Augmentation):将检索结果与问题组合成 Prompt,传递给 DeepSeek

  5. 生成回答:调用 DeepSeek 生成增强后的回答

  6. 记录日志:将问题、检索结果和生成回答存入 customer_service_log

  7. 返回结果:将生成的回答返回给用户

6.2 加上 web 可视化界面

6.3 完整问答后台服务代码

6.3.1 代码结构如下

6.3.2 知识存储代码

6.3.3 知识提取

6.3.4 效果演示

 

参考文档:

Deepseek 搭建:https://zhuanlan.zhihu.com/p/20803691410

Vector index 资料:https://docs.starrocks.io/zh/docs/table_design/indexes/vector_index/

StarRocks AI 共创计划:让数据分析更智能!

AI 时代已来,StarRocks 正在加速进化!我们诚邀社区开发者、数据工程师和 AI 爱好者一起探索 “AI + 数据分析” 的无限可能。无论你是擅长算法优化、应用落地,还是热爱技术布道,这里都有你的舞台!

🌟 你的贡献,能让 StarRocks 更强大!我们期待你在以下方向大展身手:

  • AI 增强分析:用 LLM、RAG 优化查询、智能 SQL 生成、自然语言交互

  • 工具 & 插件:开发 AI 扩展、模型集成、自动化运维方案

  • 实战案例:分享你的 AI+StarRocks 应用 Demo(附代码/视频更佳!)

🎁 丰厚奖励

  • Top 10 优秀贡献者将获得 StarRocks 社区荣誉 + 2000 积分奖励(详情参考 StarRocks 布道师计划

  • 优秀项目有机会被官方推荐,并整合进 StarRocks 生态

📢 立即行动!👉 在社区论坛分享你的创意或 AI 实践:https://forum.mirrorship.cn/

原文地址:https://my.oschina.net/u/5658056/blog/18191506

免责声明:本文来源于互联网,版权归合法拥有者所有,如有侵权请公众号联系管理员

* 本站提供的一些文章、资料是供学习研究之用,如用于商业用途,请购买正版。

线下活动