Local Deep Research 完全指南:本地 GPU 运行 AI 深度研究,隐私安全 + 95% SimpleQA

约 8 分钟 AI 开源 隐私

OpenAI 的 Deep Research 很强大,但数据必须上传到云端,隐私和成本都是问题。Local Deep Research (LDR) 是今天 GitHub Trending 上的新星——一个完全开源的本地深度研究引擎,跑在你自己的 GPU 上,数据从不离开你的机器,SimpleQA 准确率可达 95%。

目录

  1. LDR 是什么
  2. 核心特性
  3. Docker 一键部署
  4. 使用指南
  5. LangGraph 自主研究模式
  6. 隐私与安全设计
  7. 性能基准
  8. 常见问题

LDR 是什么

Local Deep Research 是一个开源的 AI 研究助手,核心思路很直接:你提一个复杂问题,LDR 自动搜索、阅读、分析,最后输出一份带引用的研究报告。 和 OpenAI Deep Research 或 Gemini Deep Research 最大的区别在于——一切都在本地

LDR 支持你选择任意 LLM 后端:Ollama、llama.cpp、OpenAI 兼容 API、Google Gemini,甚至是本地部署的 Hugging Face 模型。 搜索方面,它集成了 10+ 搜索引擎:SearXNG、arXiv、PubMed、Semantic Scholar、Google Custom Search、Bing 等。 最终的研究报告以 Markdown、PDF 等形式导出,所有中间数据都会存入本地的 SQLCipher 加密数据库。

目前 LDR 在 GitHub 已获得近 5000 星,约 200 星/天,社区非常活跃。项目地址: LearningCircuit/local-deep-research

核心特性一览

  • 完全本地运行 — 支持 Ollama、llama.cpp、OpenAI 兼容 API,数据不出机器
  • 10+ 搜索引擎 — SearXNG、arXiv、PubMed、Semantic Scholar、Google、Bing 等
  • 20+ 研究策略 — 从快速查证到深度学术分析
  • LangGraph Agent — 自主决策搜索策略、切换引擎、决定何时合成
  • 加密知识库 — SQLCipher AES-256 加密,每个用户独立数据库
  • Docker 一键部署 — 一个命令启动全套环境
  • Supply Chain 安全 — Docker 镜像用 Cosign 签名,含 SLSA 证明和 SBOM

Docker 一键部署

LDR 提供了三种安装方式。对于大多数用户,Docker Compose 是最推荐的

CPU 版(所有平台)

curl -O https://raw.githubusercontent.com/LearningCircuit/local-deep-research/main/docker-compose.yml
docker compose up -d

启动后打开 http://localhost:5000,等大约 30 秒即可访问。

NVIDIA GPU 版(Linux)

curl -O https://raw.githubusercontent.com/LearningCircuit/local-deep-research/main/docker-compose.yml
curl -O https://raw.githubusercontent.com/LearningCircuit/local-deep-research/main/docker-compose.gpu.override.yml
docker compose -f docker-compose.yml -f docker-compose.gpu.override.yml up -d

手动 pip 安装

也支持 pip 直接安装,可在 Windows、macOS、Linux 上运行:

pip install local-deep-research

SQLCipher 加密通过预编译 wheel 提供,无需本地编译。Windows 上 PDF 导出需要安装 Pango。

搭配 Ollama + SearXNG

为了让 LDR 发挥最大能力,建议搭配本地 Ollama 和 SearXNG:

# 启动 Ollama
docker run -d -p 11434:11434 --name ollama ollama/ollama
docker exec ollama ollama pull gpt-oss:20b
# 启动 SearXNG(最佳搜索结果)
docker run -d -p 8080:8080 --name searxng searxng/searxng
# 启动 LDR
docker run -d -p 5000:5000 --network host \
  --name local-deep-research \
  --volume "deep-research:/data" \
  -e LDR_DATA_DIR=/data \
  localdeepresearch/local-deep-research

使用指南

LDR 的页面非常简洁。在输入框中提交一个复杂问题,它会自动:

  1. 分解问题为多个子查询
  2. 并行搜索多个搜索引擎
  3. 抓取并阅读搜索结果内容
  4. 综合所有信息,生成带引用的报告
  5. 将引用来源存入本地加密数据库

你可以从 20+ 研究策略中选择:Quick Facts(快速查证)、Deep Analysis(深度分析)、Academic Research(学术研究)。在设置中还能配置 LLM 后端、搜索引擎组合、搜索深度等参数。

每轮研究的引用会自动存入你的加密知识库。下次做相关研究时,可以搜索自己的文档库,新旧知识交叉引用——知识会持续积累。

LangGraph 自主研究模式

LDR 最新版加入了 LangGraph Agent Strategy——一种自主代理研究模式。 LLM 自己决定搜索什么、用哪个专用引擎(arXiv、PubMed、Semantic Scholar 等)、以及何时停止搜索进行综合。

这种模式的优势是自适应的:如果一个搜索引擎结果不够好,Agent 会自动切换到另一个。 它收集的资料来源远多于传统管道式研究策略。在 Settings 中选择 langgraph-agent 即可体验。

早期测试结果非常不错——Agent 模式能更灵活地应对复杂跨学科问题,比如"某药物机制对特定疾病的影响"这种需要同时查医学论文和技术文档的问题。

隐私与安全设计

LDR 在隐私方面做了几层设计:

  • 每个用户独立加密数据库 — 使用 SQLCipher AES-256 加密,Signal 级别的安全性
  • 零知识设计 — 无密码找回功能,即使是服务器管理员也无法读取你的数据
  • 完全离线运行 — 搭配 Ollama + SearXNG,流量从不离开本地网络
  • Docker 镜像签名 — 使用 Cosign 签名 + SLSA 证明 + SBOM 清单
  • 安全透明度 — GitHub Security Alerts、Scorecard、容器 CVE 扫描公开可查

当然,运行时凭证会存在于进程内存中——这是所有应用(包括密码管理器、浏览器)都存在的行业现实。 LDR 对此做了会话级凭证生命期管理和 core dump 排除。如果你有更严格的合规需求,可以完全离线部署。

性能基准

在 SimpleQA 基准测试中,LDR 的表现非常亮眼:

  • Qwen3.6-27B + RTX 3090 → 约 95% SimpleQA
  • GPT-oss:20b → 约 90%+ SimpleQA
  • 配合 Cloud LLM(GPT-4o、Claude) → 更高准确率,但失去本地化优势

对于 95% 的日常研究需求,一块 RTX 3090(24GB VRAM)搭配 Qwen3.6-27B 完全够用。 如果预算有限,16GB VRAM 的 RTX 4060 Ti / 4070 也能运行 7B-13B 模型,SimpleQA 约 80-85%。

常见问题

LDR 和 OpenAI Deep Research 比怎么样?

OpenAI Deep Research 的优势在于模型更强、搜索覆盖更广,但数据会上传到云端,有隐私和成本问题。 LDR 的定位是 隐私优先 + 低成本,95% SimpleQA 对大多数场景已经足够。

硬件最低要求?

纯 CPU 模式也能跑,但速度较慢。推荐至少 8GB VRAM 的 GPU(GTX 3060 / RTX 4060 以上)。 16GB RAM 是基本要求。

能用云端模型吗?

可以。LDR 支持 OpenAI 兼容 API、Google Gemini 等云端后端。只不过数据会经过 API 传输,隐私性会打折扣。

知识库数据怎么备份?

LDR 的数据目录(默认 /data)包含加密数据库文件。直接备份该目录即可。 数据库文件是跨平台兼容的,可以迁移到任何 LDR 实例。

搜索配额有限制吗?

使用本地 SearXNG 无配额限制。如果用 Google/Bing API,受 API Key 配额影响。


TL;DR: Local Deep Research 是一个开源本地 AI 深度研究引擎,Docker 两分钟部署, 支持 10+ 搜索引擎和 20+ 研究策略,数据用 AES-256 加密存储。 搭配 RTX 3090 + Qwen3.6-27B 可达 95% SimpleQA 准确率。如果你在意数据隐私又需要深度研究能力,值得一试。

安装链接:GitHub 仓库 | 快速开始:curl -O https://raw.githubusercontent.com/LearningCircuit/local-deep-research/main/docker-compose.yml && docker compose up -d