Skip to main content

本地運行、永久免費、精準度 95% 以上——這不是夢,這是 Shopify 創始人打造的開源工具


前言:你的 AI Agent 正在「燒錢」

如果你正在使用 Claude 或其他 AI 工具進行開發,你一定體驗過這種痛苦:

  • Token 消耗飛速 —— 聊沒幾輪就觸及限額
  • Context 塞滿垃圾 —— Agent 把一堆無關資訊塞進對話,既浪費錢又降低回答精準度
  • 手動提醒好累 —— 每次都要提醒 AI「記得之前講過什麼」

有沒有辦法讓 Agent 精準回憶,同時完全零成本

答案是:


認識 QMD:專為 AI Agent 設計的語義搜索引擎

QMD 是由 Shopify 創始人 Tobi Lütke 開發的本地語義搜索工具,使用 Rust 打造,專門為 AI Agent 的記憶需求而生。

核心特色

特性說明
🔍 混合搜索BM25 全文檢索 + 向量語義搜索 + LLM 重排序
💰 零 API 成本完全本地運行,使用 GGUF 模型
🔌 MCP 整合Agent 可主動回憶,無需手動提醒
📁 多格式支援Markdown 筆記、會議記錄、各類文檔
極速索引12 個文件僅需數秒完成

快速上手:10 分鐘完成配置

第一步:安裝 QMD

bun install -g https://github.com/tobi/qmd

首次運行會自動下載以下模型:

  • Embedding 模型jina-embeddings-v3(約 330MB)
  • Reranker 模型jina-reranker-v2-base-multilingual(約 640MB)

下載完成後,即可完全離線運行

第二步:建立記憶庫並生成 Embeddings

# 進入你的工作目錄
cd ~/your-workspace

# 建立記憶庫(索引 memory 資料夾)
qmd collection add memory/*.md --name daily-logs

# 生成 embeddings
qmd embed daily-logs memory/*.md

# 也可以索引根目錄的核心文件
qmd collection add *.md --name workspace
qmd embed workspace *.md

第三步:測試搜索效果

# 混合搜索(關鍵詞 + 語義,最精準)
qmd search daily-logs "你的關鍵詞" --hybrid

# 純語義搜索
qmd search daily-logs "你的關鍵詞"

# 查看所有 collections
qmd list

實測結果:混合搜索精準度達 93%,純語義搜索約 59%


進階應用:MCP 整合

讓 AI Agent 直接調用 QMD,實現自動化記憶檢索。

建立 config/mcporter.json

{
  "mcpServers": {
    "qmd": {
      "command": "/Users/你的用戶名/.bun/bin/qmd",
      "args": ["mcp"]
    }
  }
}

六大開箱即用工具

工具功能
query混合搜索(最精準)
vsearch純語義搜索
search關鍵詞搜索
get / multi_get精準提取文檔
status健康檢查

配置完成後,Agent 會主動「回憶」相關上下文,不再需要你手動提醒。


實戰對比:傳統方案 vs QMD

場景一:回憶用戶偏好

用戶問:「我的寫作風格是什麼?」

方案作法結果
傳統將整個 MEMORY.md(2000 token)塞進 context90% 內容無關,浪費成本
QMDAgent 搜索「寫作風格」,只返回相關段落(~200 token)省 90% token,精準度更高

場景二:跨文件知識檢索

用戶問:「之前討論過什麼?」

方案作法結果
傳統手動指定文件,或整個對話歷史塞進 context成本高、效率低
QMD自動從所有 memory 文件中找最相關段落跨文件精準回憶,93% 準確率

維護建議:保持記憶庫更新

定期更新索引以確保記憶庫同步最新內容:

qmd embed daily-logs memory/*.md
qmd embed workspace *.md

💡 小技巧:可將上述指令加入 cron jobheartbeat 腳本,實現自動化更新。


總結

QMD 解決了 AI Agent 使用中的一個核心痛點:如何讓 Agent 擁有精準、低成本的長期記憶

為什麼選擇 QMD?

  • 完全免費 —— 本地運行,零 API 成本
  • 超高精準度 —— 混合搜索達 93% 準確率
  • 快速部署 —— 10 分鐘即可上手
  • 無縫整合 —— MCP 協議讓 Agent 主動回憶

如果你厭倦了 Token 飛速消耗和 Context 塞滿無關資訊的困境,是時候讓你的 AI Agent 學會「精準記憶」了。


📎 GitHubhttps://github.com/tobi/qmd

Hao

Leave a Reply