本地運行、永久免費、精準度 95% 以上——這不是夢,這是 Shopify 創始人打造的開源工具

前言:你的 AI Agent 正在「燒錢」
如果你正在使用 Claude 或其他 AI 工具進行開發,你一定體驗過這種痛苦:
- Token 消耗飛速 —— 聊沒幾輪就觸及限額
- Context 塞滿垃圾 —— Agent 把一堆無關資訊塞進對話,既浪費錢又降低回答精準度
- 手動提醒好累 —— 每次都要提醒 AI「記得之前講過什麼」
有沒有辦法讓 Agent 精準回憶,同時完全零成本?
答案是:有。
認識 QMD:專為 AI Agent 設計的語義搜索引擎
QMD 是由 Shopify 創始人 Tobi Lütke 開發的本地語義搜索工具,使用 Rust 打造,專門為 AI Agent 的記憶需求而生。
核心特色
| 特性 | 說明 |
|---|---|
| 🔍 混合搜索 | BM25 全文檢索 + 向量語義搜索 + LLM 重排序 |
| 💰 零 API 成本 | 完全本地運行,使用 GGUF 模型 |
| 🔌 MCP 整合 | Agent 可主動回憶,無需手動提醒 |
| 📁 多格式支援 | Markdown 筆記、會議記錄、各類文檔 |
| ⚡ 極速索引 | 12 個文件僅需數秒完成 |
快速上手:10 分鐘完成配置
第一步:安裝 QMD
bun install -g https://github.com/tobi/qmd
首次運行會自動下載以下模型:
- Embedding 模型:
jina-embeddings-v3(約 330MB) - Reranker 模型:
jina-reranker-v2-base-multilingual(約 640MB)
下載完成後,即可完全離線運行。
第二步:建立記憶庫並生成 Embeddings
# 進入你的工作目錄
cd ~/your-workspace
# 建立記憶庫(索引 memory 資料夾)
qmd collection add memory/*.md --name daily-logs
# 生成 embeddings
qmd embed daily-logs memory/*.md
# 也可以索引根目錄的核心文件
qmd collection add *.md --name workspace
qmd embed workspace *.md
第三步:測試搜索效果
# 混合搜索(關鍵詞 + 語義,最精準)
qmd search daily-logs "你的關鍵詞" --hybrid
# 純語義搜索
qmd search daily-logs "你的關鍵詞"
# 查看所有 collections
qmd list
實測結果:混合搜索精準度達 93%,純語義搜索約 59%
進階應用:MCP 整合
讓 AI Agent 直接調用 QMD,實現自動化記憶檢索。
建立 config/mcporter.json:
{
"mcpServers": {
"qmd": {
"command": "/Users/你的用戶名/.bun/bin/qmd",
"args": ["mcp"]
}
}
}
六大開箱即用工具
| 工具 | 功能 |
|---|---|
query | 混合搜索(最精準) |
vsearch | 純語義搜索 |
search | 關鍵詞搜索 |
get / multi_get | 精準提取文檔 |
status | 健康檢查 |
配置完成後,Agent 會主動「回憶」相關上下文,不再需要你手動提醒。
實戰對比:傳統方案 vs QMD
場景一:回憶用戶偏好
用戶問:「我的寫作風格是什麼?」
| 方案 | 作法 | 結果 |
|---|---|---|
| 傳統 | 將整個 MEMORY.md(2000 token)塞進 context | 90% 內容無關,浪費成本 |
| QMD | Agent 搜索「寫作風格」,只返回相關段落(~200 token) | 省 90% token,精準度更高 |
場景二:跨文件知識檢索
用戶問:「之前討論過什麼?」
| 方案 | 作法 | 結果 |
|---|---|---|
| 傳統 | 手動指定文件,或整個對話歷史塞進 context | 成本高、效率低 |
| QMD | 自動從所有 memory 文件中找最相關段落 | 跨文件精準回憶,93% 準確率 |
維護建議:保持記憶庫更新
定期更新索引以確保記憶庫同步最新內容:
qmd embed daily-logs memory/*.md
qmd embed workspace *.md
💡 小技巧:可將上述指令加入
cron job或heartbeat腳本,實現自動化更新。
總結
QMD 解決了 AI Agent 使用中的一個核心痛點:如何讓 Agent 擁有精準、低成本的長期記憶。
為什麼選擇 QMD?
- ✅ 完全免費 —— 本地運行,零 API 成本
- ✅ 超高精準度 —— 混合搜索達 93% 準確率
- ✅ 快速部署 —— 10 分鐘即可上手
- ✅ 無縫整合 —— MCP 協議讓 Agent 主動回憶
如果你厭倦了 Token 飛速消耗和 Context 塞滿無關資訊的困境,是時候讓你的 AI Agent 學會「精準記憶」了。
📎 GitHub:https://github.com/tobi/qmd


