多租戶 AI 知識檢索基礎設施的工程實踐
A Whitepaper on L1 Wiki + L2 RAG Hybrid Retrieval for Multi-Tenant AI SaaS
English reader? → Start with en/README.md or jump to Ch 1 (en).
日本語の読者 → ja/README.md または直接 第 1 章 (ja) へ。
中文:本書記錄百原科技於 2024–2026 年開發「百原 RAG 知識庫平台」的工程實踐。本平台是一套多租戶知識檢索基礎設施,同時為百原 AI 客服 SaaS、百原 GEO Platform、百原 PIF AI 三條產品線提供知識支撐。全書介紹一套 L1 Wiki + L2 RAG 雙層檢索架構(L1 為 DB 化快取摘要、L2 為 pgvector + BM25 + Reciprocal Rank Fusion 混合檢索),深入拆解與 GEO Platform、PIF AI 的整合模式,並記錄三層租戶隔離、串流應答、Handoff 閉環等工程決策。共 12 章 + 4 附錄,繁體中文約 45,000 字,採 CC BY-NC 4.0 授權公開。
English:This whitepaper documents Baiyuan Technology’s engineering practice (2024–2026) of building the Baiyuan RAG Knowledge Platform, a multi-tenant knowledge retrieval infrastructure shared by three product lines: Baiyuan AI Customer Service SaaS, Baiyuan GEO Platform, and Baiyuan PIF AI. The book introduces a two-layer retrieval architecture (L1 Wiki — DB-cached compiled summaries; L2 RAG — pgvector + BM25 + RRF hybrid retrieval), documents deep integration patterns with GEO and PIF, and details three-layer tenant isolation, streaming answers, and the handoff loop. 12 chapters + 4 appendices, published under CC BY-NC 4.0.
日本語:本書は百原科技が 2024–2026 年に開発した「百原 RAG ナレッジプラットフォーム」のエンジニアリング実践を記録する。マルチテナント型の知識検索インフラとして、百原 AI カスタマーサービス SaaS、百原 GEO Platform、百原 PIF AI の 3 製品を共通で支える。L1 Wiki(DB キャッシュ済み要約) + L2 RAG(pgvector + BM25 + RRF 混合検索) の二層アーキテクチャ、GEO および PIF との深い統合パターン、三層テナント分離、ストリーミング応答、人間オペレータへの Handoff ループを詳述する。
這份文件是一本工程白皮書,不是產品宣傳、不是使用手冊。讀者可以預期獲得:
這份文件不包含:
企業導入生成式 AI 做客服、知識庫、法規合規應用時,普遍面臨五個工程問題:
百原 RAG 知識庫平台是針對上述五個問題的工程化解答。本平台透過雙層檢索同時壓低成本與幻覺率,並以單一基礎設施橫向支援三條產品線,讓知識工作一次完成、處處可用。
| 讀者類型 | 建議閱讀路徑 |
|---|---|
| B2B 決策者(CIO/CTO) | Ch 1、Ch 2、Ch 9、Ch 10、Ch 11 |
| 工程主管/架構師 | Ch 2、Ch 5、Ch 6、Ch 9、Ch 10 |
| 後端工程師 | Ch 3、Ch 4、Ch 5、Ch 7、Ch 8 |
| AI/學術研究者 | Ch 3、Ch 4、Ch 12 |
| 客服/營運導入者 | Ch 2、Ch 8、Ch 11 |
以下術語在本書有特定定義,部分為本團隊所造詞。首次定義置於此處,全書統一使用。
| 術語 | 英文 | 定義 |
|---|---|---|
| RAG | Retrieval Augmented Generation | 檢索增強生成。先從知識庫檢索相關片段,再把片段連同問題丟給 LLM 生成答案的模式。 |
| L1 Wiki | Layer 1 Wiki Cache | 百原實踐。由 LLM 把知識庫編譯成結構化的「Wiki 頁」,存於 PostgreSQL,以 slug 為鍵;查詢時若命中可 0.5 秒回應、省 80% token。 |
| L2 RAG | Layer 2 Retrieval | pgvector 向量檢索 + BM25 關鍵詞檢索,以 Reciprocal Rank Fusion 合併排序。L1 未命中時自動 fallback。 |
| Hybrid Retrieval | Hybrid Retrieval | L1→L2 串接的兩層檢索總稱。 |
| pgvector | pgvector | PostgreSQL 的向量擴充,提供 IVF-Flat / HNSW 索引。 |
| RRF | Reciprocal Rank Fusion | 把多路檢索結果以 1/(k+rank) 合併重排的演算法,預設 k=60。 |
| Wiki Compile | Wiki Compilation | 把知識庫中的 documents 批次送 LLM 產生結構化 Wiki 頁的過程,通常離線執行。 |
| Wiki Lint | Wiki Linter | 檢查 Wiki 內容是否有事實矛盾、重複、引用遺失的自動化工具。 |
| 三層租戶隔離 | Three-Layer Tenant Isolation | 百原實踐。App 層(X-Tenant-ID header)+ DB 層(PostgreSQL RLS)+ Query 層(WHERE tenant_id = ?)的深度防禦。 |
| Handoff | Human Handoff | AI 客服轉交真人客服的狀態機,含 request → claim → human-reply → resume-ai 五個狀態。 |
| NLI | Natural Language Inference | 自然語言推論三值分類(entailment / contradiction / neutral),用於幻覺檢知。 |
| ChainPoll | ChainPoll | 同一 prompt 叫 LLM 3 次多數決,用於抑制幻覺偵測噪音。 |
| GEO | Generative Engine Optimization | 百原姐妹產品。生成式引擎優化,讓品牌在 AI 回答中被正確引用。 |
| PIF | Product Information File | 百原姐妹產品。針對台灣化粧品法規(2026/7 強制)自動生成 16 項 PIF 文件的 SaaS。 |
| Intent Routing | Intent Routing | 問題進來先分類為 knowledge / handoff / smalltalk 三類,再分流到不同管線。 |
| Stream SSE | Server-Sent Events | 串流應答格式,事件:start / delta / ping / done / error。 |
| Answer Cache | Answer Cache | Redis 緩存 (question_hash, tenant_id) → answer,TTL 600 秒,削峰。 |
| Scraped Knowledge | Scraped Knowledge | Widget 用戶對話前,爬蟲從當前網頁抽取的段落,作為 context 預置於 question 前。 |
| Session State | Session State | Redis 存 conversation_id → 最近 N 輪 user/ai 訊息,支援多輪對話上下文。 |
每章都附有:
APA 7
Lin, V. (2026). Baiyuan RAG Knowledge Platform: A whitepaper on L1 Wiki + L2 RAG hybrid retrieval for multi-tenant AI SaaS. Baiyuan Technology. https://github.com/baiyuan-tech/rag-whitepaper
BibTeX
@techreport{lin2026baiyuanrag,
author = {Lin, Vincent},
title = {Baiyuan RAG Knowledge Platform: A Whitepaper on L1 Wiki + L2 RAG Hybrid Retrieval for Multi-Tenant AI SaaS},
institution = {Baiyuan Technology},
year = {2026},
url = {https://github.com/baiyuan-tech/rag-whitepaper},
note = {v1.0}
}
本書採 CC BY-NC 4.0 授權(詳見 LICENSE):
本書描述的 RAG 平台是百原科技產品生態的基礎層,與另外兩條產品線高度整合:
flowchart TB
subgraph 三條產品線
CS[AI 客服 SaaS<br/>chat.baiyuan.io]
GEO[GEO Platform<br/>geo.baiyuan.io]
PIF[PIF AI<br/>pif.baiyuan.io]
end
subgraph 共用基礎設施
RAG[(百原 RAG 知識庫平台<br/>rag.baiyuan.io)]
ENT[品牌實體圖<br/>Schema.org @id]
end
CS -->|問答流量| RAG
GEO -->|幻覺修復注入 GT| RAG
PIF -->|法規/成分知識| RAG
RAG -->|共享實體| ENT
GEO -->|建構| ENT
PIF -->|綁定產品| ENT
Fig 0: 百原產品三支柱與 RAG 基礎設施關係
詳細整合模式見 Ch 9(GEO)與 Ch 10(PIF)。
| 日期 | 版本 | 說明 |
|---|---|---|
| 2026-04-20 | v1.0 draft | 初稿完成:zh-TW 12 章 + 4 附錄;en + ja 全量並行上線;CC BY-NC 4.0 公開 |
本倉庫所有 .md 檔均遵循 FORMAT.md,特性包括:
TechArticle JSON-LD 內嵌