マルチテナント AI SaaS のための L1 Wiki + L2 RAG 混合検索に関するホワイトペーパー
本書は百原科技(Baiyuan Technology)が 2024–2026 年に開発した百原 RAG ナレッジプラットフォームのエンジニアリング実践を記録する。本プラットフォームはマルチテナント知識検索インフラとして、以下 3 製品を共通で支える:
コアアーキテクチャの貢献は二層検索システム:
tsvector BM25 を Reciprocal Rank Fusion(k=60)で融合Pilot テナントで従来型単層 RAG に対し、月額 LLM トークンコスト −40〜68%、幻覚率 −57%、P95 レイテンシ −51%(2026 Q1 計測)。
企業が生成 AI を顧客サービス、知識検索、法規合規に導入すると、5 つのエンジニアリング課題に直面する:
百原 RAG ナレッジプラットフォームはこれら 5 つへの統合的な工学的回答。
flowchart TB
subgraph Products[3 製品ライン]
CS[AI カスタマーサービス<br/>chat.baiyuan.io]
GEO[GEO Platform<br/>geo.baiyuan.io]
PIF[PIF AI<br/>pif.baiyuan.io]
end
subgraph Shared[共通インフラ]
RAG[(百原 RAG Platform<br/>rag.baiyuan.io)]
ENT[ブランド実体グラフ<br/>Schema.org @id]
end
CS -->|Q&A トラフィック| RAG
GEO -->|幻覚修復| RAG
PIF -->|法規 KB| RAG
RAG --> ENT
GEO --> ENT
PIF --> ENT
Fig 0: RAG 基盤を共有する 3 製品の構成
| 用語 | 定義 |
|---|---|
| L1 Wiki | PostgreSQL 内の LLM コンパイル済み構造化サマリー。slug キー、~50 ms で応答 |
| L2 RAG | pgvector コサイン + BM25 tsvector + RRF 融合 |
| RRF | Reciprocal Rank Fusion: score(d) = Σ 1/(k + rank_i(d)), k=60 |
| Wiki Compile | chunks から wiki_pages を生成するオフラインバッチ |
| Wiki Lint | 事実矛盾、引用漏れを毎日 cron でチェック |
| 三層分離 | App ヘッダー + PostgreSQL RLS + SQL WHERE の多層防御 |
| Handoff | AI→人間の引き継ぎ五状態マシン(ai_active / pending / agent_active / ended) |
| NLI | 三値分類(entailment / contradiction / neutral)による幻覚検知 |
| GEO | Generative Engine Optimization(姉妹製品) |
| PIF | Product Information File(化粧品法規対応、姉妹製品) |
| 読者 | 推奨ルート |
|---|---|
| B2B 意思決定者(CIO/CTO) | 第 1, 2, 9, 10, 11 章 |
| エンジニアリングリード / アーキテクト | 第 2, 5, 6, 9, 10 章 |
| バックエンドエンジニア | 第 3, 4, 5, 7, 8 章 |
| AI / 学術研究者 | 第 3, 4, 12 章 |
| カスタマーサポート運用導入者 | 第 2, 8, 11 章 |
APA 7
Lin, V. (2026). Baiyuan RAG Knowledge Platform: A whitepaper on L1 Wiki + L2 RAG hybrid retrieval for multi-tenant AI SaaS. Baiyuan Technology. https://github.com/baiyuan-tech/rag-whitepaper
CC BY-NC 4.0。商用利用は services@baiyuan.io まで。
Baiyuan Technology Co., Ltd. · https://baiyuan.io · services@baiyuan.io