Baiyuan RAG Knowledge Platform Whitepaper

百原 RAG ナレッジプラットフォーム — 技術ホワイトペーパー

マルチテナント AI SaaS のための L1 Wiki + L2 RAG 混合検索に関するホワイトペーパー

中文版 · English version

License: CC BY-NC 4.0

エグゼクティブサマリー

本書は百原科技(Baiyuan Technology)が 2024–2026 年に開発した百原 RAG ナレッジプラットフォームのエンジニアリング実践を記録する。本プラットフォームはマルチテナント知識検索インフラとして、以下 3 製品を共通で支える:

  1. 百原 AI カスタマーサービス SaaS(chat.baiyuan.io)
  2. 百原 GEO Platform(geo.baiyuan.io) — 姉妹ホワイトペーパー:https://github.com/baiyuan-tech/geo-whitepaper
  3. 百原 PIF AI(pif.baiyuan.io) — 台湾 TFDA 化粧品法規対応の Product Information File 自動化

コアアーキテクチャの貢献は二層検索システム

Pilot テナントで従来型単層 RAG に対し、月額 LLM トークンコスト −40〜68%、幻覚率 −57%、P95 レイテンシ −51%(2026 Q1 計測)。

目次

Part I — 問題とアーキテクチャ

Part II — コアアルゴリズム

Part III — エンジニアリング基盤

Part IV — エコシステム統合

Part V — 現実の検証

付録

問題定義

企業が生成 AI を顧客サービス、知識検索、法規合規に導入すると、5 つのエンジニアリング課題に直面する:

  1. 幻覚と事実不正確 — 規制業界(法務、医療、金融)では許容不可
  2. トークンコスト爆発 — 高 QPS で LLM API 料金が制御不能に
  3. マルチテナント分離 — A 社の知識が B 社の検索に絶対漏れてはならない
  4. 異質な知識源 — PDF、Web、DB、API、Excel 全部を取り込む必要
  5. 製品ラインごとの重複投資 — 3 製品それぞれに RAG = 3 倍のコスト

百原 RAG ナレッジプラットフォームはこれら 5 つへの統合的な工学的回答。

三つの柱

flowchart TB
    subgraph Products[3 製品ライン]
        CS[AI カスタマーサービス<br/>chat.baiyuan.io]
        GEO[GEO Platform<br/>geo.baiyuan.io]
        PIF[PIF AI<br/>pif.baiyuan.io]
    end
    subgraph Shared[共通インフラ]
        RAG[(百原 RAG Platform<br/>rag.baiyuan.io)]
        ENT[ブランド実体グラフ<br/>Schema.org @id]
    end
    CS -->|Q&A トラフィック| RAG
    GEO -->|幻覚修復| RAG
    PIF -->|法規 KB| RAG
    RAG --> ENT
    GEO --> ENT
    PIF --> ENT

Fig 0: RAG 基盤を共有する 3 製品の構成

主要用語

用語 定義
L1 Wiki PostgreSQL 内の LLM コンパイル済み構造化サマリー。slug キー、~50 ms で応答
L2 RAG pgvector コサイン + BM25 tsvector + RRF 融合
RRF Reciprocal Rank Fusion: score(d) = Σ 1/(k + rank_i(d)), k=60
Wiki Compile chunks から wiki_pages を生成するオフラインバッチ
Wiki Lint 事実矛盾、引用漏れを毎日 cron でチェック
三層分離 App ヘッダー + PostgreSQL RLS + SQL WHERE の多層防御
Handoff AI→人間の引き継ぎ五状態マシン(ai_active / pending / agent_active / ended)
NLI 三値分類(entailment / contradiction / neutral)による幻覚検知
GEO Generative Engine Optimization(姉妹製品)
PIF Product Information File(化粧品法規対応、姉妹製品)

誰が読むべきか

読者 推奨ルート
B2B 意思決定者(CIO/CTO) 第 1, 2, 9, 10, 11 章
エンジニアリングリード / アーキテクト 第 2, 5, 6, 9, 10 章
バックエンドエンジニア 第 3, 4, 5, 7, 8 章
AI / 学術研究者 第 3, 4, 12 章
カスタマーサポート運用導入者 第 2, 8, 11 章

引用方法

APA 7

Lin, V. (2026). Baiyuan RAG Knowledge Platform: A whitepaper on L1 Wiki + L2 RAG hybrid retrieval for multi-tenant AI SaaS. Baiyuan Technology. https://github.com/baiyuan-tech/rag-whitepaper

ライセンス

CC BY-NC 4.0。商用利用は services@baiyuan.io まで。


Baiyuan Technology Co., Ltd. · https://baiyuan.io · services@baiyuan.io