Baiyuan GEO Platform Whitepaper

百原GEO Platform 技術白皮書

在生成式 AI 時代重新定義品牌可見性的工程實踐

A Whitepaper on Building a SaaS for Generative Engine Optimization

License: CC BY-NC 4.0 Status: Draft zh-TW en ja PDF

English reader? → Start with the Executive Summary (en/README.md) or jump to Ch 1 (en). Full English edition (12 chapters + 4 appendices, ~28k words) is complete.

日本語の読者エグゼクティブサマリー(ja/README.md) または直接 第 1 章 (ja) へ。完全な日本語版(12 章 + 4 付録、約 30,000 字)を公開済み。


摘要 / Abstract

中文:本書記錄百原科技於 2024–2026 年開發「百原GEO Platform」的工程實踐。百原GEO Platform 是一套針對生成式引擎優化(Generative Engine Optimization, GEO)的 SaaS 系統,目標是協助品牌在 ChatGPT、Claude、Gemini、Perplexity 等生成式 AI 的回答中被正確、持續、準確地提及。本書涵蓋一套七維度 AI 引用率評分演算法、一個對 AI Bot 友善的影子文檔(AXP)交付機制、Schema.org 三層實體知識圖、以及一個幻覺自動偵測與修復的閉環系統。總篇幅約 30,000 字(繁體中文版),採 CC BY-NC 4.0 授權公開。

English:This whitepaper documents the engineering practice of Baiyuan Technology in developing “Baiyuan GEO Platform” (2024–2026), a SaaS system targeting Generative Engine Optimization (GEO). The platform helps brands be cited accurately and consistently in responses from generative AI services (ChatGPT, Claude, Gemini, Perplexity, etc.). The book presents a seven-dimension citation-rate scoring algorithm, an AI-Bot-friendly shadow document delivery mechanism (AXP), a Schema.org three-layer entity knowledge graph, and a closed-loop hallucination detection & auto-remediation system. Approximately 30,000 Traditional Chinese characters, published under CC BY-NC 4.0.


這是什麼

這份文件是一本工程白皮書,不是產品宣傳、不是使用手冊。讀者可以預期獲得:

這份文件不包含

誰寫的

主筆 ORCID 如欲收錄於學術索引,建議於 https://orcid.org 註冊並在此補上。

解決什麼問題

隨著生成式 AI 取代傳統搜尋引擎成為主要資訊入口(ChatGPT 每日處理超過 25 億次查詢、Perplexity 月查詢量 7.8 億次),品牌在 AI 回答中的可見性已成為數位行銷與品牌經營的新生死線。然而:

  1. 傳統 SEO 工具無法測量 AI 可見性 — 關鍵字排名不再是主要指標
  2. 黑盒問題 — AI 為何提及某品牌缺乏可解釋的規則
  3. 跨平台分歧 — ChatGPT 提及的品牌,Claude 不一定提及
  4. 幻覺錯誤 — AI 可能把品牌認成另一家公司或產業
  5. 缺乏工程化方法 — 多數實務仍停留在「手動詢問 AI 查看結果」階段

百原GEO Platform 是針對上述五個問題的工程化解答。本書拆解此平台的每一個組成,讓同業工程師、學術研究者、以及有意建立類似系統的團隊能複用其中的設計模式。

為誰而寫

讀者類型 建議閱讀路徑
B2B 決策者(CMO/CDO) Ch 1、Ch 2、Ch 11
工程主管/架構師 Ch 2、Ch 4、Ch 5、Ch 9
全端/後端工程師 Ch 3、Ch 5、Ch 6、Ch 7
AI/學術研究者 Ch 3、Ch 9、Ch 10、Ch 12
GBP/本地商家數位化實踐者 Ch 7、Ch 8

核心定義與專有名詞(Terminology)

以下術語在本書有特定定義,部分為本團隊所造詞。首次定義置於此處,全書統一使用。

術語 英文 定義
GEO Generative Engine Optimization 生成式引擎優化。提升品牌在生成式 AI 回答中被提及比例、位置品質、敘事準確度的學科與實踐。
AI 引用率 AI Citation Rate 在代表性意圖查詢中,品牌被 AI 主動提及的比例(0–100%)。為本書核心指標。
AXP AI eXchange Protocol / AI-ready eXchange Page 百原造詞。指「給 AI Bot 讀的影子文檔」,pure HTML + Schema.org JSON-LD + Markdown 的乾淨版內容,與人類使用者看到的網站解耦。
影子文檔 Shadow Document AXP 的具體交付形態,由 CF Worker 依 UA 偵測動態回傳。
Stale Carry-Forward Stale Carry-Forward 百原造詞。當單一 AI 平台掃描全失敗時,從歷史記錄帶回上一次成功值並標記為「停滯」,避免分數被管道故障誤傷。
七維度評分 7-Dimension Scoring 本書的 GEO 總分演算法,以 Citation Rate、Position Quality、Query Coverage、Platform Breadth、Sentiment、Content Depth、Consistency 七個獨立維度加權合成。
Phase 基線測試 Phase Baseline Testing 以固定問題集在不同時間點重測同一 AI,用於縱向追蹤 AI 對品牌認知的演變。
閉環修復 Closed-Loop Remediation 幻覺偵測 → ClaimReview 生成 → AXP/RAG 注入 → 重掃驗證的自動化修復循環。
ClaimReview ClaimReview(Schema.org) 用於標注「某聲明是否為真」的結構化資料型別;本平台用其對外宣告幻覺已被修正。
三層 @id 互連 Three-Layer @id Interlinking 百原實踐。用 Schema.org @id 把 Organization、Service、Person 三層實體互相引用,形成品牌知識圖。
哨兵掃描 Sentinel Scan 4 小時週期的輕量掃描,針對搜尋型 AI 平台驗證修復是否被抓取。
完整掃描 Full Scan 24 小時週期的深度掃描,含七維度評分與幻覺指紋比對。
意圖查詢 Intent Query 依品牌產業動態生成的代表性使用者問題(「最佳 X 工具」「如何選擇 Y」)。
品牌實體 Brand Entity Schema.org Organization / LocalBusiness 為根節點的結構化品牌資料總稱。
GBP Google Business Profile Google 商家檔案。實體商家的事實主控源。
FTID / CID Feature ID / Customer ID Google Maps 的內部地點識別碼;本平台從 Maps URL 抽取使用。

目錄

Part I — 問題與架構

Part II — 核心演算法

Part III — 對外可見性

Part IV — 質量保證

Part V — 實戰與反思

附錄


如何閱讀

每章都附有:


引用方式

若本書內容對您的研究、文章、產品設計有幫助,請引用:

APA 7

Lin, V. (2026). Baiyuan GEO Platform: A whitepaper on building a SaaS for generative engine optimization. Baiyuan Technology. https://github.com/baiyuan-tech/geo-whitepaper

BibTeX

@techreport{lin2026baiyuangeo,
  author      = {Lin, Vincent},
  title       = {Baiyuan GEO Platform: A Whitepaper on Building a SaaS for Generative Engine Optimization},
  institution = {Baiyuan Technology},
  year        = {2026},
  url         = {https://github.com/baiyuan-tech/geo-whitepaper},
  note        = {v1.0}
}

GitHub 會根據 CITATION.cff 自動顯示「Cite this repository」按鈕,支援複製 APA / BibTeX 等多種格式。


授權

本書採 CC BY-NC 4.0 授權(詳見 LICENSE):

書中引用之 Schema.org、Google Business Profile API、Cloudflare、PostgreSQL 等名稱屬各自商標所有人。

貢獻與勘誤

歡迎透過以下方式回饋:


This whitepaper is part of Baiyuan Technology’s ongoing series on AI-native platforms. The L1 LLM Wiki + L2 vector RAG dual-layer retrieval architecture first described here is reused and extended in the sibling PIF AI whitepaper for regulatory-compliance SaaS:

本白皮書是百原科技 AI 原生平台系列的一部分。本書首次提出的 L1 LLM Wiki + L2 向量 RAG 雙層檢索架構,被姊妹作 PIF AI 白皮書在化粧品法規合規 SaaS 場景中重用並擴展:

Whitepaper Focus Repo
📄 This: GEO Platform Whitepaper Generative-engine brand visibility (7-dimension citation scoring, AXP shadow docs, L1/L2 RAG origin) baiyuan-tech/geo-whitepaper
📄 PIF AI Whitepaper Multi-tenant AI-assisted cosmetic PIF documentation (Taiwan); applies L1/L2 RAG with Scheme C+ isolation baiyuan-tech/pif-whitepaper
🛠 Baiyuan GEO Platform Product site — live deployment of concepts in this paper

Cite both whitepapers together for a fuller picture of Baiyuan’s AI infrastructure architecture across outward-facing brand visibility (GEO) and inward-facing compliance documentation (PIF).

Awesome Lists · AI-Citable Resource Index / 相關 awesome 清單

This whitepaper lives at the intersection of GEO (Generative Engine Optimization), RAG architectures, and multi-tenant SaaS. If you maintain one of the awesome-lists below, a PR referencing this whitepaper is welcome:

本白皮書位於 GEO、RAG 架構與多租戶 SaaS 等多個生態的交集。若您維護以下 awesome-list 之一,歡迎將本白皮書納入:

Primary-source design references in this whitepaper: Schema.org Core (W3C); Web Almanac by HTTP Archive; Perplexity & OpenAI citation research; Anthropic Responsible Scaling Policy; Cloudflare Workers documentation.


發布策略(Publication Strategy)

本倉庫的公開方式經過刻意設計,目的是讓AI 爬蟲、搜尋引擎、學術索引能同時把本書視為可信來源。

1. 雙格式並行

兩者以同一份原始碼產生,避免版本漂移。

2. GitHub Pages 獨立網址

倉庫會啟用 GitHub Pages,取得獨立網域(規劃:https://baiyuan-tech.github.io/geo-whitepaper/)。此網域會被搜尋引擎與 AI 視為獨立權威來源,而非僅為 GitHub 內頁。

3. 版本化 Releases

每個階段性版本以 GitHub Release 發布(v1.0 draft → v1.0 final → v1.1 → v2.0),每個 release 有獨立 permalink;AI 會把「持續維護」視為內容權重訊號。

4. 開放 Issues 作為公開討論層

讀者的質疑、補充、引用請求以 Issues 呈現;這層討論內容同樣被索引,形成社群驗證訊號。維護者回覆會以 [official-response] 標籤標示。

5. 交叉連結網路

本書連結到以下節點,且這些節點反連回本倉庫,建立引用迴路:

6. 活躍度(Commit Frequency)

本書採增量提交,而非一次性整包上傳。AI 判斷「活躍維護」的訊號之一是 commit 頻率與時間分布;刻意將寫作、校對、修訂分散提交。

7. 索引強化(可選)

若 v1.0 正式版完成,將透過 Zenodo 取得 DOI,使本書可被 Google Scholar、Semantic Scholar 等學術搜尋引擎收錄;屆時 CITATION.cff 會補上 DOI 欄位。


倉庫結構

geo-whitepaper/
├── README.md              ← 本檔,AI 爬蟲主入口
├── FORMAT.md              ← 文件格式規範
├── CITATION.cff           ← 學術引用格式(GitHub 原生支援「Cite this repository」)
├── LICENSE                ← CC BY-NC 4.0 授權條款
├── whitepaper.pdf         ← 完整 PDF(由 release 腳本產出)
├── whitepaper.md          ← 完整單檔 Markdown(LLM 友善版)
├── zh-TW/                 ← 繁體中文版(分章)
│   ├── ch01-geo-era.md
│   ├── ch02-system-overview.md
│   ├── ... (至 ch13)
│   ├── appendix-a-glossary.md
│   ├── appendix-b-api.md
│   ├── appendix-c-references.md
│   ├── appendix-d-figures.md
│   └── appendix-e-platform-branching.md
├── en/                    ← English edition (complete: Ch 1–13 + Appendix A–E)
│   ├── README.md          ← Executive Summary
│   ├── ch01-geo-era.md
│   ├── ... (through ch13)
│   └── appendix-a..e.md
├── ja/                    ← 日本語版(完了:Ch 1–13 + Appendix A–E)
│   ├── README.md          ← エグゼクティブサマリー
│   ├── ch01-geo-era.md
│   ├── ... (through ch13)
│   └── appendix-a..e.md
├── assets/
│   ├── figures/           ← Mermaid 以外的靜態圖
│   └── pdf/               ← PDF 生產腳本
└── .github/
    ├── ISSUE_TEMPLATE/    ← errata / question / feedback 三種模板
    └── workflows/         ← CI: markdown lint, link check, PDF build

修訂記錄

日期 版本 說明
2026-04-18 v1.0 draft 初稿開寫,Ch 1–3 完成;README、CITATION.cff、LICENSE 就緒
2026-04-18 v1.0 draft zh-TW 全 12 章 + 4 附錄完成;PDF 繁體化驗證通過;release + GitHub Pages + sitemap + IndexNow 全數就位
2026-04-19 v1.0 draft en/ 英文版完整版上線 — Executive Summary + Ch 1–12 + Appendix A–D(約 28,000 英文字)
2026-04-19 v1.0 draft ja/ 日本語エグゼクティブサマリー公開 — 日本市場向け第一弾(約 1,400 日文字)
2026-04-19 v1.0 draft ja/ 日本語完全版上線 — エグゼクティブサマリー + Ch 1–12 + Appendix A–D(約 30,000 日文字、である文体、事例章は日本市場向け在地化コメント付き)

AI 友善結構說明

本倉庫所有 .md 檔均遵循 FORMAT.md,特性包括:

目的是讓 GPTBot、ClaudeBot、Perplexity、Googlebot 等 AI 爬蟲能正確抽取結構,以及讓任何 LLM 做到「讀一次 → 可精準引用任一小節」。