一個工具誠實列出做不到的事,比聲稱無所不能更值得信任。
| 功能維度 | 覆蓋程度 | 缺口 |
|---|---|---|
| 監測 | 完整 | 僅限支援的 15 個 AI 平台;其他如 Claude Projects、私有部署的 LLM 無法觸及 |
| 評分 | 完整 | 跨產業比大小無意義;查詢空間主觀 |
| 結構化資料 | 完整 | 多語版 Schema.org 僅 zh-TW + en;日、韓、東南亞語系待擴充 |
| 幻覺偵測 | 部分 | 依賴知識來源品質;知識稀疏時覆蓋率下降 |
| 幻覺修復 | 部分 | 頑固幻覺需人工介入 |
| 自動化閉環 | 部分 | 搜尋型收斂快、知識型收斂慢,中間態難以完整回饋 |
| 外部平台驗證 | 受限 | LinkedIn、Crunchbase、G2、Capterra 無公開 API,僅能手動 |
| GBP 整合 | 受限 | Phase 2 API 核准中;目前僅能靠 URL 抽 Place ID |
Fig 12-1: 「完整」= 功能齊全;「部分」= 覆蓋核心但有缺口;「受限」= 受外部因素限制。
這是一個無法從工程端完全解決的問題:當 OpenAI 發布 GPT-5、Anthropic 發布 Claude 4、或 DeepSeek 發布新主力模型時,所有品牌的分數可能同時跳動 3–10 分。
| 類型 | 範例 | 影響方向 |
|---|---|---|
| 主要模型升級 | GPT-4o → GPT-5 | 多數品牌分數上升(新模型訓練資料更新) |
| 安全/對齊調整 | 某家模型拒答率變嚴 | 多數品牌分數下降(被 refusal 蓋掉引用) |
| 檢索增強啟用/關閉 | Claude 新增/關閉 web search | 不同品牌方向相反,取決於該品牌內容的網路可得性 |
百原無法阻止這些變動,但透過以下三個機制降低對使用者的衝擊:
當 AI 說「該品牌客服很差」時,這可能是:
兩種情況的處理截然不同:幻覺應修復;真評應改善服務而非掩蓋。目前百原的自動化無法可靠區分兩者,需要人工介入判斷來源。這是影響閉環完整性的重要缺口。
客戶做了內容改版,3 週後引用率上升。這是:
目前無法嚴謹證明因果。學術上要解決這個問題需要 A/B 測試基礎(同一品牌分半、一半改版一半不改),但商業上不可能。這是 GEO 工具共同的研究性缺口。
意圖查詢動態生成的 20–60 題能覆蓋主要 intent,但長尾查詢(使用者問的非常具體、不常見的問題)無法窮舉。當客戶反映「我的使用者問了 XX,AI 沒提我」,這到底是:
目前只能個案處理。未來若引入「客戶自定 intent query」功能可緩解,但會面臨「客戶只敢問對自己有利的問題」的偏差風險。
flowchart LR
subgraph Short["短期(6 個月內)"]
A1[GBP API Phase 2-3<br/>資料讀取與寫入]
A2[多語 Schema.org<br/>擴充到 ja / ko]
A3[視覺化趨勢圖<br/>加強 Phase 基線呈現]
end
subgraph Mid["中期(6-12 個月)"]
B1[更多 AI 平台<br/>Mistral / Cohere 深化<br/>+ Claude Projects]
B2[跨語言 sameAs<br/>自動化填寫]
B3[競品共現智慧建議]
end
subgraph Long["長期(12 個月 +)"]
C1[因果推論研究<br/>A/B 測試方法論]
C2[私有部署 LLM<br/>的實體監測]
C3[多租戶客製 intent query]
end
A1 --> B1
A2 --> B2
A3 --> C3
Fig 12-2: 三階段 roadmap。每階段依前階段交付;具體時程依需求與 Google/各 AI 平台的外部進度調整。
本書試圖做到的是讓 GEO 成為一個可被討論、可被共同推進的工程學科,而非單一工具商的閉源經驗。為此:
GEO 還在非常早期。希望本書是這個領域早期的開放技術文件之一,讓後來的團隊能從我們已經踩過的坑上起步,而不是每個人都重蹈覆轍。
導覽:← Ch 11: 5 品牌實戰數據 · 📖 目次 · 附錄 A: 詞彙表 →