一個單一分數可以把任何複雜系統壓扁成一個可比較的數字;但也可能把該被看見的差異一起壓扁。
百原GEO 在 2024 年的第一版評分,只有一個指標:Citation Rate,計算方法是「被提及次數 ÷ 總查詢次數」。簡單、直觀、可對比。然而上線三個月後,我們發現這個單一指標會產生大量誤導相同的案例。
以下兩個真實案例在 v1 下都得到 55 分,但品牌體質完全不同:
這兩個品牌的實際「被 AI 認知的能量」差距極大,但單一分數把它們壓成同一個格子。使用者若只看這個分數,會錯失所有可行動的資訊。
單一分數的根本問題在於:GEO 是一個多維度的現象。被提到的次數、提到的位置、提到的平台、提到的語氣、描述的深度、跨平台的一致性——這些都是獨立的訊號,混成一個平均值之後資訊全部遺失。
百原GEO v2 的評分把「品牌在 AI 生態的狀態」拆成七個獨立維度:
%%{init: {'theme':'base'}}%%
graph LR
A[Citation Rate<br/>被提及率] --- B[Position Quality<br/>位置品質]
B --- C[Query Coverage<br/>查詢覆蓋率]
C --- D[Platform Breadth<br/>平台覆蓋度]
D --- E[Sentiment<br/>情感分數]
E --- F[Content Depth<br/>內容深度]
F --- G[Consistency<br/>跨平台一致性]
G --- A
Fig 3-1: 七維度關聯示意;相鄰維度有資訊互補性,非相鄰維度獨立計算。實際雷達圖(各維度 0–100)留待 PDF 版以真實數據呈現。
定義:在代表性意圖查詢中被品牌名主動提及的比例(0–100)。
計算起點:mentioned_count / query_count。
精煉:
權重佔比:最大單一維度,但刻意壓在 25%(四分之一),避免退回 v1 單一指標。
定義:品牌在 AI 回答中出現位置的加權平均分數。
計算邏輯:把 AI 的回答切成段、句、列點;每個「提及」依出現位置給加權:
| 位置 | 權重 |
|---|---|
| 首句 / 列表第 1 項 | 1.0 |
| 前三分之一 | 0.8 |
| 中段 | 0.5 |
| 末段 / 延伸補充 | 0.2 |
此維度解答了 v1 時代的常見疑問:「為什麼我被提到但感覺沒幫助?」答案往往是:提得太晚、太輕描淡寫。
定義:被提及的查詢類型多樣性。
計算邏輯:將意圖查詢分類(「最佳選擇型」「比較型」「問題解法型」「入門推薦型」),統計被提及的覆蓋類型數 ÷ 總類型數。
此維度揭露:有些品牌只在「最佳 X 工具」類問題中被提及,但在「我該選 A 還是 B」的比較題中完全消失——這是不同的戰場,需要不同的內容策略。
定義:品牌被多少個 AI 平台主動提及。
計算邏輯:出現提及的平台數 ÷ 監測平台總數。
此維度揭露平台偏食。例如某 SaaS 只在 OpenAI 系列被提及,但在中國模型(DeepSeek、Kimi)完全缺席;這不是隨機誤差,而是指向特定的內容可見性問題(訓練資料來源、結構化資料覆蓋度)。
定義:提及文本的情感傾向。
計算邏輯:用獨立的情感分類模型把每次提及分為「正面 / 中性 / 負面」,聚合成 0–100 分。不直接用 AI 的原 reasoning,避免「A AI 對 A AI 的自我評價」問題。
此維度在品牌有危機事件後特別敏感。一般掃描下中性佔大多數(70–80%),當跌到 50% 時通常意味著外部出現了可檢視的負面內容源。
定義:AI 提及品牌時所附帶的描述深度。
計算邏輯:分析該段「關於品牌的自然語言文字」的長度、實體密度(提到多少個相關事實—產品線、創辦人、應用情境等)、句法複雜度。
此維度區分了「被點名」(一句話帶過)與「被介紹」(一段深度描述)。對於 B2B SaaS、教育機構、專業服務,Content Depth 比 Citation Rate 本身更關鍵——深度描述才能真正帶來轉換。
定義:同一品牌在不同 AI 平台的上述六維分數的標準差之倒數(正規化到 0–100)。
計算邏輯:一致性高的品牌,在 ChatGPT、Claude、Gemini、DeepSeek 都得到相近的敘事與分數;一致性低的品牌,可能在某平台形象鮮明、在另一平台模糊不清。
此維度本身不改變其他維度,但它提供「結果可靠性」的訊號:一致性高的分數代表品牌的 AI 認知已經收斂到一個穩定的實體印象;一致性低則代表 AI 間對此品牌的認知仍在分歧。
七個維度不是平均加總。各維度的權重以三個準則取捨:
本章揭露公式骨架與權重分群(高/中/低),不揭露精確數字。這個決定不是為了保密,而是為了防止客戶優化指標而非優化實質:
如果你知道某一維度佔 30%,你就會砸資源只衝那一維度;結果分數上升、AI 實際認知卻沒變。我們寧願讓你專注於「改善整體內容質量」而非「拆解分數權重」。
此設計哲學與搜尋引擎演算法的歷史一致——Google 從未公開 PageRank 的精準權重,原因相同。
// weights are resolved from config; values are deliberately not exposed.
function calcGEOScore(scanResults, brandId) {
const dims = {
citation: computeCitationRate(scanResults, brandId),
position: computePositionQuality(scanResults, brandId),
coverage: computeQueryCoverage(scanResults, brandId),
breadth: computePlatformBreadth(scanResults, brandId),
sentiment: computeSentimentScore(scanResults, brandId),
depth: computeContentDepth(scanResults, brandId),
consistency: computeConsistency(scanResults, brandId),
};
const weighted =
dims.citation * W_CITATION +
dims.position * W_POSITION +
dims.coverage * W_COVERAGE +
dims.breadth * W_BREADTH +
dims.sentiment * W_SENTIMENT +
dims.depth * W_DEPTH +
dims.consistency * W_CONSISTENCY;
return {
total: Math.round(weighted),
dimensions: dims,
version: SCORING_VERSION,
};
}
| 面向 | SEO Score | GEO Score |
|---|---|---|
| 輸入資料 | 網頁內容 + 外鏈 + UX metrics | AI 回應文本 + 實體比對 + 跨平台聚合 |
| 結果型態 | 連結排名 | 自然語言提及 |
| 時間粒度 | 每日 | 每日 + 哨兵 4h + Phase 週 |
| 可比性 | 跨網站可比 | 跨產業不嚴格可比(不同產業查詢空間不同) |
| 版本敏感度 | 低 | 高(受 AI 模型版本影響) |
這張表強調一件事:GEO Score 是「品牌狀態指標」,不是「品質排名指標」。不同產業的分數基線不同,跨產業比大小並無意義。
誠實列出這個七維度系統做不到的事:
這些限制不是演算法的失敗,而是對 GEO 本質的誠實陳述。任何聲稱「能精準量化 AI 認知」的工具都應該被懷疑。