単一のスコアはどんな複雑系も比較可能な数字に圧縮する。しかし同時に、見るべき差異も一緒に圧縮してしまう。
百原 GEO の 2024 年初版採点は単一指標 Citation Rate——「言及回数 ÷ クエリ総数」だけだった。シンプル、直感的、比較可能。しかし運用 3 ヶ月で、この指標が体質の異なるブランドを同一スコアに圧縮してしまう誤判定事例が大量に蓄積された。
v1 で両方 55 点を記録した実際のケース 2 例:
両者の「AI に認識されているエネルギー」の差は極めて大きい。にもかかわらず、単一スコアは両者を同一セルに圧縮してしまう。ユーザーがこのスコアだけを見れば、アクション可能な情報がすべて失われる。
単一スコアの根本的な問題は:GEO は多次元現象である。言及回数・言及ポジション・言及プラットフォーム・トーン・記述深度・クロスプラットフォーム一貫性——これらはそれぞれ独立した信号であり、平均値に混ぜた瞬間に情報が消える。
百原 GEO v2 の採点は「AI エコシステム内のブランド状態」を 7 つの独立次元に分解する:
%%{init: {'theme':'base'}}%%
graph LR
A[Citation Rate<br/>シテーション率] --- B[Position Quality<br/>ポジション品質]
B --- C[Query Coverage<br/>クエリカバレッジ]
C --- D[Platform Breadth<br/>プラットフォーム広度]
D --- E[Sentiment<br/>センチメント]
E --- F[Content Depth<br/>コンテンツ深度]
F --- G[Consistency<br/>一貫性]
G --- A
図 3-1:7 次元の関連を示す。隣接する次元には情報補完性があり、非隣接次元は独立に計算する。実際のレーダー図(0〜100)は PDF 版で実データとして提示する。
定義:代表的意図クエリの中で、ブランドが自発的に言及される割合(0〜100)。
出発点:mentioned_count / query_count。
精緻化:
重みの割合:最大の単一次元ではあるが、意図的に 25%(4 分の 1)に抑える。v1 の単一指標状態に退化することを避けるため。
定義:ブランドが AI 回答に登場するポジションの加重平均スコア。
ロジック:AI の回答を段落・文・箇条書きに分割し、各「言及」に対してポジション加重を与える:
| 位置 | 重み |
|---|---|
| 第 1 文 / リスト第 1 項 | 1.0 |
| 冒頭 3 分の 1 | 0.8 |
| 中盤 | 0.5 |
| 末尾 / 追記 | 0.2 |
この次元は v1 時代によくあった疑問——「言及されているのに効果を感じない、なぜ?」——を解く。答えはしばしば「言及が遅すぎ、軽すぎる」。
定義:言及される意図クエリタイプの多様性。
ロジック:意図クエリを「ベスト選択型」「比較型」「問題解決型」「入門推薦型」等に分類し、言及されたタイプ数 ÷ 総タイプ数。
この次元が露わにするのは:「ベスト X ツール」系の質問では言及されても、「A と B どちらを選ぶ?」の比較質問では完全に姿を消すブランドがある——異なる戦場には異なるコンテンツ戦略が必要である。
定義:ブランドがいくつの AI プラットフォームで自発的に言及されるか。
ロジック:言及プラットフォーム数 ÷ 監視プラットフォーム総数。
プラットフォームの偏食を露わにする。例えば OpenAI 系では言及されるが中国モデル(DeepSeek、Kimi)では完全に欠席する SaaS——これはランダム誤差ではなく、特定のコンテンツ可視性問題(訓練データ源、構造化データ対応範囲)を示している。
定義:言及テキストの感情傾向。
ロジック:独立した感情分類モデルで各言及を「ポジティブ / ニュートラル / ネガティブ」に分類し、0〜100 に集計。AI 本体の推論文をそのまま使わない(「A AI が A AI を自己評価する」問題を避けるため)。
この次元はブランド危機後に特に敏感になる。通常スキャンではニュートラルが 70〜80% を占めるが、50% に落ちると外部にチェック可能なネガティブコンテンツが発生したシグナルとなる。
定義:AI がブランドに言及する際に添える記述の深度。
ロジック:「ブランドに関する自然言語テキスト」の長さ、実体密度(プロダクトライン・創業者・応用シナリオ等どれだけ関連事実を挙げるか)、構文複雑度を分析。
この次元は「名前を挙げられる」と「紹介される」の違いを分別する。B2B SaaS、教育機関、専門サービスにおいては、Content Depth は Citation Rate 自体より重要——深度ある記述こそがコンバージョンを生む。
定義:同一ブランドの上記 6 次元を異なる AI プラットフォームで集計した標準偏差の逆数(0〜100 に正規化)。
ロジック:一貫性の高いブランドは ChatGPT、Claude、Gemini、DeepSeek のどこでも似た語り口とスコアを得る。一貫性の低いブランドは、あるプラットフォームでは鮮明でも別のプラットフォームではぼんやりしている。
この次元は他の次元を変えないが、「結果の信頼性」を示すシグナルになる:一貫性が高いほどブランドの AI 認識が安定したエンティティ像に収束していることを意味し、低いほど AI 間で認識が分散している。
7 つの次元は単純平均しない。重み配分は 3 つの原則に基づく:
本章では公式の骨格と重みのグルーピング(高 / 中 / 低)を開示するが、精密な数値は非公開とする。これは秘密主義ではなく、顧客が指標最適化に走って実質最適化を怠る事態を防ぐためである:
ある次元が 30% を占めることを知ってしまうと、その次元だけにリソースを投入し、スコアは上がるが AI の実際の認識は変わらないという結果になる。我々は「全体的なコンテンツ品質の改善」に集中してほしい。重みの分解には集中してほしくない。
この設計思想は検索エンジンアルゴリズムの歴史と一致する——Google も同じ理由で PageRank の精密な重みを公開しなかった。
// weights are resolved from config; values are deliberately not exposed.
function calcGEOScore(scanResults, brandId) {
const dims = {
citation: computeCitationRate(scanResults, brandId),
position: computePositionQuality(scanResults, brandId),
coverage: computeQueryCoverage(scanResults, brandId),
breadth: computePlatformBreadth(scanResults, brandId),
sentiment: computeSentimentScore(scanResults, brandId),
depth: computeContentDepth(scanResults, brandId),
consistency: computeConsistency(scanResults, brandId),
};
const weighted =
dims.citation * W_CITATION +
dims.position * W_POSITION +
dims.coverage * W_COVERAGE +
dims.breadth * W_BREADTH +
dims.sentiment * W_SENTIMENT +
dims.depth * W_DEPTH +
dims.consistency * W_CONSISTENCY;
return {
total: Math.round(weighted),
dimensions: dims,
version: SCORING_VERSION,
};
}
| 側面 | SEO スコア | GEO スコア |
|---|---|---|
| 入力データ | ページコンテンツ + 被リンク + UX メトリクス | AI 応答テキスト + エンティティ照合 + クロスプラットフォーム集約 |
| 結果形態 | リンク順位 | 自然言語での言及 |
| 時間粒度 | 日次 | 日次 + センチネル 4h + Phase 週次 |
| 比較可能性 | サイト間で可比 | 業種横断では厳密には不可比(意図クエリ空間が異なる) |
| バージョン感受性 | 低 | 高(AI モデルバージョンの影響大) |
この表が強調することは 1 点:GEO スコアは「ブランド状態指標」であって「品質順位指標」ではない。業種ごとにスコアの基準線が異なり、業種横断で大小を比べても意味がない。
この 7 次元システムができないことを誠実に列挙する:
これらはアルゴリズムの失敗ではなく、GEO 本質への誠実な陳述である。「AI 認識を精密に定量化できる」と主張するツールはすべて疑うべきである。
ナビゲーション:← 第 2 章:システム全景 · 📖 目次 · 第 4 章:Stale Carry-Forward →