Baiyuan GEO Platform Whitepaper

第12章 — 限界、未解決問題、今後の課題

できないことを明示的に列挙するツールは、万能を標榜するツールよりも信頼に値する。

目次


12.1 プラットフォームができないこと

図 12-1:現行カバレッジマトリクス

能力 カバレッジ ギャップ
モニタリング 完備 サポート済み15 AIプラットフォームのみ、カスタムデプロイや私有LLMには到達不可
スコアリング 完備 業種横断比較は意味を持たない、クエリ空間に主観性が残る
構造化データ 完備 多言語Schema.orgは zh-TW + en + ja のみ、韓国語・東南アジア言語は未対応
ハルシネーション検知 部分 知識源の品質に依存、源が疎な場合カバレッジ低下
ハルシネーション修復 部分 スタボーン(頑固型)は依然人手介入が必要
自動クローズドループ 部分 検索型は高速収束、知識型は低速、中間状態の完全フィードバックは困難
外部プラットフォーム検証 制限 LinkedIn、Crunchbase、G2、Capterra は公開API無し、手動のみ
GBP統合 制限 Phase 2 API承認待ち、現状はURLからPlace ID抽出のみ

図 12-1:「完備」= 機能網羅的、「部分」= 中核は存在するが既知ギャップあり、「制限」= 外部制約によりブロック。

具体的限界

日本市場特有の限界:日本語AI(特に日本語特化LLM、例:Tsuzumi等)のサポート優先度は現行で中位であり、海外AIの日本語応答経由が主軸となる。これは今後のロードマップで拡張予定。


12.2 AIモデルバージョン変動の不予測性

これはエンジニアリング側だけでは完全に解決できない問題である。OpenAIがGPT-5をリリース、AnthropicがClaude 4をリリース、DeepSeekが新旗艦を投入したとき、全ブランドのスコアが同時に3〜10ポイント変動しうる。

バージョン変動の3分類

種類 方向
メジャーモデル更新 GPT-4o → GPT-5 多数のブランドが上昇(新しい学習データ)
安全性 / アラインメント強化 一ベンダが拒否率増加 多数のブランドが低下(拒否は引用を覆い隠す)
検索拡張 on/off Claudeがウェブ検索を追加 or 除去 ウェブ存在感によりブランド毎に方向が異なる

緩和策

百元はこれらの変動を防ぐことはできないが、3つの機構で顧客への衝撃を緩和する:

  1. バージョン感度バナー — 追跡対象AIプラットフォームでメジャーバージョン変更が検出されたら、UIに 「データは新モデルに適応中、短期ボラティリティが予期される」 と表示
  2. フェーズ・ベースラインのバージョン跨ぎタグ付け — モデルバージョン跨ぎのベースラインデータは生値での直接比較が不可、UIで区別
  3. 重み保存型の履歴比較 — 内部で 「特定バージョン下のスコア」 をトレンド分析用に保持、バージョンジャンプをブランド変化と誤帰属しない

12.3 未解決研究課題

1. 真の否定的フィードバック vs ハルシネーション誤認識

AIが 「このブランドはカスタマーサービスが悪い」 と述べたとき、それは:

のどちらかである。対処は根本的に異なる:ハルシネーションは訂正すべき、実フィードバックは隠蔽ではなくサービス改善に繋げるべきである。百元の現行自動化は両者を確実に区別できず、情報源判断のため人手介入を要する。これはクローズドループの真の穴である。

2. 因果 vs 相関

顧客がコンテンツを改訂、3週間後にシテーション率上昇。これは:

厳密な因果証明にはA/Bテスト基盤(同一ブランドの半分を改訂、半分未改訂)が必要 — 商業的には実施不可能。これはGEO分野共通の研究ギャップである。

3. ロングテールクエリのカバレッジ戦略

動的インテントクエリ生成は20〜60本で主要インテント種別を網羅する。しかしロングテールクエリ(極めて特定的、稀な利用者質問)は列挙不可である。顧客が 「うちのユーザがXXと聞いたのにAIが当社を言及しなかった」 と述べたとき、それは:

の区別が現状では困難である。現行はケースバイケース処理。将来の 「顧客提供インテントクエリ」 機能は助けになりうるが、「顧客は自社に都合の良い質問しか尋ねない」 バイアスを導入する。


12.4 ロードマップ

図 12-2:今後の課題依存グラフ

flowchart LR
    subgraph Short["短期(6ヶ月以内)"]
      A1[GBP API Phase 2-3<br/>読み書き]
      A2[多言語 Schema.org<br/>ja / ko 拡張]
      A3[可視化アップグレード<br/>Phase ベースライン表示]
    end
    subgraph Mid["中期(6〜12ヶ月)"]
      B1[AIプラットフォーム拡張<br/>Mistral / Cohere 深化<br/>+ Claude Projects]
      B2[言語跨ぎ sameAs<br/>自動化]
      B3[競合共起アドバイザ]
    end
    subgraph Long["長期(12ヶ月超)"]
      C1[因果推論研究<br/>A/B方法論]
      C2[私有LLMエンティティモニタ]
      C3[マルチテナント・カスタムインテントクエリ]
    end
    A1 --> B1
    A2 --> B2
    A3 --> C3

図 12-2:3フェーズロードマップ。各フェーズは前段階に依存する。具体的タイミングは外部要因(Google、特定AIベンダ)に依存する。

短期フォーカス

長期目標


12.5 実務者と研究者への招待

本書はGEOを議論・共進可能な分野として成立させる試みであり、単一ベンダの閉じた経験にすることを避ける。そのために:

GEOは非常に黎明期である。本書はこの分野における最初期に公開された技術文書の一つとなることを目指す — 後続のチームが各穴を独立再発見するのではなく、我々が既に這い出した穴から出発できるように。

日本市場の実務者へ:2025-2026年は日本でAI導入が加速する時期であり、日本語GEO分野における先発優位の窓が開いている。本書が note.com の CMO/CDO 読者層、Qiita のエンジニア読者層の双方に、共通の技術語彙を提供できれば幸いである。


本章のまとめ

参考資料


ナビゲーション← 第11章:事例研究 · 📖 目次 · エグゼクティブサマリー