鮮度 (Freshness)

一言定義: 引用元コンテンツの公開日(または最終更新日)から現在までの経過日数。値が小さいほど新しい。

なぜ重要か

  • ビジネス側: 時変的な情報(最新統計・直近キャンペーン・規制改定)を扱う業種では、エンジンが古いソースを引いていると即「外れ」。鮮度が低いエンジンを使うクライアントには新規記事の頻繁更新を勧める必要がある。
  • 学術側: TimeQA (Chen et al. 2021) / StreamingQA (Liska et al. 2022) で確立された時間軸評価の応用。RAG の cache 設計と retrieval freshness policy を観測できる。

計算式

鮮度(経過日数) = (観測時点 − 引用元コンテンツの公開日 / 最終更新日)

エンジン別に分布(median / p25 / p75)で集計。median 30日以内なら鮮度高、median 1年超なら鮮度低、と読む。

ai-search では ground_truth.last_verified 時点との数値一致を 3 値分類(一致 / より新しい / より古い)でも集計。

具体例

仮想シナリオ(factual-static のうち時変フレーズ含む 35 問):

  • ChatGPT Search: median 45 日(直近 1.5 ヶ月)
  • Gemini: median 80 日
  • AI Overview: median 210 日(7 ヶ月前)
  • Claude: median 120 日

AI Overview の 210 日は「最新動向のクエリでも半年以上前の記事を引いてくる」。直近年度の IR 数値などでは AI Overview の数値が古いまま提示される事故が起きやすい。

関連学術文献

  • Chen, W. et al. (2021). A Dataset for Answering Time-Sensitive Questions. NeurIPS 2021 Datasets and Benchmarks Track.
  • Liska, A. et al. (2022). StreamingQA. ICML 2022.

ai-search プロジェクト内での運用

  • 対象クエリ: factual-static 78 問のうち時変フレーズ(「直近年度」「最新」「2026年」等)を含む推定 30-40 問 + Track A temporal-fresh カテゴリ
  • 集計: エンジン別 median + 3 値分類(一致 / より新しい / より古い)
  • 構成概念: C5 Temporal Freshness Tracking 主指標。daily 縦断観測と最も親和性が高い

参考・引用元

  • ドキュメント: 「構成概念 5 つの定義」— GMO ai-search docs/a1-construct-map-2026-05-29.md
  • ドキュメント: 「リサーチ戦略・分析指標12項目」— GMO ai-search docs/research-strategy.md
  • 論文: 「A Dataset for Answering Time-Sensitive Questions (TimeQA)」— Chen et al. 2021, NeurIPS Datasets and Benchmarks Track
  • 論文: 「StreamingQA」— Liska et al. 2022, ICML

2026-05-30 作成。AI検索評価12指標シリーズ ⑪。GMO ai-search の独自新規指標。

関連ノート