フォークソノミー vs 階層分類

「カテゴリ (階層)」と「タグ (フォークソノミー)」は対立概念ではなく、二層構造として共存させるのが実務的な解。だが til 程度の規模 (18 ノート) でこれを言うと過剰設計に見える。整理しておく。

用語

  • 階層分類 (hierarchical / taxonomic): 木構造。1 ノード = 1 親。DDC・LCC・NDC が典型。トップダウン設計。
  • フォークソノミー (folksonomy): ユーザーが自由にタグを付ける。木ではなくフラットなラベル集合。del.icio.us, Flickr, Twitter ハッシュタグが祖。Thomas Vander Wal が 2004 年に造語 (folk + taxonomy)。
  • ファセット分類 (faceted): 主題を独立した軸 (場所・時間・形式・主題) に分解。UDC, Colon Classification。階層とフォークソノミーの中間。

Vander Wal 自身は folksonomy を 2 型に分けた:

  • Broad folksonomy: 多数のユーザーが同じリソースに各自タグを付ける (del.icio.us)。タグ頻度分布が情報になる。
  • Narrow folksonomy: 作成者本人 (または少数) がタグを付ける (Flickr の写真)。til はここに該当。

階層の長所と短所

長所:

  • 全体俯瞰が容易。「どこに何があるか」が一発で分かる。
  • 同じ規則で増え続ける。蔵書管理として完成度が高い。
  • ナビゲーションが安定 (URL も含む)。

短所:

  • 1 リソース = 1 場所の縛り。境界事例で必ず妥協が出る (「Claude Code は AI か engineering か」)。
  • 新領域への追従が遅い (DDC が AI を 006.3 に押し込んだのが好例)。
  • 設計者の世界観バイアスが固定化する。

フォークソノミーの長所と短所

長所 (Wikipedia 整理より):

  • 学習コストゼロ。書く人の語彙がそのまま使える。
  • 多次元: 1 リソースに何枚でも貼れる。
  • ロングテールが拾える。
  • 文化・政治バイアスから自由 (建前)。

短所:

  • 同義語問題: LLM / 大規模言語モデル / 言語モデル が分かれる。
  • 多義語問題: Python (言語 / ヘビ)。
  • 粒度バラツキ: Gitバージョン管理 が同じ重さで並ぶ。
  • スパム・ノイズ耐性なし (共同タグの場合)。
  • 検索は良いが俯瞰は破綻する (1000 タグの一覧は使えない)。

til の現状を診断する

_data/taxonomy.json を見ると:

  • 6 トップカテゴリ = 階層 (engineering / ai / design / product / mind / life)
  • タグ群 = narrow folksonomy (本人付与, 同義語制御なし)

すでにハイブリッドだが、課題が見える:

  1. 認知科学 7 件 / 学習理論 6 件 — 完全同一の 6 件を共有。実質的に同義のタグが分裂している (broad folksonomy なら自然収束するが narrow では起きない)。
  2. Claude Code 5 件が ai 3 + design 2 に分散。カテゴリ境界がタグでつながっている = ハイブリッドが機能している例。
  3. life 0 件のまま。トップカテゴリの「箱」を用意したが中身が来ない。階層型の典型的弱点。
  4. タグの粒度が混在: Git (具体ツール) と バージョン管理 (概念領域) と Webホスティング (技術カテゴリ)。

til に何が向くか — 暫定結論

規模が小さいうち (~50 ノート) は:

  • トップカテゴリは固定。ナビゲーション骨格として。ただし「使われない箱」は閉じる勇気を持つ (life が 3 ヶ月空なら統合)。
  • タグは narrow folksonomy のまま、ただし軽い統制を入れる
    • 同義語ルール: 認知科学 / 学習理論 のどちらを正とするか決める。
    • 粒度ルール: タグは「ツール名」「広い概念」のどちらかに揃える。両方混ぜない。
  • ファセット導入は時期尚早。100 ノート超えたら facet (主題 × 形式 × 時代) を検討。

つまり「階層 + 統制タグ」の 2 層で十分。Wikipedia category も同じ哲学で、ガイドラインで運用される narrow folksonomy。

なぜ純粋フォークソノミーにしないか

til は 作品集 であって 蔵書 ではない。Niki 一人が書き、Niki がほとんど読み返す。検索性より「俯瞰して全貌が見える」価値の方が大きい。フォークソノミーは大量・多人数で初めて統計的に意味が出る。18 ノートに 30 タグはノイズに近い。

参考・引用元

関連ノート