1200エントリで1100タグ

自分のブラウザのブックマークとマージするかな、そろそろ。
どうやってやろうか?
はてブのフラットなリスト(タグはグルーピングできるかもしれないが)と、ブラウザのブックマーク=ツリー構造をマージさせる手法としては

  • 直積を作る
  • タグのグループから階層構造を構築して、ブラウザのブックマークのツリーと、オントロジーの辞書をどっかからひっぱってきてマッチングさせる

なんてなことも考えられるが、大げさだし使いづらい。
単純に、ブラウザのブックマークフォルダとして「はてブ」をつくり、その中にまるごと放り込んでしまっても、なんとかなる。しかし、ブラウザが動く環境なら、はてブそのものを参照したほうがマシなんじゃない?
そこで、逆の手を考えてみる。自分のブラウザのブックマークをはてブに突っ込んじゃう。その際にツリーのノード(フォルダ名)をタグとしてくっつけちゃう。
こうやってマージしたリストについて、タグの整理を行って、階層化(包含関係)を考えたほうが面白くないだろうか?
包含関係も、完全なものではなくて、あるタグAを含むエントリの50%以上がタグBを含み、タグBを含むエントリの50%以下しかタグAを含まない場合は タグA<タグB という「順序」をつけて、順序のツリー(循環してるところもあるかもしれないのでツリーとは限らない)をつくり、なんらかの重み付けで最大の部分をツリーのルートとする、とか。