どこから来たの?超インスタントなrefererの頻度分析

apacheで、ログのフォーマットがcombinedの場合、refererはダブルクォートで囲まれているので、

LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-agent}i\"" combined
tail -f ログファイル | \
  awk -F\" '$4 !~ "http://自分のサーバ名" && $4 != "-" {c[$4]+=1; total+=1} \
            total > 100 { for (name in c) print name, c[name]; exit 0}' | \
  sort -n -k2

とすると、外部からリンクされてきた最新100件のアクセスについて頻度分析ができる。ポータルサイトから間違って(笑)リンクされたときは鯖が超重いので、面倒なことはやってられないので便利だった。