どこから来たの?超インスタントなrefererの頻度分析
apacheで、ログのフォーマットがcombinedの場合、refererはダブルクォートで囲まれているので、
LogFormat "%h %l %u %t \"%r\" %>s %b \"%{Referer}i\" \"%{User-agent}i\"" combined
tail -f ログファイル | \ awk -F\" '$4 !~ "http://自分のサーバ名" && $4 != "-" {c[$4]+=1; total+=1} \ total > 100 { for (name in c) print name, c[name]; exit 0}' | \ sort -n -k2
とすると、外部からリンクされてきた最新100件のアクセスについて頻度分析ができる。ポータルサイトから間違って(笑)リンクされたときは鯖が超重いので、面倒なことはやってられないので便利だった。