[小ネタ][シェル芸]複数サーバのロードアベレージとアクセスログを一度に確認する


nullpopopoELB越しにEC2インスタンスへhttp負荷をかけるテストなどを実施していると、どのサーバがどれだけ負荷かかっていて、さらにどれだけリクエストがきているのか、その中に占めるステータスコードの割合などを見てみたいことがあると思います。

エラー発生時は一台ごとにログインしてエラーログを見たほうがいいけど、まずはサマリだけでも見てみたい場合はこんな感じでいかがでしょう。監視用のサーバからWEBサーバのインスタンスにパスフレーズなしの公開鍵認証でSSHログインできることが前提条件となります。

[ (っ´∀`)っ@友の会 ~]$ while :; do clear; date; echo; for i in 10.100.{128,192}.1{2,4}0; do echo $i; ssh $i w | egrep '(load average)' ; ssh $i wc -l /home/ec2-user/web/logs/{access,error}.log | grep log ; ssh $i cat /home/ec2-user/web/logs/access.log | grep GET | awk '{print $9}' | sort | uniq -c | sort -n | egrep [0-9]$; echo; echo ; done; sleep 10; done

2013年  5月 18日 土曜日 07:23:31 JST

10.100.128.120
 07:23:31 up  1:57,  0 users,  load average: 0.00, 0.01, 0.03
  662 /home/ec2-user/web/logs/access.log
    0 /home/ec2-user/web/logs/error.log
     28 200

10.100.128.140
 07:23:30 up 1 day,  7:23,  0 users,  load average: 0.00, 0.01, 0.05
  1872 /home/ec2-user/web/logs/access.log
   214 /home/ec2-user/web/logs/error.log
     25 304
    428 404
    481 200

10.100.192.120
 07:23:29 up 1 day,  7:23,  0 users,  load average: 0.00, 0.01, 0.05
  1163 /home/ec2-user/web/logs/access.log
    24 /home/ec2-user/web/logs/error.log
     48 404
    176 200

10.100.192.140
 07:23:33 up 1 day,  6:43,  0 users,  load average: 0.00, 0.01, 0.05
  1116 /home/ec2-user/web/logs/access.log
    31 /home/ec2-user/web/logs/error.log
      2 302
     62 404
    168 200

こうしてサーバの負荷とアクセスログ集計を一撃で確認することができます。ね、簡単でしょう?