2502 相関 はくぶん 2010-01-31 06:54:09
ウェブサーバのアクセス数とログ容量の関係について調べてみた。

過去トップ5は以下の通り。
期間アクセス数ログ容量(KB)アクセス数/KB
2005年07月1,443,398341,8484.23
2005年08月1,369,526325,5994.21
2005年05月1,366,110331,1954.13
2005年09月1,304,659309,7744.22
2005年04月1,255,060302,6274.15

アクセス数が多ければログ容量も大きくなるのは当然だが、
必ずしも比例関係になるというわけでもなさそうだ。

最近3ヶ月の状況は次の通り。
期間アクセス数ログ容量(KB)アクセス数/KB
2009年11月937,323247,0463.80
2009年12月918,433241,1303.81
2009年10月907,712242,0643.75

2005年当時と今とで決定的に違う点は、1KBあたりのアクセス数。
昔は1KBあたり4アクセスを超えていたが、今は3.8アクセス程度。

アクセス毎に記録される文字数が、2005年よりも今の方が多くなっている。
ウェブサーバログは、記録される項目が決まっており、
文字数に大きな違いの出る部分と言えば、
ユーザーエージェントとリファーくらい。

その部分の情報が長くなっていると考えられる。

UNICODEの普及により、検索エンジンからやって来るリファーに含まれるキーワードが、
2バイト文字から3バイト文字に変化しているということもあるだろう。

昔は235,000KBあたりで100万アクセスを超えていたが、
今は265,000KBくらいまで行かないと100万を超えない。

今月のアクセスログは295,000KB前後になると思われる。
2005年なら126万アクセスくらいの容量だが、今では112万くらいだろう。

容量は簡単に見れるが、アクセス数は中身を開かないとわからない。
容量を見て、アクセス数が簡単にわかる方法というものはないんだな。
メッセージ文字数:828/1885