ホームページ~ログファイル
種類
ホームページ関連のログとしては、Webのアクセスログとエラーログを見ることが出来ます。Webアクセスログ・WebエラーログはApacheが出力したテキスト形式の生ログです。また、Webのアクセスログを集計してHTML形式で 統計情報を表示するログ解析も行えます。
WebARENA Suiteとの相違点
- ログ解析ソフトはwwwstatからwebalizerに変更されました。
- デフォルトではログ解析(HTML形式のWebアクセスログ)は作成されなくなりました。 ログ解析を行う場合、サイトマネージャーから設定を行なう必要があります。
参照方法
管理ツール(サイト管理者の場合サイトマネージャ、Web特権ユーザの場合Webマネージャ)では最近10~500件の生ログを参照することが出来ます。また、サイトマネージャではログ解析も参照することが出来ます。
FTPでのダウンロードでは前日以前の生ログとログ解析を参照することが出来ます。
Webアクセスログ | Webエラーログ | ログ解析 | |
---|---|---|---|
サイトマネージャー | ○ (最近500件) | ○ (最近500件) | ○ |
Webマネージャー (Web特権ユーザのみ) |
○ (最近500件) | ○ (最近500件) | × |
FTPでのダウンロード | ○ (前日以前) | ○ (前日以前) | ○ |
WebARENA Suiteとの相違点
- 最近500件より前の当日のログは、翌日になるまで見られなくなりました。
参照出来るお客様
ログファイルを参照できるのはサイト管理者・Web特権ユーザです。
ログファイル用ディレクトリ
ログファイルはサーバーの /log ディレクトリ内に保存されます。/log ディレクトリ内はさらに/log/www と /log/ftp に分かれており、/log/www にWeb、 /log/ftp にFTPのログが保存されます。
WebARENA Suiteとの相違点
- FTPのログが追加されたことに伴いディレクトリが分けられました。
保存期間
生ログのログファイルは1日分ごとに1つのファイルにまとめられ、あらかじめ設定されている保存日数分が サーバーに保存されます。設定されている日数が経過したログファイルはサーバーから自動的に削除され、参照することは出来なくなります。 ただし、ログ解析だけは保存日数の設定に関わらず過去12か月分のログが保存されます。
保存日数は0日~40日の範囲で任意に設定する事が出来ます。設定はサイト管理者の場合サイトマネージャにアクセスして、「Web&FTP管理」→「ログファイル」→「ログ保存日数」から行うことが出来ます。Web特権ユーザの場合Webマネージャにアクセスして、「Webアカウント管理」→「ログファイル」→「ログ保存日数」から行うことが出来ます。
初期状態では7日に設定されています。なお、0日に設定すると /log ディレクトリ配下へのログファイルの保存は行われなくなり、以下のログ以外は参照できなくなります。
- 最近500件分のWebアクセスログ
- 最近500件分のWebエラーログ
- 最近500件分のFTPアクセスログ
ログファイルの容量
ログファイルはご契約頂いたディスク容量を使用します。Webコンテンツの容量として計算されますので、 ログを多く使用するお客様はサイトマネージャーの「Web/メール容量配分」でWebの容量を多めに配分しておいて下さい。 なお、当日分の記録途中の生ログはお客様のディスク容量を使用しません。
Webアクセスログ
WebアクセスログはHTTPリクエストを記録したApacheの生ログです。以下のファイル名で作成されます。
access_[日付].log.gz (通常のホームページ)
ssl_access_[日付].log.gz (SSLのホームページ)
日付は [YYYYMMDD] の形式になっています。たとえば、2003年4月1日のログファイルは
access_20030401.log.gz
となります。gzip形式で圧縮されていますので、解凍して参照して下さい。
書かれている内容はWebARENA Suite2で使用しているWWWサーバープログラム「Apache」で定義されているログフォーマットのうち 「combined」という名称が付けられたフォーマットを採用しています。書式は以下の様になっています。
(host) - - [(date)] "(request)" (status) (bytes) "(referer)" "(user-agent)"
- (host)はアクセスしたクライアントのIPアドレスです。
※ドメイン名でのアクセス制限を行っている時に限り、IPアドレスから ドメイン名が逆引き検索できた場合はドメイン名で記録されます。 - (date)はアクセスがあった日時です。
- (request)はクライアントからのリクエスト内容です。
- (status)はクライアントに返されたHTTPステータス番号です。
- (bytes)はクライアントに送信されたデータのバイト数です。
- (referer)は環境変数Refererの値です。リンク元のページのアドレスが記録されます。
- (user-agent)は環境変数User-Agentの値です。ページを参照しているクライアント(ブラウザ) の情報が記録されます。
例えば、Webアクセスログに以下の情報が記録されていたとします。 (ここでは改行を入れていますが、実際には1行につながって表示されます。)
192.168.1.1 - - [13/Jan/2003:16:20:21 +0900]
"GET /counter.html HTTP/1.1" 200 600 "http://abc.st123.arena.ne.jp/index.html"
"Mozilla/4.0 (compatible; MSIE 5.5; Windows NT 5.0)"
この部分からは、
- 192.168.1.1というIPアドレスのクライアントから
- 日本時間の2003年1月13日 16時20分21秒に
- GET /counter.html HTTP/1.1というリクエストがあり、
- 200というHTTPステータスと
- 600バイトのデータを返し、
- このアクセスのリンク元はhttp://abc.st123.arena.ne.jp/index.htmlで、
- クライアントはWindows 2000版のInternet Explorer 5.5 (Windows NT 5.0はWindows 2000を 意味しています。)
という事が分かります。
WebARENA Suiteとの相違点
- ログファイルの名前に日付が付くようになりました。
Webエラーログ
Webエラーログは発生したエラーを記録したApacheの生ログです。以下のファイル名で作成されます。
error_[日付].log.gz (通常のホームページ)
ssl_error_[日付].log.gz (SSLのホームページ)
日付は [YYYYMMDD] の形式になっています。たとえば、2003年4月1日のログファイルは
error_20030401.log.gz
となります。gzip形式で圧縮されていますので、解凍して参照して下さい。
書かれている内容はWebARENA Suite2で使用しているWWWサーバープログラム「Apache」の標準フォーマットになっており、ページが参照された時や CGIが実行された時にエラーが発生するとそのエラーの情報が記録されます。書式は以下の様になっています。
[(date)] [error] [client (host)] (error)
- (date)はアクセスがあった日時です。
- (host)はアクセスしたクライアントのIPアドレスまたはドメイン名です。
- (error)は発生したエラーの内容です。
例えば、Webエラーログに以下の情報が記録されていたとします。(ここでは改行を入れていますが、実際には1行に つながって表示されます。)
[Thu Jan 13 16:13:38 2003] [error] [client 192.168.1.1]
File does not exist: /home/abc.html
この部分からは、
- 日本時間の2003年1月13日 16時13分38秒に
- 192.168.1.1というIPアドレスのクライアントからアクセスがあり、
- File does not exist: /home/abc.htmlという内容のエラーが発生した
という事が分かります。
記録されるエラーメッセージの内容には様々なものがありますが、ページの表示が正常に行われない場合やCGIの実行が失敗してしまう 場合などはエラーメッセージの内容をご覧頂くと原因が特定出来る場合があります。
WebARENA Suiteとの相違点
- ログファイルの名前に日付が付くようになりました。
ログ解析
Webアクセスログの過去12か月分の内容をHTML形式でまとめた統計情報ログです。ログ解析は、 以下のファイル名で作成されます。
access_analyzed.tgz (通常のホームページ)
ssl_access_analyzed.tgz (SSLのホームページ)
tar + gzip形式で圧縮されていますので、解凍して参照して下さい。 デフォルト状態ではログ解析は作成されません。ログ解析を行いたい場合はあらかじめサイトマネージャーで設定しておく 必要があります。設定はサイトマネージャー内の、「Web&FTP管理」→「ログファイル」→「アクセスログ解析 ON-OFF」から行うことができます。
ログ解析では、以下の統計情報を見ることが出来ます。
サンプル画像はこちらよりご覧いただけます。
- 日ごとの統計
- 時間ごとの統計
- URL
- エントリー
- Exit
- サイト
- リファラー
- 検索文字列
- エージェント
- 国
統計情報に表示されているHits・Files・Pages・Visits・Sites・KBytesはそれぞれ以下の内容を示しています。
Hits | 全アクセス数 |
---|---|
Files | Hitsのうち正常に処理された(エラーを除いた)アクセス数 |
Pages | HitsのうちHTMLファイルへのアクセス数 |
Visits | Filesをもとに計算された訪問者数 |
Sites | Hitsをもとに計算された訪問サイト数 |
KBytes | 転送したデータ量(キロバイト単位) |
VisitsはFilesのうち、最初のアクセスから30分以内に同じIPアドレスからアクセスがあった場合そのアクセスを カウントせずに集計したアクセス数です。この項目からおよその訪問者数を知ることが出来ます。
SitesはHitsのうち、 最初のアクセスから1年以内に同じIPアドレスからアクセスがあった場合そのアクセスをカウントせずに集計したアクセス数です。 この項目からおよその延べ訪問者数を知ることができます。
WebARENA Suiteとの相違点
- 解析ツールがwwwstatからwebalizerに変更されました。
- 1日ずつではなく、過去12か月分のデータがまとめて集計されるようになりました。
- デフォルトではログ解析は行われなくなりました。
ワームのアタックへの対処
WebARENA Suite2のサーバーに限らず、インターネット上のWebサイトには「Code Red」「Nimda」などのワームに感染 したサイトから頻繁にアタックが行われています。WebARENA Suite2のサーバーはこれらのワームには感染しませんが、 アタックの際に送られてくるHTTPリクエストが非常に多いため、通常の状態ではアクセスログが非常に大きくなってしまいます。
この現象への対処として、WebARENA Suite2のサーバーはリクエストURIに以下の文字列が含まれる場合、そのアクセスをワームによるアクセス とみなしアクセスログへの記録を行いません。
- /system32/cmd.exe
- /MSADC/root.exe
- /scripts/root.exe
- /default.ida
- /NULL.IDA
また、8KBより長いリクエストのアクセスがあった場合、アクセスログに記録されるリクエストURIに「-」と記録します。
なお、エラーログへの記録は通常通り行われます。
※送られたリクエストの内容がHTTPのフォーマットとして不正な内容だった場合など、まれにパターンに該当する文字列が含まれていても アクセスログに記録されてしまう場合があります。