検索語句の文字化け対策  /  IPアドレスの名前解決  /  WindowMediaサービスの
ログ解析

WEBALIZER 日本語化 for Windows


このページは、個人的な覚え書きです。
その為、webalizer の基本的な使い方などは記載していません。
知り合いの要望により、極力日本語化した Windows 版の Webalizer をカスタマイズしました。

要望 :
 Windowsで処理したい。
 直感的にわかるようになるべく日本語で表示したい。
 レスポンスコードも日本語に変換してほしい。等
ただし、グラフィックで処理する部分の日本語化には対応していません。( ?? わからない ?? )
未熟者が作っているものですから、無茶な日本語も含まれます。

開発環境
Windows XP Professional ServicePack 2
Cygwin Ver.2.340.2.5-1-jp
webalizer Ver.2.01-10 Win32
ど素人の知識

動作環境 ( 必須 )
Windows
EUC文字コードに対応した日本語エディタ
webalizer-2.01-10-win32-bin.zip
webalizer-2.01-10-win32-bin.zip を日本語化してビルドしたファイル

検証環境
Windows XP Professional ServicePack 2 and Windows XP Professional ServicePack 1
秀丸エディタ
webalizer-2.01-10-win32-bin.zip
Apache 1.3.33 のログファイル( combined )
Windows Server 2003 の Windows Media サービスの Windows Media サービス形式のログ ( かなり特殊ですが )

完成見本
このサイトの4月のログ解析結果です。
(意図的にホスト名の一部を消してあります。)

参考にしたサイト
http://moriya.xrea.jp/tools/webalizer.html

やったこと
グラフィックとHTMLで使用する語句を全部別にして、テキストで表示する部分を全て日本語化。

使用方法
webalizer のダウンロードページから、Windows版[ Win32 - Intel ] をダウンロードしてきて解凍します。
インストールディレクトリは、解りやすく C:\webalizer\bin とでもしておきましょう。
参考 : ftp://ftp.mrunix.net/pub/webalizer/webalizer-2.01-10-win32-bin.zip

ビルドしたファイルを、差し替え&追加します。
参考にさせて頂いたサイトにあったように、webalizer.exe だけを差し替えたかったんだけどグラフィックも日本語化対応させたくて色々弄くり回していたら、 余分なファイルがたくさん必要になってしまいった。。。
おまけに、なにも解決してないし。。。

webalizer.conf の編集 (基本編)
confファイルは、EUCで書かれているのでEUCの文字コードが使える日本語エディタで編集。
Windows 付属の Notepad は使えません。 秀丸エディタMKEditor 等を使ってください。
出来上がるログレポートのHTMLもEUCになります。

タイトルとサイト名を最初に指定しましょう。
サイト名はグラフィックでも使用されるので、半角英数字しか使えませんので、URLにしておきます。
URL表記で良いでしょう!ということで、あえて日本語にすることも無いと思ったので手を抜きました。
ReportTitle         月次集計レポート
HostName          www.url.co.jp


ついでに、リンク元から自サイトを除きます。
HideReferrer       www.url.co.jp

ついで表示させたい情報を適宜指定して、最後にログファイルと出力先を設定すればおしまい。
OutputDir          ..\Output
LogFile              ..\log\access_log.LOG

詳細は、sample-J.conf を参照。

ログファイルの処理
ログファイルは、毎回変更するのと、一度にたくさんのファイルを処理したい為にバッチファイルで指定することも可能。
まず、ディレクトリ構造を以下のように配置
 
C:
 |--- webalizer
        |--- bin (プログラム本体)
        |--- log (ログファイル)
        |--- output (出力先)

webalizer のフォルダに webalizer.bat ファイルを用意。
決して webalizer.bat を bin フォルダに入れてはいけません!
入れると、一部のタグが2重化してしまい、最悪読めないファイルが出来てしまいます。
どうしても入れたいときは、-c /PATH/webalizer.conf を指定しないか、webalizer.conf ファイル名を変更しましょう。
バッチファイルなんて面倒という方は、webalizer.exe と webalizer.conf のショートカットでも可。

webalizer.conf の編集 (詳細編)

・検索エンジン対応
GroupReferrer / SearchEngine で検索サイトのURLや検索語句切り出し位置の指定をします。
GroupReferre は見やすくする為、SearchEngine は指定しないと認識してくれないから必ず指定した方が良いでしょう。ただし、生ログをそのまま処理しても文字化けだらけで意味不明なので、適宜コード変換処理をしたログファイルを使用するのが前提です。ほんと日本語って面倒。
ちなみに、今回依頼を請けた内容では、検索語句の表示は不要でしたので、これ以上つっこんだ話は有りません。
後に文字化け対策を相談された顛末を追加しました
HideReferrer 等と併せて使うと効果的ですね。
SearchEngine    yahoo.com       p=
GroupReferrer   yahoo.co.jp/     Yahoo!
HideReferrer     yahoo.co.jp


・ページタイプの指定
PageType は、リクエストページの統計でカウントしたいファイルタイプの指定です。
画像ファイルや css 、js など、表示したくないもの全てを除き指定しましょう。
PageType      htm*
PageType      xls
PageType      doc
PageType      txt
PageType      pdf
などなど、設置しているファイルタイプに応じて指定。

・グループURLの指定
リクエストページの統計はこのままでは見にくいので、GroupURL でディレクトリ毎の統計も日本語で表示させましょう。
GroupURL     /products/*      製品情報
GroupURL     /corporation/*  会社案内
GroupURL     /webcatalog/*   Webカタログ

などなど、設置しているディレクトリに応じて指定。
HideURL と併せて使えば、ディレクトリだけのレポートも可能。
HideURL     *.html

・ユーザ情報の整理
ユーザ情報もグループURLと同様にユーザIDをユーザ名で表示させた方が見やすいですから、GroupUser と HideUser を使用してみましょう。
この機能を使用したときとしないときで、微妙にカウント数がずれるのはなぜ?
HideUser     0001
HideUser     0002
HideUser     0003
GroupUser     0001     会員1号
GroupUser     0002     会員2号
GroupUser     0003     会員3号

以上 (2004/10)

SEO
住宅用火災警報器
住宅用火災警報器設置期限
住宅用火災警報器販売

このページはリンク自由です。必ずしも TOP へのリンクでなくても結構です。連絡も不要です。
rifugio.net