さとみかんでいつものように巡回しているとこんなものが。
q=%E3%83%8F%E3%83%BC%E3%83%9E%E3%82%A4%E3%82%AA%E3%83%8B%E3%83%BC
例えば、これで『ハーマイオニー』になるそうなんですが、…この漢字コードって…なに?
なんだか、漢字(というかカナ)1文字に対して3バイトも割り当てられてるんですが。
さくっと掲示板に「それはUTF8で、Jcode.pm使えばおうけいだと思います(意訳)。」と書いてしまったのですが、はて、実際のトコロはどうなんだろうと心配になったので日記ページアクセスリンクを改造してみることに。最近Googleから飛んでくる半分くらいは文字コードがUTF8で検索語句が化け化けだったので良い機会なり。
まず、big7にはJcode.pmって入ってるのかね?ということでCGIを書き換えただけで実行してみるとエラー。やっぱりJcode.pmは自分で入れないとダメなのねということでJcode - Japanese Charset Handler -からJcode 0.80をダウンロード。解凍してみるとJcode.pmというのがあったので、「こいつをjcode.plと置き換えればよいのかねー?」と考えてCGIと同じディレクトリにJcode.pmを転送。でもって再びCGIを実行してみるとまたしてもサーバエラーで動きやしねぇ。とりあえずtelnetで入ってコマンドラインからCGIを動かしてみると、「○○○がねぇぞ!」というお言葉を頂きました。どうも、Jcode.pmと一緒に入っていたJcodeフォルダも転送しないといかんようですな。Jcodeフォルダも送ってようやくCGIは動くようになったのだけど、どうもうまくSJISに変換できない。ああでもない、こうでもないと悩んで1時間以上かかってなんとか動くようになりました。うぬう、しばらくPerlいじってなかったからな。
そんなわけでUTF8対応日記ページアクセスリンクが稼働を開始いたしました。まあ、どんな検索語句で飛んできてるのか僕がチェックするくらいしか使い道ないですが。何かの参考にならんとも限らないのでへっぽこCGIソースも公開。……基本的に2年前に作ったそのまんまだからとんでもなく適当ですが気にしない、気にしない。