«前の日記(2002年06月16日) 最新 次の日記(2002年06月18日)» 編集

混沌の庭研究所

1998|06|07|08|09|10|11|12|
1999|03|04|05|06|07|08|09|10|11|12|
2000|01|02|03|04|05|06|07|08|09|10|11|12|
2001|01|02|03|04|05|06|07|08|09|10|11|12|
2002|01|02|03|04|05|06|07|08|09|10|11|12|
2003|01|02|03|04|05|06|07|08|09|10|11|12|
2004|01|02|03|04|05|06|07|08|09|10|11|12|
2005|01|02|03|04|06|07|08|09|10|12|
2006|01|02|03|04|05|06|07|08|09|10|11|12|
2007|01|02|03|04|05|06|07|08|09|10|11|12|
2008|01|02|03|04|05|06|07|08|09|10|11|12|
2009|01|02|03|04|05|06|07|08|09|10|11|12|
2010|01|02|03|05|06|07|08|10|11|12|
2011|01|03|09|
2012|02|03|
2013|05|12|
2019|10|

2002年06月17日 月曜日 [長年日記]

_ [つっこみ][Perl] Jcode.pmでUTF8->SJIS変換

さとみかんでいつものように巡回しているとこんなものが。

q=%E3%83%8F%E3%83%BC%E3%83%9E%E3%82%A4%E3%82%AA%E3%83%8B%E3%83%BC

 例えば、これで『ハーマイオニー』になるそうなんですが、…この漢字コードって…なに?
 なんだか、漢字(というかカナ)1文字に対して3バイトも割り当てられてるんですが。

鷹澤遊戯場(2002年6月17日(月):夜)より]

さくっと掲示板に「それはUTF8で、Jcode.pm使えばおうけいだと思います(意訳)。」と書いてしまったのですが、はて、実際のトコロはどうなんだろうと心配になったので日記ページアクセスリンクを改造してみることに。最近Googleから飛んでくる半分くらいは文字コードがUTF8で検索語句が化け化けだったので良い機会なり。

まず、big7にはJcode.pmって入ってるのかね?ということでCGIを書き換えただけで実行してみるとエラー。やっぱりJcode.pmは自分で入れないとダメなのねということでJcode - Japanese Charset Handler -からJcode 0.80をダウンロード。解凍してみるとJcode.pmというのがあったので、「こいつをjcode.plと置き換えればよいのかねー?」と考えてCGIと同じディレクトリにJcode.pmを転送。でもって再びCGIを実行してみるとまたしてもサーバエラーで動きやしねぇ。とりあえずtelnetで入ってコマンドラインからCGIを動かしてみると、「○○○がねぇぞ!」というお言葉を頂きました。どうも、Jcode.pmと一緒に入っていたJcodeフォルダも転送しないといかんようですな。Jcodeフォルダも送ってようやくCGIは動くようになったのだけど、どうもうまくSJISに変換できない。ああでもない、こうでもないと悩んで1時間以上かかってなんとか動くようになりました。うぬう、しばらくPerlいじってなかったからな。

そんなわけでUTF8対応日記ページアクセスリンクが稼働を開始いたしました。まあ、どんな検索語句で飛んできてるのか僕がチェックするくらいしか使い道ないですが。何かの参考にならんとも限らないのでへっぽこCGIソースも公開。……基本的に2年前に作ったそのまんまだからとんでもなく適当ですが気にしない、気にしない。

_ [購入] 今日の買い物

  • 【Comic】陸奥圓明流外伝 修羅の刻 13/川原正敏/講談社

大学の購買で購入〜。信長の話もこれにて終了〜。しかし、9割方内容が同じでエピローグだけ虎彦バージョンな13巻(裏)も出ているらしいのです。購買には売ってませんでしたが。……なぜ一冊にまとめないのか! でも、買っちゃうのだろうなぁ。