|
▼のぶさん:
>むじんさん、ありがとうございます。当面外字を使うようなCGIは使いそうにないので大丈夫です。ネット上での外字表示の統一規格みたいのができるといいんですがね。
ほんとはHTMLがそれなんですけど、webブラウザ側の実装が遅れているようです。たとえば日本語のページに「李傕」と書いた場合、jisコードを基本とするMSゴシックなどに含まれない文字なので、ブラウザはMSsongやMingLiUなどから字体を借りてきて表示すべきです。ところがIEやOperaなどの手抜き実装では、むりやりMSゴシックなどで表示しようとするらしく必ずつぶれます。日文・中文混合のページを作る場合、かなり厄介な問題になります。正しい処理をしてくれるのは、今のところNetscapeくらいのようです。
cgi(以下Perlのこととして…)でテキストを扱う場合、テキストデータも、スクリプトも、吐き出すHTML文書も、すべてUTF-8に統一しておくとコード変換をしないですむので楽です。テキストデータに「鍾繇」と書いておくと、スクリプト内のパターンマッチで「鍾繇」に直接ヒットします。しかもUTF-8は最上位ビットが常に立っているので、エスケープする手間も不要です。ただ唯一の欠点はテキストサイズが大きくなること。だいたい60%くらい増量になり、そのぶん処理にかかる時間も長くなります。
|
|