<< 2006/10/ 1 1. Yahoo! Widgets が面白いかも
2 3 1. fc2 が画像の直リンを弾いてるっぽい
4 1. Sunbird 0.3RC1
5 1. 最近リファラがまったく残らなくなった
6 1. Thunderbird のメッセージフィルタにコメントが書けたら便利じゃないかな。
7 8 1. Y! Widget Engine + UnixUtils で日本語を扱うには
9 10 11 1. Sunbird 0.3 リリース
12 13 1. yaml-mode.el ができてるじゃない
14 15 16 17 1. JavaScript 周りをもう一回確認しなきゃな
18 19 20 1. アドレス入力のダイアログは消さないでほしい
21 1. 特定のフォントだけ適用除外ってできないかな
22 1. Camino にした
23 1. ブックマーク難民
24 1. emacs-w3m で referer は吐けないのか?
25 1. 最近 Scheme にハマっている
26 1. なんちゃってスモールスクリーンレンダリング.user.js
27 1. GeekMonkey で利用する user js はどこにどう置いておくのがよいか?
28 29 1. 今さら PHP の気に入らないところ
30 1. 大学受験を前提に必修科目の未履修問題をとらえる必要ないような?
31 1. 旧Mac → Windows 逆Switchで気をつけるべきポイント
>>
トップ «前の日記(2006-10-06) 最新 次の日記(2006-10-11)» 編集

2006-10-08 [長年日記]

_ Y! Widget Engine + UnixUtils で日本語を扱うには

※ UnixUtils というのは Windows 版でバンドルされている Unix コマンドのバイナリが入っているディレクトリ名のことです。今後、YWE*1 で利用できる Unix コマンドのことを UnixUtils と書くこととします。

調べたら日本語周りがやはり悩ましげ。JavaScript の部分は UTF-8 か UTF-16 でいいとして、UnixUtils の部分をどうするか。例えば Windows にバンドルされている gawk であれば locale に応じてそれなりによしなに日本語を扱ってくれるが、考えたら OSX 標準の awk は gawk じゃない。nawk かなんかだっけ。まぁどっちにしろ locale と一致しないエンコーディングはそのままじゃ扱えないわけで。何かしらエンコーディングを変換するツールが要るなぁというのが実際のところ。

Panther 以降は iconv が標準バンドルなので、Windows 用に gnuwin32 の iconv を Widget に含めてしまうことでなんとか対応できるかなって感じ。ただし iconv には自動判別の機能はないので、OOo みたいにファイルを開いて一部を目視で確認してもらって、このエンコーディングで OK なら次へ進む、という形にしないとダメっぽい。(Web から取得するんであればヘッダなり meta なりのエンコーディングを読み取ればいいんだけど。)

ところで iconv って半角カナの扱いはどうなってんだろ。

Tags: Ecmascript

*1 Yahoo! Widget Engine