バグ?
現実逃避に文字コード関連のドキュメントやコードを見ていたら,バグっぽいところを見つけた.
- Supported Encodingsだけど,"windows-31j"はIANAの"CHARACTER SETS"によると,正しくは"Windows-31J".まあ大文字・小文字を区別しないから実際には支障はあまりないんだけど,一応APIドキュメントで"its canonical name must be the MIME-preferred name"と定義している.これはドキュメントだけでなく実装も間違っている.
- JISAutoDetectのcontains()では,SJIS,EUC_JP,ISO2022_JPだけをチェックしているけど,"PCK","Windows-31J","x-euc-jp-linux","x-eucJP-Open"もチェックしなくてよいのかしらん?まあ,contains()そのものの存在意義を言ってしまったら,身も蓋もないのかもしれないが(苦笑)