研究室で、「TakuyaさんもMac買ったんですねー、どうですー?SSH経由で文字化け苦しんでますか?」と言われたので、問い詰めた
Macの文字コードはUTF-8なんですが。UTF-8はUTF8でもMacは一般的なUTF8とは違うんです。濁点は一文字なんです。
と言われた。ふたりともよくわからなかった。二人でどういうことか調べた。
UTF-8-MACといわれる文字コード
Unicode 標準では、NFC は正規結合(Canonical Composition)、 NFD は正規分解(Canonical Decomposition)として規定されています。 たとえば、「が」の字を NFC で表現すると U+304C (HIRAGANA LETTER GA) ですが、 NFD では U+304B U+3099 (HIRAGANA LETTER KA + COMBINING KATAKANA-HIRAGANA VOICED SOUND) という シークエンスになります。
MacWiki - UTF-8-MAC
そんなもの一般のブログ(Macにするべき10の理由てきなやつ)には書かれてなかったぞ。Mac信者に騙されたー。Mac/Macいうエントリはやっぱりおれつえぇぇ系の人たちなのですね。困ったもんだ。
調べてみた。
- ターミナル:化けない
- bash:化けない
- screen :化けた←こいつ犯人
screenコマンドは文字化けするものだと、念頭に置くのがいいみたい。
将来のアプデトで対応されるかと期待したけど、Screen側の問題だから対応されないみたい。
今のところどうしようもない
あとLinux側にrsyncでファイルを送るときも注意が必要らしい。これは致命的だよ。Sambaだと必ずwindowsの文字コードに合わせるので化けないそうです。
濁点のある文字を使わないこと。日本語の濁点がファイル名に含まれないようになるべく漢字と名詞を使うファイル名にするわ。
Mac信者にとってはこれくらい当たり前な事なの?
僕には耐えられません。。。