utf8

Perl の内部表現の一つはたまたま UTF-8 です。内部表現は何か分からないエンコーディングで、常に明示的にエンコードと デコードが必要ということにしておいた方がよいです。

追記 ajiyoshiさんの昔の記事がとてもわかりやすかったので参考に。 VOYAGE GROUP エンジニアブログ : あなたにも今日こそPerlの文字化けが理解できるたった一つの原則 元記事 記事タイトルはperlunifaqの「UTF8 フラグ」って何?からそのまま引用したもの。 …

Unicode文字列は「flagged utf8」UTF-8バイト列は「flaggedじゃないutf8?」

perlでutf8にひっかかっては、ブックマークした記事を読見なおしたり、昔買った「まるごとPerl」を読み直したり、改めて検索したりして、何かいつもわかったようなわからないような感じになってるので、今後また見るようにメモ書きを残すことにした。 知って…

jvimはUTF-8対応してないらしいのでvim入れた

- Recent Discussion OSDir.com jvimはUTF8には対応していないと思います(たぶん)。 調べてたらそんな話がいくつか書いてあった。 ってことで、さくらインターネットの共用サーバに vim をインストールする - talk to oneself 2を見ながらvimをインストール…

スクリプトをutf-8で書く場合はuse strictの下

404 Blog Not Found:perl - use utf8; スクリプトがUTF-8で書かれている場合は、わざわざdecode_utf8('リテラル');とするより、最初にuse utf8;としておくのが吉。 わざわざdecode_utf8をしなくて良いと。euc-jpとかの場合なら # subject を MIME エンコード…