2009/09/23(Wed)UTF-8な文字列をsubstrする

2009/09/23 5:10 Languages::Perl
ずいぶん以前からPerlで物を書くときには、文字コードをUTF-8にし、use utf8をしないで書いている。
で、その際、substrなどで文字列を切り出したいとすると、UTF-8は1文字あたりの長さが可変長であるため、入力文字列によっては変な文字が切り出されてしまうことになる。
これを正しく切り出すときに色々調べてみたメモ。

続きを読む