Perl入門ゼミ

テキスト処理、Linuxサーバー管理、Web開発ならPerl
  1. Perl
  2. 文字コード

Unicodeで平方メートル(m2)を表現する

平方メートル(m2)を表示するときに、小さな2はどうやって表現したらよいのかなぁと悩んでいたら、解決方法を発見。Unicodeのコードポイントで、表現したらよいだけだった。

my $menseki = "100m\x{00B2}"; # 100平方メートル

小さな2にあたるコードポイントが00B2になります。

これは内部文字列なので、実際に出力するときは、UTF-8でエンコードする必要があります。またソースコード中で、全部の文字が内部文字列になるように「use utf8」しておきましょう。

print encode('UTF-8', $menseki);

やっぱりこういうときには、Unicodeに対応しているPerlは便利だなぁと思いました。

上付き文字と下付き文字の一覧

こういうのは上付き文字と呼ぶらしいですね。上付き文字と下付き文字の一覧をブックマークで紹介していただいたのでリンクしておきます。

  • Perlとはテキスト処理の記述性とパフォーマンスに優れ、正規表現が言語に組み込まれているプログラミング言語です。
  • Linuxサーバーでのフィルタリングプログラム、複数行の文字列を処理、ファイル内容の検索・置換などが得意
  • Perlはgitopensslなど広く普及したUnix/Linuxミドルウェアの補助ツールとして採用実績あり。後方互換性とポータビリティの高さがひとつの理由と推測。
  • 大量のテキストを扱うWeb開発も得意。ロングテールSEOを意識したWebサイト、アドテクやソーシャルゲームでの50ms以内のJSONの生成など。