Perl入門ゼミ

テキスト処理、Linuxサーバー管理、Web開発ならPerl

文字列に日本語が含まれているかどうかを調べる

文字列に日本語が含まれているかどうかを調べるには、正規表現を利用することができます。次のメタ文字を使って、漢字かひらがなかカタカナが含まれていることをチェックします。文字列は、内部文字列になっている必要があります。

文字種 メタ文字
漢字 \p{Han}
ひらがな \p{Hiragana}
カナカナ \p{Katakana}
use strict;
use warnings;
use utf8;

my $str = 'あいウエ三';
if ($str =~ /[\p{Han}\p{Hiragana}\p{Katakana}]/) {
  # 日本語を含んでいる
}
  • Perlとはテキスト処理の記述性とパフォーマンスに優れ、正規表現が言語に組み込まれているプログラミング言語です。
  • Linuxサーバーでのフィルタリングプログラム、複数行の文字列を処理、ファイル内容の検索・置換などが得意
  • Perlはgitopensslなど広く普及したUnix/Linuxミドルウェアの補助ツールとして採用実績あり。後方互換性とポータビリティの高さがひとつの理由と推測。
  • 大量のテキストを扱うWeb開発も得意。ロングテールSEOを意識したWebサイト、アドテクやソーシャルゲームでの50ms以内のJSONの生成など。