まとめ
さて、適当に書き散らしてきたこの講座ですが、今回で10回目です。
キリが良いので、一旦これで終りにしましょう。
今回は、今まで出てきた正規表現をまとめておくのと、
自分でマニュアル等を読めるように、用語をすこし整理しておきます。
今まで出てきた正規表現
今まで出てきた正規表現をまとめます。
1文字の表現
メタ文字 | 意味 | 出てきた回 |
\t | タブ記号 | 第5回 |
\r | 改行記号 0D | 第5回 |
\n | 改行記号 0A | 第5回 |
\ | 直後の記号をエスケープする | 第5回 |
文字クラス
メタ文字 | 意味 | 出てきた回 |
. | 任意の1文字にマッチ | 第1回 |
[abc] | []内のどれか1文字にマッチ | 第1回 |
[a-z] | []内のa~zにマッチ | 第2回 |
[^abc] | []内以外の任意の1文字にマッチ | 第2回 |
\d | 数字1文字、[0-9]と同じ意味 | 第9回 |
\s | 空白文字 | 第9回 |
\S | 非空白文字 | 第9回 |
\w | 単語を構成する文字 | 第9回 |
\W | 単語を構成しない文字 | 第9回 |
量指定子
メタ文字 | 意味 | 出てきた回 |
* | 0回以上の繰り返し(最長一致) | 第3回 |
+ | 1回以上の繰り返し(最長一致) | 第3回 |
? | 0回もしくは1回の繰り返し(最長一致) | 第3回 |
{n} | ちょうどn回の繰り返し | 第9回 |
{n,} | 少なくともn回の繰り返し | 第9回 |
{n,m} | n回以上、m回以下の繰り返し | 第9回 |
量指定子? | 量指定子を最短一致にする | 第7回 |
グループ化
メタ文字 | 意味 | 出てきた回 |
() | グループ化、キャプチャ | 第4回、第8回 |
(?:) | キャプチャしないグループ化 | 第9回 |
ゼロ幅(位置にマッチ)
メタ文字 | 意味 | 出てきた回 |
^ | 先頭にマッチ | 第6回 |
$ | 末尾にマッチ | 第6回 |
置換で使えるメタ文字
メタ文字 | 意味 | 出てきた回 |
$1~$9 | キャプチャ1番目~9番目 | 第8回 |
用語集
いままで出てきた用語をまとめます。
正規表現のマニュアル等を見る場合に役立ててください。
なるべく平易な言葉で解説するため、厳密でないのを承知で書いているところがあります。
用語 | 意味 |
エスケープ | メタ文字を普通の文字として扱うために、メタ文字の前に「\」をつけること。 |
キャプチャ | グループ化した正規表現を、後で使えるように保存しておくこと |
グループ化 | 何文字かの正規表現をまとめて1つの正規表現として扱うこと |
シングルラインモード | 単一行モードとも言う。ONなら、「.」が改行にもマッチする。 |
ゼロ幅 | ゼロ幅アサーション、ゼロ幅の言明、などとも言う。位置にマッチする「^」や「$」のこと。 |
マッチ | 正規表現が特定の文字列にあてはまること。 |
マルチラインモード | 複数行モードとも言う。ONなら、「^」「$」が行頭・行末にマッチする。 |
メタ文字 | 正規表現の中で、特別な意味を持つ文字。メタシーケンスとも言う*1。 |
最短一致 | 量指定子が可能な限り短い文字列にマッチすること。非欲張りな量指定子とも言う。 |
最長一致 | 量指定子が可能な限り長い文字列にマッチすること。欲張りな量指定子とも言う。 |
文字クラス | ある文字のひとまとまりの中の1文字を表すメタ文字。 |
量指定子 | 直前の正規表現の~回の繰り返し、を表すメタ文字。 |
ご指摘などはこちらへ