正規表現は、Pythonのテキスト処理において非常に強力なツールの1つです。正規表現を使用することで、特定のパターンに一致する文字列を検索したり、置換したりすることができます。

正規表現の基本

正規表現には、以下のような特殊文字があります。

  • . : 任意の1文字に一致
  • ^ : 行の先頭に一致
  • $ : 行の末尾に一致
  • * : 直前の文字が0回以上繰り返しになる
  • + : 直前の文字が1回以上繰り返しになる
  • ? : 直前の文字が0回または1回現れる
  • {n} : 直前の文字がn回現れる
  • {m,n} : 直前の文字がm回以上、n回以下現れる
  • [] : 指定された文字セットに一致
  • | : or条件に一致
  • \ : 特殊文字をエスケープするために使用

正規表現の使用例

パターンマッチング

以下の例では、正規表現を使用して、文字列の中から電話番号を検索します。

import re

text = "私の電話番号は012-345-6789です。"
pattern = r"\d{3}-\d{3}-\d{4}"
match = re.search(pattern, text)

if match:
    print("電話番号が見つかりました:", match.group())
else:
    print("電話番号が見つかりませんでした。")

文字列の置換

以下の例では、正規表現を使用して、文字列の中の単語を置換します。

import re

text = "私はりんごが好きです。"
pattern = r"りんご"
replace = "バナナ"
new_text = re.sub(pattern, replace, text)

print(new_text)

まとめ

正規表現は、Pythonのテキスト処理において非常に強力なツールです。正規表現を使用することで、特定のパターンに一致する文字列を検索したり、置換したりすることができます。正規表現を使用する際には、Pythonのreモジュールを使用することができます。