【C#】正規表現の使い方入門

C#

テキストデータの検索や置換を効率的に行うためには、正規表現(Regular Expression)を理解することが重要です。

正規表現とは?

正規表現は「文字列のパターン」を表現するための方法です。特定のルールに基づいて構築され、文字列の検索、置換、分割など多様な操作を可能にします。

C#における正規表現の基本

C#では、System.Text.RegularExpressions 名前空間内にある Regex クラスを利用して正規表現を扱います。基本的な使い方は以下の通りです。

using System;
using System.Text.RegularExpressions;

class Program
{
    static void Main()
    {
        string pattern = @"正規表現パターン";
        string input = @"検索する文字列";

        Regex regex = new Regex(pattern);
        Match match = regex.Match(input);

        if (match.Success)
        {
            Console.WriteLine("一致した文字列: " + match.Value);
        }
    }
}

代表的な正規表現パターン

  1. アルファベット
    • 大文字のみ: [A-Z]
    • 小文字のみ: [a-z]
    • 大文字と小文字: [A-Za-z]
  2. 数字
    • [0-9] または \d
  3. 単語
    • \w (アルファベット、数字、アンダースコア_にマッチ)
  4. スペース
    • \s (スペース、タブ、改行などの空白文字にマッチ)
  5. タブ
    • \t
  6. []で指定した文字にマッチ
    • [abc]abc のいずれかにマッチ)
    • [^abc]abc 以外の文字にマッチ)

サンプルコード

using System;
using System.IO;
using System.Text.RegularExpressions;

class Program
{
    static void Main()
    {
        string pattern = @"\d\d\d\d"; // 4桁の数字にマッチするパターン。\d{4}と書いても良い
        string input = @"Today is January 24, 2024.";

        Match match = Regex.Match(input, pattern);
        if (match.Success)
        {
            Console.WriteLine("見つかった数字: " + match.Value); // "2024" が出力される
        }
    }
}

タイトルとURLをコピーしました