正規表現の - 虚飾の王

　カテゴリー強化月間、ということで。
　HTMLやらXMLやらのファイルからタグ情報とリテラルを取り出そうとすると、次のようなプログラムになると思います。

while ($HTML=~/<(.+?)>([^<]*)/g) {
    my ($tag,$literal) = ($1,$2);
    #ここで何やら処理
}

　それの正規表現の部分である“<(.+?)>([^<]*)”がなにやら楽しげな顔文字に見えた、というお話。