正規表現の

 カテゴリー強化月間、ということで。
 HTMLやらXMLやらのファイルからタグ情報とリテラルを取り出そうとすると、次のようなプログラムになると思います。

while ($HTML=~/<(.+?)>([^<]*)/g) {
    my ($tag,$literal) = ($1,$2);
    #ここで何やら処理
}

 それの正規表現の部分である“<(.+?)>([^<]*)”がなにやら楽しげな顔文字に見えた、というお話。