Reguläre Ausdrücke

Aus Mediawiki Ferdinand Gruber
Zur Navigation springen Zur Suche springen

Einfache Suchmuster

  • direkt eingegebene Zeichenketten werden als solche gesucht. "er" sucht nach den aufeinander folgenden Buchstaben e und r . Groß- und Kleinschreibung wird unterschieden
  • Regexe verwenden Metazeichen, nach denen man nur dann literal suchen kann, wenn man ein Backslash voranstellt: * + ? . ( ) [ ] { } \ / | ^ $
  • der Punkt "." dient dazu, nach einem beliebigen unbekannten Zeichen zu suchen. Sucht man nach dem Punkt als Zeichen, so stellt man ein Backslash voran "\."
  • Regexe verwenden Zeichenklassen wie
\d für Ziffern und \D für nicht-Ziffern - alternativ: [0-9] bzw. [^0-9]
\w für alphanumerische Zeichen - alternativ: [a-zA-Z0-9_]
\W für nicht-alphanumerische Zeichen - alternativ: [^a-zA-Z0-9_]
  • Zeilengrenzen haben eigene Suchkriterien: ^ für den Zeilenanfang und $ für das Zeilenende.
  • Für Wortgrenzen gibt es "\b" mit dem nach Zeichenketten gesucht werden kann, die den Abschluss eines Wortes bilden. "\B" steht für Zeichenketten, die nicht Wortgrenzen darstellen.
  • Man kann Zeichenketten als Alternativen definieren. Dazu trennt man jede Alternative mit dem Strich "|" ab. Gleiche Zeichen an gleichen Stellen innerhalb der Alternativen, lassen sich wie in der Mathematik vor oder hinter eine Klammer ziehen: ^(Re|Aw|Fwd) Für alle drei Alternativen gilt, dass sie am Anfang einer Zeile stehen müssen.
  • Leerzeichen oder Tabulatoren werden als so genannte Whitespace-Character bezeichnet, für die ein spezielles Suchmuster existiert: \s : \S findet alle Zeichen, die keine Whitespaces sind.
  • Auch Anfang und Ende einer Zeichenkette sind suchbar: \A und \Z
  • Wiederholungen von Zeichen suchen
\d* findet beliebig viele Ziffern hintereinander oder keine Ziffer
a+ findet 1 oder mehrere Wiederholungen des Zeichens a hintereinander
x{5} findet 5 Wiederholungen des Zeichens x hintereinander

INFO