Reguläre Ausdrücke
Zur Navigation springen
Zur Suche springen
Einfache Suchmuster
- direkt eingegebene Zeichenketten werden als solche gesucht. "er" sucht nach den aufeinander folgenden Buchstaben e und r . Groß- und Kleinschreibung wird unterschieden
- Regexe verwenden Metazeichen, nach denen man nur dann literal suchen kann, wenn man ein Backslash voranstellt:
* + ? . ( ) [ ] { } \ / | ^ $
- der Punkt "." dient dazu, nach einem beliebigen unbekannten Zeichen zu suchen. Sucht man nach dem Punkt als Zeichen, so stellt man ein Backslash voran "\."
- Regexe verwenden Zeichenklassen wie
\d
für Ziffern und \D für nicht-Ziffern - alternativ:[0-9]
bzw.[^0-9]
\w
für alphanumerische Zeichen - alternativ:[a-zA-Z0-9_]
\W
für nicht-alphanumerische Zeichen - alternativ:[^a-zA-Z0-9_]
- Zeilengrenzen haben eigene Suchkriterien: ^ für den Zeilenanfang und $ für das Zeilenende.
- Für Wortgrenzen gibt es "\b" mit dem nach Zeichenketten gesucht werden kann, die den Abschluss eines Wortes bilden. "\B" steht für Zeichenketten, die nicht Wortgrenzen darstellen.
- Man kann Zeichenketten als Alternativen definieren. Dazu trennt man jede Alternative mit dem Strich "|" ab. Gleiche Zeichen an gleichen Stellen innerhalb der Alternativen, lassen sich wie in der Mathematik vor oder hinter eine Klammer ziehen:
^(Re|Aw|Fwd)
Für alle drei Alternativen gilt, dass sie am Anfang einer Zeile stehen müssen. - Leerzeichen oder Tabulatoren werden als so genannte Whitespace-Character bezeichnet, für die ein spezielles Suchmuster existiert: \s : \S findet alle Zeichen, die keine Whitespaces sind.
- Auch Anfang und Ende einer Zeichenkette sind suchbar: \A und \Z
- Wiederholungen von Zeichen suchen
\d*
findet beliebig viele Ziffern hintereinander oder keine Ziffera+
findet 1 oder mehrere Wiederholungen des Zeichens a hintereinanderx{5}
findet 5 Wiederholungen des Zeichens x hintereinander
INFO
- Interaktives Tutorial: http://regexone.com
- Workshop: http://www.regenechsen.de