Syntax-Referenz
Zeichenkürzel
.
\d
äquivalent zu [0-9]
, außer Brüche
\D
Invertierung von \d
\l
\n
auch New line oder Line feed genannt
\r
auch Return oder Absatzende genannt
\s
\S
Invertierung von \s
\t
\u
\w
äquivalent zu [A-Za-z0-9_]
\W
Invertierung von \w
Zeichenklassen
[0-9]
äquivalent zu \d
[^0-9]
[adg]
[^adg]
[a-g]
[A-G]
Alternation
a|b
Gruppen und Rückwärtsreferenzen
( )
\1
Nicht zu verwechseln mit $1
im Ersetzen-Vorgang
(?:)
Beim Ersetzen-Vorgang wird diese Gruppe nicht berücksichtigt
Wiederholungen und Quantoren
?
In anderen Worten: es macht den davorstehenden Ausdruck optional
*
+
??
*?
+?
{2}
{2,}
{2,5}
Positionen
^
$
\b
Look-Arounds
(?<=regex)
Nicht-einfangende Gruppe, die prüft, ob sich das Muster regex vor dem eigentlichen Suchmuster befindet. Beispiel: (?<=Typo)grep
findet grep nur, wenn sich das Muster Typo direkt davor befindet.
(?<!regex)
Nicht-einfangende Gruppe, die prüft, ob sich das Muster regex nicht vor dem eigentlichen Suchmuster befindet.
(?=regex)
Nicht-einfangende Gruppe, die prüft, ob sich das Muster regex nach dem eigentlichen Suchmuster befindet.
Beispiel: Typo(?=grep)
findet Typo nur, wenn sich das Muster grep direkt dahinter befindet.
(?!regex)
Nicht-einfangende Gruppe, die prüft, ob sich das Muster regex nicht nach dem eigentlichen Muster befindet.
Zeichen für die Ersetzung
$0
$1
Gruppen reichen von $1
bis $9
Suchparameter
Suchparameter verändern die Standard-Funktionsweise von GREP. Die sogenannten Modifier oder Flags stehen immer zu Beginn des Ausdrucks.
(?i)
(?s)
Durchsucht den gesamten Text und stoppt nicht wie normalerweise bei einem Absatz
(?x)
Kann verwendet werden, um den Ausdruck übersichtlicher zu gliedern
Unicode Zeichenklassen
Diese Zeichenklassen enstprechen den Zeichen innerhalb der Unicode-Ranges
\p{L*}
Letter
\p{Ll}
Letter lowercase
\p{Lu}
Letter uppercase
\p{S*}
Symbol
\p{Sm}
Symbol math
\p{Sc}
Symbol currency
\p{So}
Symbol other
\p{N*}
Number
\p{Nd}
Number digits
\p{Nl}
Für Römische Zahlen gibt es eigene Unicodes. Die regulären Buchstaben IVXLCDM werden nicht gefunden.
Number Letter
\p{No}
Number other
\p{P*}
Punctuation
\p{Pd}
Divis, Gedankenstrich, Streckenstrich und weitere.
Punctuation dashes
\p{Ps}
Runde, geschweifte und eckige Klammern.
Punctuation starting parenthesis
\p{Pe}
Punctuation ending parenthesis
\p{Pi}
« ‹ ‘ ‛ “ ‟
Punctuation initial quote
\p{Pf}
» › ’ ”
Punctuation final quote
InDesign-Weißräume
~m
~>
~3
~4
~%
~<
Kein Unicode, kann daher im Web nicht dargestellt werden
~|
~/
So breit wie eine Tabellen-Ziffer
~.
So breit wie ein Punkt
~s
Behält im Blocksatz eine feste Breite (narrow non-breaking space)
~S
Variiert im Blocksatz in der Breite (non-breaking space)
~f
Nimmt im Blocksatz den übrigen Raum einer Zeile ein
Kein Unicode, kann daher im Web nicht dargestellt werden