Im Compilerbau ist ein LR-Parser ein Bottom-up-Parser für LR-Grammatiken. Bei diesen kontextfreien Grammatiken wird die Eingabe von links nach rechts abgearbeitet, um die Rechtsreduktion zum Startsymbol zu berechnen.
Ein LR-Parser heißt LR(k)-Parser, wenn er während des Parsens k Tokens für eine natürliche Zahl k vorausschauen kann. k wird dabei als Lookahead bezeichnet.
LR(k) ist eine Abkürzung für Parsen von links nach rechts mit Rechtsreduktionen, k Symbole Lookahead.
LR-Parser per Hand zu schreiben birgt ein großes Fehlerrisiko, weswegen hier meistens Parsergeneratoren verwendet werden.
Ein LR-Parser enthält einen Kellerspeicher (Stack), eine Aktionstabelle und eine Goto-Tabelle. Das oberste Element im Keller gibt immer den aktuellen Zustand des Parsers an. Bei Programmstart liegt nur der Startzustand im Keller. In der Aktionstabelle wird vermerkt, was bei jeder Kombination aus Zustand und Eingabezeichen zu tun ist. Mögliche Aktionen sind:
Wir betrachten folgende Grammatik in BNF mit Startsymbol E:
E ::= E "*" B | E "+" B | B . B ::= "0" | "1" .
Diese Grammatik lässt sich in folgende einzelne Reduktionsregeln umwandeln:
Markiert man das Ende der Eingabe mit einem $-Zeichen (Regel E $ ← S; S ist neues Startsymbol), so sehen die Aktions- und Goto-Tabelle für einen LR(0)-Parser dazu folgendermaßen aus:
Aktion | GoTo | ||||||
---|---|---|---|---|---|---|---|
Zustand | * | + | 0 | 1 | $ | E | B |
0 | s1 | s2 | 3 | 4 | |||
1 | r4 | r4 | r4 | r4 | r4 | ||
2 | r5 | r5 | r5 | r5 | r5 | ||
3 | s5 | s6 | acc | ||||
4 | r3 | r3 | r3 | r3 | r3 | ||
5 | s1 | s2 | 7 | ||||
6 | s1 | s2 | 8 | ||||
7 | r1 | r1 | r1 | r1 | r1 | ||
8 | r2 | r2 | r2 | r2 | r2 |
Wie man diese Tabellen aus der Grammatik erstellt, wird im Abschnitt Erstellen der Aktions- und Goto-Tabelle beschrieben.
Als Eingabe sei die Zeichenkette „1+1“ gegeben.
1. Der Startzustand ist hier 0, also startet der Parser nur mit einer 0 im Keller, und der Lesezeiger steht auf dem ersten Zeichen der Eingabe.
Keller: | 0 | ||||
Eingabe: | 1 | + | 1 | $ |
2. Wir schauen nun in der Aktionstabelle, was beim Zustand 0 und der Eingabe „1“ zu tun ist: s2, d. h., wir legen den Zustand 2 in den Keller und lesen das nächste Zeichen.
Keller: | 0 | 2 | |||
Eingabe: | 1 | + | 1 | $ |
3. Mit der Eingabe „+“ sollen wir im Zustand 2 Regel 5 anwenden. Die Regel 5 hat ein Element auf der rechten Seite. Daher nehmen wir ein Element aus dem Keller und sehen in der Goto-Tabelle den nächsten Zustand nach. Im Zustand 0 (die 2 haben wir ja gerade weggenommen) wird nach Anwendung einer Regel, auf deren linker Seite ein B steht, in den Zustand 4 gewechselt.
Keller: | 0 | 4 | |||
Eingabe: | B | + | 1 | $ |
4. Jetzt kommt erneut eine Reduktion. Diesmal mit Regel 3. Wir wechseln in den Zustand 3.
Keller: | 0 | 3 | |||
Eingabe: | E | + | 1 | $ |
5. Jetzt kommt ein Shift. Wir wechseln in den Zustand 6.
Keller: | 0 | 3 | 6 | ||
Eingabe: | E | + | 1 | $ |
6. Shift, neuer Zustand: 2
Keller: | 0 | 3 | 6 | 2 | |
Eingabe: | E | + | 1 | $ |
7. Reduktion mit Regel 5, neuer Zustand ist 8
Keller: | 0 | 3 | 6 | 8 | |
Eingabe: | E | + | B | $ |
8. Reduktion mit Regel 2. Wir nehmen daher drei Elemente aus dem Keller. Dann liegt die 0 ganz oben, und wir wechseln in den Zustand 3, da die Regel 2 ein E auf der linken Seite hat.
Keller: | 0 | 3 | |
Eingabe: | E | $ |
9. Accept. Die Eingabe gehört zur Grammatik und wir sind fertig.
Um die Tabelle zu erhalten, wird aus der Grammatik ein deterministischer endlicher Automat (DEA) erstellt und dessen Zustände und Übergänge werden in die Tabelle geschrieben. Je nachdem, welche Art von LR-Parser konstruiert wird, gibt es leichte Änderungen des Konstruktionsablaufs. Ein solcher Ablauf wird zum Beispiel für SLR-Parser beschrieben.