GNU Assembler

GNU Assembler

Basisdaten

Entwickler GNU-Projekt
Erscheinungsjahr 1986
Aktuelle Version toolset version of binutils[1]
Betriebssystem Cross-platform
Programmier­sprache C
Kategorie Assembler
Lizenz GNU General Public License v3
www.gnu.org/software/binutils

Der GNU Assembler, auch bekannt als GAS, ist der Assembler des GNU-Projekts. Er ist das Standard-Backend der GNU Compiler Collection und wird folglich zum Assemblieren des Betriebssystems GNU, des Linux-Kernels und vieler anderer insbesondere als Quelltextpakete verfügbarer Applikationen verwendet. Er gehört zu den GNU Binary Utilities (binutils).

Die ausführbare Datei des GNU Assemblers wird wie der Assembler des ursprünglichen Unix von AT&T und Assembler späterer Unix-artiger Betriebssysteme mit as aufgerufen. GAS ist plattformübergreifend, und damit für eine große Anzahl von verschiedenen Rechnerarchitekturen sowohl lauf- als auch assemblierfähig. Als üblicher Assembler für die GCC ist er in u. a. vielen Linux-Distributionen und BSD-Abkömmlingen enthalten.

GAS wird unter der GNU General Public License v3 veröffentlicht und ist freie Software.

Kompatibilität

[Bearbeiten | Quelltext bearbeiten]

Für gängige Mikroprozessorarchitekturen wie AArch64[2], IBMs (bzw. AIMs) Enhanced RISC (IBM POWER und PowerPC) und x86 ab dem 80386 (dazu s. Abschnitt) ist der GNU Assembler nativ vorkompiliert erhältlich. Als Cross-Assembler etwa für vergleichsweise leistungsschwache oder veraltete Prozessoren wie die M68000er Familie oder den Z80 muss er in vielen Fällen mit den geeigneten Werkzeugen aus Quellen in der Archivdatei, mit der die binutils veröffentlicht werden, erstellt werden; wobei abhängig von Betriebssystem, CPU und Assemblierungsziel (namentlich dem sehr bekannten Z80)[3] auch (ältere) binutils-Pakete fertig angeboten werden.

Der dem Betriebssystem eigene Assembler ist in der Shell gewöhnlich als /usr/bin/as über den voreingestellten Suchpfad aufrufbar (s. auch Filesystem Hierarchy Standard). Zusätzliche binutils werden gewöhnlich als /usr/binutils-<Zielrechner> angelegt worin die ausführbaren Datein sind. gas hat keine Schalter wie gcc, die ausführbare Datei des GNU C Compilers, für einen eigenen Suchpfad und den Aufruf anderer Ausgaben. Um einen Cross-Assembler in einer Shell bequem aufzurufen, kann z. B. in deren Konfigurationsdatei ein alias[4][5] für /usr/binutils-<soundso>/as eingetragen werden.

GNU Assembler und Microsoft Windows

[Bearbeiten | Quelltext bearbeiten]

In Cygwin läuft gas ab Windows 7, binutils in neuester Fassung kann kompiliert für x86-64[6] und als Quellenpaket[7] vom Entwickler heruntergeladen werden.

Für MinGW gibt es eine eigene Ausgabe der binutils.

Der GNU Assembler ist vorrangig dazu vorgesehen von den Compilern der GCC in Assemblersprache verfasste Quellen in Objektdateien zu übersetzen. Je nach Zielsystem haben diese voreingestellt einen bestimmten Namen – für Linux auf x86 ist das a.out, gemäß Übereinkunft erhalten sie allgemein die Endung .o – und sind entweder im, wie in Unix-artigen Betriebssystemen üblich, Executable and Linkable (ELF) oder, wie für Windows, Common Object File Format (COFF) einschl. X- und ECOFF; und werden ggf. mit dem GNU Linker (ld) aus dem binutils-Paket zu fertigen ausführbaren Binärdateien bearbeitet.

a.out ist gemäß Voreinstellung von gas ausführbar gemacht.

Der GNU Assembler hat allgemeine und tws. viele für das System, für das assembliert werden kann, verfügbare Aufrufparameter, von denen einige folgend aufgeführt sind. Dabei ist zu beachten, dass in der Unixwelt case sensitivity vorherrscht.

--help zeigt eine Zusammenfassung über die Optionsschalter, --target-help eine über die zielbezogenen.
--dump-config zeigt wie der Assembler eingestellt ist.
Mit -a, einer angehängten Folge bestimmter Kleinbuchstaben, einem abschließenden = und einem folgenden Dateinamen wird in der Datei ein Protokoll über bestimmte Eigenschaften der zu erfolgenden Assemblierung verfasst.
-v (-version) zeigt die Version von as an, --version beendet zudem die Ausführung.

Verschiedene Schalter dienen der Behebung von oder dem Umgang mit Fehlern oder bestimmen die Darstellung in der Protokolldatei.

-- weist formal darauf hin, dass as die Standardeingabe lesen soll und kann auch weggelassen werden. Ist diese das Terminal können Zeilen von Code eingegeben und die Eingabe mit <Strg>+<D> beendet werden.

Jedes Befehlszeilenargument ohne festgelegte Bedeutung wird von as als zu assemblierende Datei aufgefasst. Die übergebene Folge von Dateien wird von links gelesen und in eine Objektdatei, bestehend aus ausführbarem Maschinencode und zusätzlichen Daten, übersetzt.

Wird gas vom gcc aufgerufen kann dieser mit dem Schalter -Wa jenes Parameter zu ihm durchreichen, indem sie nach einem Komma von Kommata getrennt eingetragen werden, also gemäß

<Eingabeaufforderung> gcc <cparam1 cparam2 …> -Wa,<aparam1,aparam2,…> <cparamN …> <ctext1.c ctext2.c …>

in einer Befehlszeile.

Es gibt Schalter für u. a. Übersetzung von Vektorbefehlen und Speicherausrichtung von Programmverzweigungen.

Die -march= zu übergebenden und mit einem Pluszeichen voneinander zu trennenden Werte stehen für einen Befehlssatz, darunter z. B. i8086, k8, core2, generic32 und generic64; und wahlweise Erweiterungen oder bestimmte Befehle wie z. B. die Numeric Processor, Streaming SIMD und Advanced Vector Extensions, die mit vorgesetztem no ausgeschlossen werden können. Die angewiesene Assemblierung darin nicht enthaltener Befehle verursacht eine Fehlermeldung. Der Schalter kann mit der Direktive (s. u.) .arch übersteuert werden.
-mtune= nimmt dieselben Werte für den Befehlssatz an und veranlasst gas, für den entsprechenden Prozessor optimierten Maschinencode zu erzeugen.

Beispiel:

erfahrener_Programmierer@Tischrechner: ~$ as -march=athlon+mmx+no3dnow+sse -mtune=generic64 assembly-Programm.S -o Maschinenprogramm.elf

Der Benutzer lässt in der Unix-Shell eine Quelltextdatei so assemblieren, dass das zu erzeugende Programm auf Lauffähigkeit auf dem AMD Athlon XP hin geprüft, Optimierung für Prozessoren seit amd64 wenn möglich vorgenommen und die Verwendung von 3DNow! ausgeschlossen wird, zudem erhält die Ausgabedatei einen anderen als den voreingestellten Namen.

Es gibt fünf Schalter für die Assemblierungseinstellung. Es kann bestimmt werden ob die Ausgabedatei entweder für einen rangaufsteigend oder rangabsteigend speichernden (s. endianness) Prozessor geeignet; und ob sie im ELF64 oder -32 ist.

Wie bei den Befehlssätzen von x86 kann mit -mcpu= eine Art Rechenkern wie als cortex-a55 oder exynos-m1 angegeben werden; mit dem Unterschied, dass etwaige Befehlssatzerweiterungen voreingestellt inbegriffen sind.
Entsprechend kann mit -march= eine Mikroarchitektur ab armv8-a bis armv9.4-a (Stand Juni 2024) gewählt werden, wobei Erweiterungen nicht immer voreingestellt dabei sind.

Werden weder Prozessor noch -generation bestimmt, gilt -mcpu=all, was bedeutet dass alle Befehle assembliert werden.

Die Syntax des GNU Assemblers hat einen allgemeingültigen Teil für alle unterstützten Architekturen. Er ist ähnlich vielen anderen Assemblern und von früheren Unix-Assemblern beeinflusst. Er beinhaltet u. a. Anweisungen für den Assembler, sog. Direktiven, Methoden zum Kommentieren und Darstellung von Zahlenwerten („Konstanten“).

Maschinenabhängige Ausdrücke wie insbesondere Befehle und Register sind der Herstellerbeschreibung zu entnehmen.

Assembler-Direktiven (auch pseudo-ops genannt) werden aus einem Schlüsselwort mit einem Punkt beginnend gebildet. Die meisten verfügbaren Direktiven sind architekturunabhängig, einige wenige hardwarespezifisch.[8]

Kommentare können allgemein zwischen /* und */ geschrieben werden. Zeilenkommentare einleitende Zeichenfolgen wie /, //, ; usw. sind zielabhängig.

Für die x86-Mikroarchitektur nutzt GAS standardmäßig eine Raute für Einzelzeilenkommentare. Beispiel:

pop %edx # alles hinter der Raute ist Kommentar
#AX und DX sind 86er Register
movl %edx,%eax

Werte können auf verschiedene Weisen geschrieben werden, die außer für dezimale Ganzzahlen von Vorsätzen bestimmt werden: 0b für Binär-, 0 für Oktal-, 0x für hexadekadische Zahlen; Fließkommazahlen kann zielabhängig z. B. 0f vorgesetzt werden.

Wird einem Wert der Operator - vorangestellt ist das Ergebnis sein Zweierkomplement; entsprechend erzeugt ~ sein bitweises Komplement.

Eine Quelle negativer Kritik an GAS ist, dass für die Zielsysteme x86-32 und x86-64 (als „80386“ zusammengefasst) anstelle der meistens verwendeten Syntax nach Art des eingestellten ASM86 von Intel die im Umfeld Unix-artiger Betriebssysteme bevorzugte AT&T-Assembler-Syntax voreingestellt ist.[9] Das ist allerdings in der Kompatibilität zur GCC begründet[10] denn so können beispielsweise Ausdrücke in C übersichtlicher eingefügt werden. Seit binutils 2.10 von Juni 2000[11][12] kann die vorgegebene Syntax über die Direktiven .intel_syntax geändert bzw. .att_syntax wiederhergestellt werden.[13] Die ausführbare Datei von gas für x86 hat auch den Schalter -msyntax= mit den Werten intel und att mit denen jeweils die vorrangige Syntax bestimmt werden kann.

Das obige Beispiel in Intel-Syntax:

.intel_syntax noprefix #mit Argument dass Register als Operanden den Vorsatz '%' nicht benötigen
pop edx
mov eax, edx
.att_syntax prefix

Inline Assembler

[Bearbeiten | Quelltext bearbeiten]

Der GNU Assembler zeichnet sich gegenüber anderen Assemblern auch durch eine Inline-Syntax aus, die es ermöglicht, den Assembler-Teil effektiv in einen Hochsprachenteil einzubinden. Dies geschieht durch eine Liste der Eingabe-, Ausgaberegister und der im Assembler-Teil verwendeten Register.[14] Hierdurch kann der Compiler einen Assembler-Teil während der Optimierung ohne Übergabe-Overheads an den Hochsprachenteil anbinden.

Das obige Beispiel als C-Inline-Assembler in Intel-Syntax:

  __asm__ __volatile__  (".intel_syntax noprefix \n\t"
      "pop edx         ;Intel-syntax kommentar \n\t"
      "mov eax, edx                            \n\t"
      ".att_syntax prefix                      \n\t"
      : /* no output operands  */
      : "d" (save_var), "a" (temp_var) /* inputs operands*/
      : "eax", "edx" /* intern verwendete register (clobber list)*/);

Infolge der Wortlänge von 2 Bytes der Intel 8086, 80286 u. ä. kann der GNU Assembler auf ihnen nicht laufen. Um Programme für sie (oder den Real oder Virtual 8086 Mode) zu assemblieren, kann die Direktive .code16 zur Voreinstellung verwendet werden. Das gewährleistet nicht, dass das Programm auf den alten Prozessoren läuft. Dazu muss auf alle 32- und 64-Bit-Ausdrücke verzichtet werden, sonst werden sie mit den Maschinensprachenvorsätzen 66h oder 67h für die entsprechenden Operanden- bzw. Arbeitsspeicheradressenlängen zur Übersteuerung der Real-Mode-Voreinstellung assembliert. Es dürfen daher insbesondere nur die Befehlsanhänge -b für 1 byte oder -w für 2 bytes („word“) lange Operanden in AT&T-Ausdrucksweise wie bei movb und Registernamen wie %ax statt %eax oder %rax (s. Register des 8086) verwendet werden.

Einzelnachweise

[Bearbeiten | Quelltext bearbeiten]
  1. sourceware.org. (abgerufen am 8. Februar 2021).
  2. binutils 2.42. Arch Linux ARM, abgerufen am 27. November 2024.
  3. binutils-z80 2.31.1. Debian, abgerufen am 29. November 2024. Komprimierte Archive für amd64, ARM64, i386 und ARMhf.
  4. Debian-Almquist-Shell-Projekt: dash(1) — Linux manual page, DESCRIPTION. Michael Kerrisk, 8. Juni 2024, abgerufen am 14. Dezember 2024. Abschnitt Invocation; Abschnitt Builtins, Eintrag alias.
  5. Ole Vanhoefer: /etc/profile. In: Linux-Fibel. 1. September 2004, abgerufen am 14. Dezember 2024.
  6. Package: binutils. Red Hat, 24. August 2024, abgerufen am 8. Dezember 2024.
  7. Source Package: binutils. Red Hat, 24. August 2024, abgerufen am 8. Dezember 2024.
  8. The GNU Assembler – Assembler Directives. In: sourceware.org. Abgerufen am 27. März 2022.
  9. Susan Welsh: AT&T Assembly Syntax (Memento vom 7. Januar 2020 im Internet Archive). Sig 9, 17. Juli 2017.
  10. AT&T Syntax versus Intel Syntax abgerufen am 13. November 2019.
  11. GAS. Sourceforge, abgerufen am 21. November 2024.
  12. Index der binutils-Archive. GNU-Projekt, abgerufen am 21. November 2024.
  13. Ram Narayan: Linux assemblers: A comparison of GAS and NASM bei IBMDeveloper vom 17. Oktober 2007, abgerufen am 13. November 2019.
  14. 5. Extended Asm. www.ibiblio.org, 1. März 2003, abgerufen am 27. Juli 2011 (englisch): „[...]we can also specify the operands. It allows us to specify the input registers, output registers and a list of clobbered registers