Startseite Kontakt Impressum
Resultate zum Thema: GNU Compiler Collection


GNU Compiler Collection

Sie haben nach der Definition zum Begriff "GNU Compiler Collection" gesucht, wir haben für Sie eine passende Erklärung des Begriffes "GNU Compiler Collection" gefunden.






GCC ist eine Abkürzung aus dem Informationstechnik-Bereich für eine Sammlung von Computerprogrammen mit der ursprünglichen Bedeutung GNU C Compiler. Da GCC inzwischen aber mehr als nur einen C-Compiler beinhaltet, hat GCC (Großbuchstaben) inzwischen die Bedeutung GNU Compiler Collection (engl. für GNU Compilersammlung). Die Bezeichnung gcc (Kleinbuchstaben) steht immer noch für den C-Compiler.

Überblick

Die Sammlung enthält Compiler für die Programmiersprachen C (Programmiersprache), C++, Programmiersprache Java, Objective-C, Fortran, Treelang und Ada (Programmiersprache). Die Compiler-Sammlung unterliegt den Bedingungen der GNU General Public License. Sie gehört zum Handwerkzeug jedes Computerbenutzers, der seine freie, quelloffene Software selber kompiliert.

Die erste öffentliche Version (0.9) des GCC wurde am 22. März 1987 von Richard Stallman für das GNU-Projekt freigegeben (Version 1.0 erschien am 23. Mai desselben Jahres) und wird heute von Programmierern auf der ganzen Welt weiterentwickelt. Die Erweiterung des C-Compilerpakets zur Compiler-Collection erfolgte im Rahmen des EGCS-Projektes, das eine Weile parallel zum GCC existierte und schließlich zum offiziellen GCC wurde.

GCC ist ein umfangreiches Projekt. Es besteht aus über 25.000 Dateien mit über 2,1 Millionen Zeilen Code.

GCC wird von einer Reihe von Systemen als Standard-Compiler benutzt, darunter GNU/Linux, Berkeley Software Distribution, Mac OS X, NextStep, und BeOS. Er wurde auf mehr Systeme und Rechnerarchitekturen portiert als jeder andere Compiler und bietet sich besonders für Betriebssysteme an, die auf verschiedenen Hardware-Plattformen laufen sollen.

Das GCC-Projekt entschied sich, einige Plattformen offiziell als primäre und andere als sekundäre Evaluationsplattformen zu bezeichnen. Vor jeder Veröffentlichung einer neuen Version werden insbesondere diese beiden Gruppen getestet. Zu den Prozessoren, für die GCC Programme erzeugen kann, gehören (primäre und sekundäre Evaluationsplattformen sind markiert):

» Alpha-Prozessor (primär, unter Red Hat Linux)
» ARM-Architektur (sekundär, unter Linux)
» H8/300
» S/370, S/390
» x86 und AMD64 (primär unter Linux und FreeBSD)
» IA-64 "Itanium"
» Motorola 68000
» Motorola 88000
» MIPS-Architektur (primär unter IRIX)
» PA-RISC (primär unter HP-UX)
» PDP-11
» PowerPC (primär unter AIX, sekundär unter Linux)
» SuperH
» Sun SPARC (primär unter Solaris, sekundär unter Linux)
» VAX

Dazu kommen noch eine Reihe weiterer eher exotische Plattformen, wie z.B. Motorolas 68HC11, A29K, ARC, C4x, CRIS, D30V, DSP16xx, FR-30, FR-V, Intel i960, IP2000, M32R, MCORE, MMIX, MN10200, MN10300, NS32K, ROMP, Stormy16, V850, und Xtensa, die von kaum mehr als einer Handvoll Leuten genutzt werden.

Struktur

Das externe Interface des GCC entspricht dem eines Standard-Unix-Compilers. Der Benutzer ruft ein Hauptprogramm mit dem Namen gcc auf, das Kommandozeilen-Argumente interpretiert, die in den Eingabedateien vorliegende Programmiersprache feststellt, den entsprechenden Sprach-Compiler aufruft, dem Assembler dessen Ausgabe übergibt und zum Schluss evtl. den Linker aufruft, um ein komplettes Programm zu erhalten.

Jeder Sprach-Compiler ist ein separates Programm, das Quellcode entgegen nimmt und Assemblersprache produziert. Alle haben eine vergleichbare interne Struktur: Ein sprachabhängiges Frontend parst die Sprache und erzeugt einen Abstrakter Syntaxbaum, der an ein Backend übergeben wird, das den Baum in GCCs Register Transfer Language (RTL) überführt, verschiedene Codeoptimierungen durchführt und zum Schluss Assemblersprache erzeugt. Der dazu verwendete Algorithmus basiert auf Arbeiten von Jack Davidson und Chris Fraser zum Pattern Matching.

Fast alle Bestandteile des GCC sind in C geschrieben. Eine Ausnahme bildet das Ada-Frontend, das zum größten Teil in Ada geschrieben ist.

Frontends
Frontends müssen Bäume produzieren, die vom Backend verarbeitet werden können. Wie sie dies erreichen, bleibt ihnen überlassen. Einige Parser benutzen YACC-ähnliche Grammatiken, andere verwenden handgeschriebene rekursive Parser.

Bis vor kurzem war die Baumrepräsentation des Programms nicht völlig vom Zielprozessor unabhängig. Die Bedeutung eines Baums konnte für unterschiedliche Sprachfrontends unterschiedlich sein, und Frontends konnten ihren eigenen Baumcode zur Verfügung stellen.

Mit dem Tree-SSA-Projekt, das in die neue Version GCC 3.5 integriert wird, wurden zwei neue Formen von sprachunabhängigen Bäumen eingeführt. Diese neuen Baumformate wurden GENERIC und GIMPLE getauft. Parsing wird nun durchgeführt, indem ein temporärer sprachabhängiger Baum nach GENERIC konvertiert wird. Der so genannte "Gimplifier" überführt diese komplexe Form in die SSA-basierte GIMPLE-Form, von der ausgehend eine Reihe neuer sprach- und architekturunabhängiger Optimierungen durchgeführt werden können.

Optimierung an Bäumen passt eigentlich nicht in das Schema von "Frontend" und "Backend", da sie nicht sprachabhängig ist und kein Parsen beinhaltet. Die GCC-Entwickler haben diesem Teil des Compilers daher den Namen "Middleend" gegeben. Zu den gegenwärtig am SSA-Baum durchgeführten Optimierungen gehören Dead Code Elimination, Partial Redundancy Elimination, Global Value Numbering, Sparse Conditional Constant Propagation, und Scalar replacement of Aggregates. Array-basierende Optimierungen wie zum Beispiel automatische Vektorisierung, wie sie der Intel-Compiler anbietet, werden gegenwärtig entwickelt.

Backend
Das Verhalten des GCC-Backends wird teilweise durch Präprozessor-Makros und architekturspezifische Funktionen bestimmt, mit denen zum Beispiel die Endianness, Wortgröße und Aufrufkonventionen definiert werden. Unter Verwendung dieser Informationen generiert das Backend die Register Transfer Language (RTL). Obwohl GCCs RTL dem Namen nach prozessorunabhängig ist, ist die Sequenz an abstrakten Instruktionen daher bereits an das Ziel angepasst.

Die Art und Anzahl der vom GCC an der RTL durchgeführten Optimierungen werden mit jeder Compiler-Version weiterentwickelt. Seit der kürzlichen Einführung globalen SSA-basierten Optimierungen an GIMPLE-Bäumen haben die RTL-Optimierungen leicht an Bedeutung verloren, da in der RTL-Repräsentation des Programms weit weniger der für viele Optimierungen wichtigen High-Level-Informationen enthalten sind.

In einer "Reload"-Phase werden abstrakte Pseudo-Register durch echte Maschinenregister ersetzt, wobei Daten aus Strukturen verwendet werden, die den Befehlssatz des Ziels beschreiben. Diese Phase ist recht kompliziert, da die verschiedenen Eigenheiten der jeweiligen Zielarchitektur hier besonders berücksichtigt werden müssen.

Die letzte Phase ist relativ unspektakulär. Aus der bereits recht maschinennahen Umsetzung der RTL wird Assemblercode generiert, indem die Namen von Registern und Adressen in Strings umgesetzt werden, die die Instruktionen spezifizieren.

Siehe auch

» GCC XML Node Introspector
» Plattformunabhängigkeit
» Free Software Foundation
» GNU
» LLVM
» DISTCC
» CCACHE

Weblinks

» gcc.gnu.org - Die offizielle GCC-Startseite
» Kurzanleitung für den GCC





Dieser Artikel basiert auf einer Übersetzung des Artikels :en:GNU Compiler Collection aus der englischen Wikipedia, Version vom 31. Juli 2004



:: Diese Seite verlinken ::