SELFHTML

Grundsätzliches zu Perl

Informationsseite

nach unten Aufrufmöglichkeiten des Perl-Interpreters
nach unten Erste Zeile eines Perl-Scripts
nach unten Anweisungen notieren
nach unten Anweisungsblöcke notieren
nach unten Kommentare in Perl
nach unten Regeln für selbst vergebene Namen
nach unten Sauberer Programmierstil

 nach unten 

Aufrufmöglichkeiten des Perl-Interpreters

Um eigene Perl-Scripts auszuführen bzw. zu testen, müssen Sie den Seite Perl-Interpreter installiert haben. Um Perl als Sprache für CGI-Scripts einzusetzen, muss außerdem ein Seite Web-Server installiert sein.

Bei CGI-Scripts fordert der Web-Browser vom Web-Server über HTTP eine Datei an, die der Web-Server als auszuführendes Script erkennt. Um zu wissen, dass die vom Browser angeforderte Datei ein auszuführendes CGI-Script ist, prüft der Web-Server verschiedene Kriterien:

Diese Faktoren bewirken, dass, wenn der Browser ein Perl-Script im CGI-Verzeichnis aufruft, der Web-Server entsprechend reagiert und den Quelltext des Scripts nicht einfach an den Browser sendet, sondern den Perl-Interpreter mit dem CGI-Script aufruft.

Perl ist aber nicht nur für CGI-Scripts gedacht. Perl-Scripts können zahllose Aufgaben auf einem Rechner übernehmen, z.B. Backups organisieren, die Rechnerauslastung analysieren, in Dateien nach etwas suchen und es durch etwas anderes ersetzen usw. Um Perl-Scripts auszuführen, die nicht als CGI-Scripts eingesetzt werden, müssen Sie einen Zugang zu einer Shell oder Kommandozeile auf dem Rechner haben. Am lokalen PC und unter MS Windows können Sie ein DOS-Fenster öffnen. Dann können Sie den Perl-Interpreter vom DOS-Prompt aus aufrufen. Bei Unix-basierten Systemen benötigen Sie einen Zugang als Benutzer. Nach dem Anmelden am System erhalten Sie eine Shell, also eine benutzereigene Kommandozeile. Von dort aus können Sie den Perl-Interpreter aufrufen, vorausgesetzt Sie haben die Rechte dazu. Wenn Sie Perl-Scripts über Kommandozeile auf einem entfernten Rechner ausführen wollen, also etwa auf einem öffentlichen Server, wo Sie Web-Speicherplatz gemietet haben, dann brauchen Sie einen Telnet- oder SSH-Zugang zu diesem Rechner. Außerdem benötigen Sie ein Telnet- oder SSH-Programm (im Online-Angebot des SELFHTML Linkverzeichnisses finden Sie Online-Seite WWW-Links zu Telnet- und SSH-Programmen). Mit einem solchen Programm können Sie sich aus der Ferne an einem Rechner anmelden und erhalten eine Shell zum Eingeben von Kommandos. Fragen Sie gegebenenfalls Ihren Provider danach, ob Sie Telnet- oder SSH-Zugang zum Server haben!

Von der Kommandozeile aus können Sie den Perl-Interpreter mit einem Perl-Script, also einer Datei mit Perl-Code, aufrufen. Solche Dateien haben die Standard-Dateinamenendung .pl. Der Perl-Interpreter wird normalerweise einfach durch Eingabe von perl gestartet. Wenn Sie beispielsweise ein Perl-Script namens hallowelt.pl haben, können Sie dieses Script mit perl hallowelt.pl starten. Gegebenenfalls müssen Sie sowohl den Perl-Interpreter als auch das Perl-Script mit den korrekten Pfadnamen aufrufen, unter DOS/Windows also z.B. c:\www\bin\perl.exe c:\scripts\perl\hallowelt.pl, unter Unix-basierten Systemen z.B. /usr/bin/perl /scripts/perl/hallowelt.pl.

Neben der reinen Angabe einer Perl-Datei gibt es Optionen beim Aufruf des Perl-Interpreters. Die Optionen folgen unmittelbar hinter dem Programmdateinamen und vor dem Namen des Perl-Scripts, also etwa perl -c test.pl. Sie können auch mehrere Optionen aneinanderhängen. Notieren Sie dazu nur ein Minuszeichen mit allen gewünschten Optionsbuchstaben hintereinander, z.B. perl -cwT test.pl

Die folgende Tabelle enthält einige Optionen beim Aufruf des Perl-Interpreters.

Option Bedeutung
-c Das Perl-Script wird nicht ausgeführt, sondern nur in einen perlinternen Syntaxbaum kompiliert und so auf syntaktische Richtigkeit überprüft.
-d Das Perl-Script wird im Debug-Modus ausgeführt. Der Debug-Modus erlaubt das systematische Austesten des Perl-Scripts. Im Debug-Modus stehen etliche Befehle zum Kontrollieren und Überprüfen des Script-Ablaufs bereit.
-h Wenn Sie Perl mit dieser Option ohne Angabe eines Scripts aufrufen, gibt der Perl-Interpreter eine Übersicht aller verfügbaren Optionen aus.
-S Das Script braucht nur als Dateiname ohne Pfad angegeben werden. Wenn es in einem der Verzeichnisse liegt, die in der PATH-Variablen des Betriebssystems genannt sind, findet der Perl-Interpreter das Script auch ohne Pfadangabe.
-T Das Script wird im so genannten "tainted"-Modus ausgeführt. Das heißt, alle Daten, die das Perl-Script von außen bekommt, werden vom Perl-Interpreter besonders gekennzeichnet und müssen vom Script bei kritischen Operationen speziell bearbeitet werden, bevor sie benutzt werden können.
-v Gibt die Version und den genauen Stand des Perl-Interpreters aus.
-w Bewirkt, dass der Perl-Interpreter nicht nur offensichtliche Fehlermeldungen bei Syntaxfehlern ausgibt, sondern auch Warnungen bei möglichen Fehlern, logisch zweifelhaften Anweisungsfolgen, undefinierten Zuweisungen usw.

 
 nach obennach unten 

Erste Zeile eines Perl-Scripts

In der ersten Zeile eines Perl-Scripts, der so genannten "Shebang-Zeile", muss eine Anweisung stehen, die angibt, wo sich die ausführbare Datei des Perl-Interpreters befindet.

Beispiel eines vollständigen Perl-Scripts:

#!/usr/bin/perl
print "Hallo Welt\n";

Erläuterung:

Die Anweisung zur Lage des Perl-Interpreters auf dem Rechner beginnt mit den Zeichen #!, dem so genannten Shebang, - gefolgt von der Pfadangabe und dem Namen des Perlinterpreters. Ab der zweiten Zeile können Sie Perl-Code notieren, wie im Beispiel die Ausgabe der beiden Wörter Hallo Welt.

Die Anweisung zur Lage des Perl-Interpreters auf dem Rechner wird vor allem von Unix-basierten Systemen ausgewertet, und zwar dann, wenn die Perl-Datei auf den Modus "ausführbar" gesetzt ist. Die Datei kann dann direkt aufgerufen werden und startet den Perl-Interpreter. Wenn Sie unter anderen Umgebungen als Unix arbeiten, notieren Sie einfach die übliche Zeile mit der üblichen Pfadangabe (#!/usr/bin/perl) in der ersten Zeile Ihres Perl-Scripts. Sollte das Script dann nicht ausgeführt werden bzw. eine Fehlermeldung produzieren, notieren Sie den genauen Pfad der ausführbaren Datei des Perl-Interpreters. Trennen Sie dabei die Verzeichnisse durch einfache Schrägstriche. Eine typische Angabe unter MS Windows ist beispielsweise #!/programme/perl/bin/perl.exe.

Beachten Sie:

Bei Web-Servern mit CGI-Unterstützung hängt es vom Web-Server-Produkt ab, ob die Zeile für die Lage des Perl-Interpreters ausgelesen wird. Zu den Seite Grundeinstellungen eines Web-Servers gehört mittlerweile auch die Angabe des Pfades zum Perl-Interpreter. Wenn dann bei laufendem Web-Server ein Perl-Script über das HTTP-Protokoll ausgeführt wird, ruft der Web-Server den Perl-Interpreter entsprechend seiner Konfiguration auf.

Wenn der Perl-Interpreter im Suchpfad für ausführbare Programme liegt, der z.B. in der Umgebungsvariablen PATH gespeichert ist, dann genügt es, in der ersten Zeile des Perl-Scripts zu notieren:
#!perl

Hinter der Pfadangabe zum Perl-Interpreter kann, durch Leerraum getrennt, auch noch eine Aufrufoption folgen wie in der Tabelle bei den nach oben Aufrufmöglichkeiten des Perl-Interpreters beschrieben. So können Sie beispielsweise notieren:
#!/usr/bin/perl -w
Damit weisen Sie den Perl-Interpreter an, neben Fehlern auch Warnungen zu melden. Diese Option wird von Perl-Programmierern gerne empfohlen (siehe auch nach unten Sauberer Programmierstil).

 nach obennach unten 

Anweisungen notieren

Perl besteht wie andere Programmiersprachen aus einer kontrollierten Anordnung von Anweisungen. Das sind Befehle, die der Perl-Interpreter bewertet und in Maschinencode umsetzt, der auf dem betreffenden Rechner ausführbar ist.

Es gibt einfache und komplexere Anweisungen.

Beispiel eines vollständigen Perl-Scripts:

#!/usr/bin/perl

$Zahl = 42;
$Quadrat = $Zahl * $Zahl;
print "Das Quadrat von ", $Zahl, " = ", $Quadrat, "\n";

Erläuterung:

Eine Anweisung in Perl besteht aus einem Befehl, der normalerweise mit einem Strichpunkt ; abgeschlossen wird.

Eine Anweisung ist es zum Beispiel:

 nach obennach unten 

Anweisungsblöcke notieren

Ein Anweisungsblock besteht aus einer oder mehreren einzelnen nach oben Anweisungen, die innerhalb einer übergeordneten Anweisung stehen. So können Anweisungsblöcke beispielsweise innerhalb einer Seite bedingten Anweisung oder innerhalb einer Seite Schleife stehen. Auch alle Anweisungen, die innerhalb einer Seite Subroutine stehen, bilden einen Anweisungsblock.

Beispiel 1:

if($Zahl > 1000) {
  $Zahl = 0;
}

Beispiel 2:

my $i = 1;
while($i <= 99) {
  print "Das Quadrat von ", $i, " ist ", $i * $i, "\n";
  $i = $i + 1;
}

Erläuterung:

Ein Anweisungsblock wird durch eine öffnende geschweifte Klammer { begonnen und durch eine schließende geschweifte Klammer } beendet.

Bei bedingten Anweisungen (wie in Beispiel 1) oder bei Schleifen (wie in Beispiel 2) müssen Sie solche Anweisungsblöcke notieren, auch wenn nur eine einzige Anweisung von der Bedingung oder der Schleifenbedingung abhängig ausgeführt werden soll.

Anweisungsblöcke können auch verschachtelt sein.

 nach obennach unten 

Kommentare in Perl

Wie jede bessere Programmiersprache erlaubt Perl das Notieren von Kommentaren. Kommentare werden nicht als Code interpretiert und erläutern das Script oder machen den Code besser lesbar.

Beispiel:

my $i = 1; # hier wird die Variable $i initialisiert
#=========================================
# es folgt die Ausgabe der Quadratzahlen
# von 1 bis 99
#=========================================
while($i <= 99) {
  print "Das Quadrat von ", $i, " ist ", $i * $i, "\n";
  $i = $i + 1;
}

Erläuterung:

Kommentare in Perl beginnen mit einem Gatterzeichen #. Alles, was hinter dem Gatterzeichen bis zum Ende der Zeile steht, wird von Perl ignoriert. Beginnt eine Zeile mit dem Gatterzeichen, ist die gesamte Zeile ein Kommentar. Viele Perl-Programmierer nutzen die Kommentartechnik auch, um ihre Scripts optisch kunstvoll zu gestalten. Das obige Beispiel zeigt solch ein optisches Konstrukt mit Gleichheitszeichen.

Beachten Sie

Neben der einfachen Auskommentierung besteht auch die Möglichkeit, größere Abschnitte des Scripts als Dokumentation auszuweisen. Solche Dokumentationen können mit dem Programm perldoc, das zum Lieferumfang des Perl-Interpreters gehört, separat gelesen werden. Bei komplexeren Scripts können Sie so die Dokumentation gleich zum Script mit dazuliefern. Im Zusammenhang mit Modulen wird im Abschnitt Seite Moduldokumentationen lesen mit perldoc beschrieben, wie solche Abschnitte aussehen. Was dort für Module beschrieben wird, funktioniert in jedem Perlscript.

 nach obennach unten 

Regeln für selbst vergebene Namen

An vielen Stellen in Perl müssen Sie selbst Namen vergeben, zum Beispiel für Variablen wie Seite Skalare, Seite Arrays oder Seite Hashes, sowie für Seite Subroutinen.

Beispiel:

my $Daten = $ENV{'QUERY_STRING'};

Erläuterung:

Im Beispiel ist Daten ein selbst vergebener Name. Bei selbst vergebenen Namen gelten folgende Regeln:

Vergeben Sie sprechende Namen, die Ihnen auch ein halbes Jahr, nachdem Sie das Perl-Script geschrieben haben, noch signalisieren, welche Bedeutung sie haben. Es dürfen ruhig auch deutschsprachige Wörter sein, solange die genannten Regeln eingehalten werden.

Beachten Sie:

Seit Perl-Version 5.6.0 können Perlscripts auch in Unicode notiert werden. Damit ist es möglich, auch beispielsweise Umlaute in Variablennamen zu verwenden. Die Perlscripts müssen dann UTF-8-codiert sein. In einem Editor, der diese Codierung nicht beherrscht, sieht dann eine Variable $Straße beispielsweise so aus: $Straße

 nach obennach unten 

Sauberer Programmierstil

Es gibt ein paar Dinge, die ein sauber geschriebenes Perl-Script enthalten sollte. Ohne diese Dinge funktionieren die meisten Perl-Scripts zwar genauso gut, aber kritische (mehrdeutige) Anweisungen im Quelltext fallen dann nicht auf und können leichter zu Fehlern führen. Das folgende kleine Perl-Script enthält ein paar Dinge, die von Perl-Programmierern zum sauberen Programmieren empfohlen werden.

Beispiel eines vollständigen CGI-Scripts in Perl:

#!/usr/bin/perl -w

use strict;
use CGI::Carp qw(fatalsToBrowser);

my $headline = "Ein sauberes Script!";

print "Content-type: text/html\n\n";
print '<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN">', "\n";
print "<html><head><title>Test</title></head><body>\n";
print "<h1>$headline</h1>\n";
print "<p>nur auf das CGI-Modul wurde hier verzichtet ;-)</p>\n";
print "</body></html>\n";

Erläuterung:

Zu den empfohlenen Maßnahmen sauberer Programmierung zählt auf jeden Fall die Verwendung der Aufrufoption -w in der ersten Zeile des Scripts. Dadurch gibt der Perl-Interpreter Warnungen zu zweifelhaften Befehlen aus, bevor er das Script ausführt. Manche Unsauberkeiten im Quellcode werden so ohne zeitraubende Suche erkannt.

In die gleiche Richtung zielt die Anweisung use strict;. Damit wird ein spezielles Seite Pragma-Modul eingebunden, das bewirkt, dass der Perl-Interpreter keine unsicheren Konstrukte akzeptiert, bevor er das Script ausführt. Das können zum Beispiel nicht definierte Variablen sein. Auch damit lassen sich Fehler vermeiden, die durch unachtsames oder schlampiges Programmieren entstehen können und bei einer toleranteren Interpretation des Quelltextes nicht auffallen.

Die Anweisung use CGI::Carp qw(fatalsToBrowser); wird CGI-Programmierern dringend empfohlen. Sie bindet ein spezielles Modul ein, das beim Abbruch des Scripts aufgrund eines Syntax-Fehlers oder einer Anweisung wie Seite die die Fehlerursache direkt auf die Standardausgabe schreibt, also an den aufrufenden Browser übergibt. Auf diese Weise sparen sich CGI-Programmierer, beim Scriptabbruch in der meist langen Error-Logdatei des Web-Servers nach der Fehlermeldung zu suchen. Diese Anweisung nutzt jedoch nichts, wenn bereits Fehler auftreten, bevor der Perl-Interpreter ausgeführt werden kann, also etwa, wenn die erste Zeile des Perl-Scripts eine falsche Lage des Perl-Interpreters ausweist.

Wenn Sie use strict; angeben, zwingt Perl Sie dazu, alle Ihre Variablen vor der ersten Verwendung zu deklarieren (z.B. mit my). Im obigen Beispiel ist dies bei der Initialisierung von $headline der Fall. Dies hat den Vorteil, dass logische Fehler im Script entstehen, wenn Sie im weiteren Verlauf des Scripts einen Variablennamen falsch geschrieben haben. Die Verwendung von my bewirkt, dass eine Variable nur in der aktuellen Datei oder im aktuellen Anweisungsblock gültig ist. Näheres dazu bei der Beschreibung der Funktion Seite my.

Wie Sie dem Quellcode des obigen Beispiels entnehmen können, gibt das Script in seiner Ausgabe an den aufrufenden Browser mit einem verschmitzten Lächeln zu, dass es nicht das Seite CGI-Modul verwendet. Tatsächlich sollten Sie sich, wenn Sie CGI-Scripts schreiben wollen, mit diesem Modul und seiner Syntax beschäftigen. Die Drohung mit dem Zeigefinger, dieses Modul verwenden zu sollen, ist bei manchen Hardlinern zwar schon zur krankhaften Zwangsgebärde geworden, doch für viele CGI-Scripts ist die Verwendung des CGI-Moduls auf jeden Fall zu empfehlen.

Generell gehört es zum sauberen Programmierstil, auf vorhandene und bewährte Ressourcen zurückzugreifen. Perl wird ja nicht nur alleine als Perl-Interpreter ausgeliefert, sondern mit einer ganzen Reihe von fertigen Code-Modulen, die viele Programmieraufgaben erleichtern. Nachdem Sie sich mit den Sprachelementen und eingebauten Funktionen von Perl etwas vertraut gemacht haben, sollten Sie sich daher auf jeden Fall auch mit den Seite Perl-Modulen beschäftigen.

Bei größeren Scripts sollten Sie den Quellcode auf Seite Subroutinen verteilen. Mit dieser Technik können Sie Anweisungsblöcke definieren, die bestimmte Aufgaben übernehmen und von verschiedenen anderen Stellen im Script aus aufgerufen werden können. Ferner können Sie die Technik der Subroutinen dazu nutzen, um den Scriptablauf in Teilprozeduren zu zerlegen und nur bestimmte Teile des Scripts auszuführen.

Seit der Version 5 des Interpreters erlaubt Perl auch Seite objektorientiertes Programmieren. Das ist zwar für Neulinge erst mal ein wenig schwieriger zu begreifen, doch wenn man es sich angewöhnt, werden größere Anwendungen in Perl letztlich einfacher zu programmieren, und der Code sieht deutlich besser lesbar aus.

Zum "sauberen Programmieren" gehören schließlich folgende allgemeine Empfehlungen:

 nach oben
weiter Seite CGI-notwendige Anweisungen in Perl
zurück Seite HTML-Formulare und CGI
 

© 2001 E-Mail selfhtml@teamone.de