SELFHTML/Navigationshilfen HTML/XHML Allgemeine Regeln für HTML |
Zeichenvorrat, Sonderzeichen und HTML-eigene Zeichen |
|
Allgemeines zu Zeichen in HTML |
|
Wenn Sie Ihre Texte - sagen wir in deutscher Sprache - einfach in einen HTML-Editor eintippen, den Text mit Hilfe von HTML-Elementen strukturieren und sich das Ganze dann im Web-Browser anzeigen lassen, wird in der Regel der gesamte eingegebene Text korrekt angezeigt. Das klingt selbstverständlich - ist es aber nicht. In der HTML-Datei stehen nämlich nicht Ihre eingegebenen Buchstaben und Satzzeichen, sondern Byte für Byte numerische Werte wie 75, 168 oder 32. Der Browser versucht nun herauszubekommen, nach welchem Zeichensatz er diese numerischen Werte interpretieren soll. Ob beispielsweise nach einem westeuropäischen, einem kyrillischen oder einem arabischen Zeichensatz. Wenn Sie keinerlei Angaben zum verwendeten Zeichensatz machen, dann wird der Browser am Ende seiner Bemühungen einfach den Zeichensatz verwenden, der in seinen Einstellungen voreingestellt ist. In Ihrem Browser, der vermutlich eine englische oder deutschsprachige Benutzerführung hat, ist vermutlich der Zeichensatz für westeuropäische Sprachen eingestellt, der so genannte Latin-1-Zeichensatz (ISO 8859-1). Weil der HTML-Editor oder Texteditor, den Sie beim Eintippen benutzen, vermutlich ebenfalls nach diesem Zeichensatz abspeichert, klappt alles wunderbar. Nun könnte es aber, wenn Ihre Web-Seiten im Web stehen, auch mal passieren, dass Besucher aus Osteuropa, Asien usw. vorbeikommen, die ganz andere Zeichensätze in ihren Web-Browsern voreingestellt haben. Solche Besucher werden dann lauter Zeichen ihres eigenen, vertrauten Zeichensatzes sehen - aber es wird ein wilder Zeichensalat sein, dem man beim besten Willen keinen Sinn entnehmen kann.
HTML bietet Ihnen deshalb die Möglichkeit an, dem Browser mitzuteilen, welchen Zeichensatz Sie meinen. Dann liegt es am Browser, die von Ihnen gemeinten Zeichen am Bildschirm beispielsweise eines Seitenbesuchers aus Fernost so anzuzeigen wie Sie sie eingetippt haben. Es gibt folgende Möglichkeiten, dem Browser mitzuteilen, welchen Zeichensatz bzw. welches bestimmte Zeichen aus einem anderen als dem voreingestellten Zeichensatz Sie meinen:
Falls Sie das Thema mit den numerischen Bytes und den Zeichensätzen vertiefen möchten, können Sie den Abschnitt Computer und geschriebene Sprache lesen.
Wenn Sie in Ihrer HTML-Datei sonst keine Angaben zum verwendeten Zeichensatz machen, sollten Sie im Hinblick auf das Internet und die internationale Verwendung deutsche Umlaute und scharfes S durch spezielle, dafür vorgesehene benannte Zeichen ersetzen. Das gilt für den gesamten Inhalt einer HTML-Datei.
Ersetzen Sie das Zeichen ä
durch die Zeichenfolge ä
Ersetzen Sie das Zeichen Ä
durch die Zeichenfolge Ä
Ersetzen Sie das Zeichen ö
durch die Zeichenfolge ö
Ersetzen Sie das Zeichen Ö
durch die Zeichenfolge Ö
Ersetzen Sie das Zeichen ü
durch die Zeichenfolge ü
Ersetzen Sie das Zeichen Ü
durch die Zeichenfolge Ü
Ersetzen Sie das Zeichen ß
durch die Zeichenfolge ß
In München steht ein Hofbräuhaus. Dort gibt es Bier aus Maßkrügen. |
Ersetzen Sie die deutschen Sonderzeichen wie im obigen Beispiel durch die entsprechenden Zeichenfolgen - keine Sorge, die Web-Browser verstehen das und zeigen die Zeichen korrekt an.
Es gibt eine Menge weiterer Sonderzeichen, die durch solche Umschreibungen dargestellt werden sollten. Diese finden Sie in der HTML-Zeichenreferenz aufgelistet.
Auch für das Eurozeichen gibt es ein benanntes Zeichen in HTML.
Preis: € 199,- |
Notieren Sie an der Stelle, wo das Euro-Zeichen stehen soll, die Zeichenfolge €
.
Vermeiden Sie unter MS Windows, das Eurozeichen über die Tastatur erzeugt in HTML einzutippen ([AltGr]+[e]). Der Grund ist, dass Microsoft das Eurozeichen intern auf den Zeichenwert 128 gelegt hat, um es über Tastatur zugänglich zu machen und in vorhandene Schriftarten einzubauen. Das entspricht jedoch nicht dem Unicode/ISO-10646-Standard, auf dem HTML aufsetzt. Verwenden Sie in HTML deshalb das oben beschriebene &euro
oder als Alternative eine numerische Notation nach dem Unicode/ISO-10646-Standard. Dort hat das Eurozeichen den Hexadezimalwert 20AC oder den Dezimalwert 8364. Nach HTML 4.0 können Sie das Eurozeichen demnach numerisch so referenzieren: €
oder €
.
Wenn in Ihrem Text Zeichen vorkommen, die in HTML eine bestimmte Bedeutung haben, müssen Sie diese Zeichen maskieren. Die folgenden Zeichen müssen Sie wie folgt maskieren:
Ersetzen Sie das Zeichen <
durch die Zeichenfolge <
Ersetzen Sie das Zeichen >
durch die Zeichenfolge >
Ersetzen Sie das Zeichen &
durch die Zeichenfolge &
Ersetzen Sie das Zeichen "
durch die Zeichenfolge "
Das ist ein <HTML-Tag> GmbH & Co. KG "Text steht in Anführungszeichen" |
Ersetzen Sie die HTML-eigenen Zeichen wie im obigen Beispiel durch die entsprechenden Zeichenfolgen.
Am gefährlichsten ist die spitze öffnende Klammer (<
). Wenn Sie dieses Zeichen nicht wie vorgeschrieben maskieren, bringen Sie den Web-Browser mit ziemlicher Sicherheit durcheinander, weil er glaubt, nun würde ein HTML-Tag folgen. Die anderen drei zu maskierenden Zeichen führen zwar meistens nicht zu Anzeigefehlern, doch sollten Sie sie auch stets maskieren. Besonders bei normalen Anführungszeichen, die ja doch sehr oft zum Einsatz kommen, wird die Maskierung im Text oft vergessen.
Farben definieren in HTML | |
Grundgerüst einer HTML-Datei | |
SELFHTML/Navigationshilfen HTML/XHML Allgemeine Regeln für HTML |
© 2001 selfhtml@teamone.de