edition W3C.de

HTML 4.01-Spezifikation

Deutsche Übersetzung

Diese Version:
http://www.edition-w3.de/TR/1999/REC-html401-19991224
Aktuelle Version:
http://www.edition-w3c.de/TR/html4
Übersetzer:
Christine Kühnel (Übersetzung, fachliche Kommentierung) <kuehnel@screenexa.net>
Stefan Mintert (Fachlektorat und fachliche Kommentierung) <www.mintert.com/stefan/mail/>
Stefan Schumacher (Übersetzung, fachliche Kommentierung) <sts@schumacher-netz.de>

Bei diesem Dokument handelt es sich um eine Übersetzung eines W3C-Textes. Dieser Text ist urheberrechtlich geschützt; bitte beachten Sie die nachfolgenden Hinweise des Originaldokuments. Die Rechte an der Übersetzung liegen bei den Übersetzern und dem Verlag Addison-Wesley. Die Übersetzung hat keine durch das W3C legitimierte, normative Wirkung. Das einzige maßgebliche Dokument ist das englische Original.

Bitte senden Sie Fehler und Korrekturen zur deutschen Fassung an die Übersetzer.

Kommentare der Übersetzer, die als solche gekennzeichnet sind, unterliegen dem Urheberrecht der Übersetzer. Sie sind nicht Bestandteil des Ursprungsdokuments.

Diese Veröffentlichung ist eine Vorveröffentlichung. Kein Teil dieses Textes darf kopiert werden. Alle Rechte vorbehalten. Nach Abschluss der Arbeit wird das endgültige Dokument unter der oben angegebenen Adresse veröffentlicht. Die jetzige Veröffentlichung während der laufenden Arbeit dient zur Information von Interessierten und zur Prüfung durch die Fachöffentlichkeit. Sollten Sie Fehler finden oder Verbesserungsvorschläge haben, schicken Sie diese bitte per Mail an die Übersetzer.
Folgende Teile liegen noch in Englisch vor und müssen noch in deutscher Fassung generiert werden: (a) Gesamtinhaltsverzeichnis (b) Index


6 HTML-Grunddatentypen

Inhaltsverzeichnis

Dieser Abschnitt der Spezifikation beschreibt die Grunddatentypen, die als Inhalt eines Elements oder Wert eines Attributs vorkommen können.

Einührende Informationen darüber, wie die HTML-DTD zu lesen ist, finden Sie in Abschnitt 3, »Über SGML und HTML«.

6.1 Information zu Groß- bzw. Kleinschreibung

Jede Definition eines Attributs enthält die Information darüber, ob innerhalb seines Wertes zwischen Groß- und Kleinschreibung unterschieden wird. Die Information zu Groß- bzw. Kleinschreibung ist mit Hilfe folgender Schlüssel dargestellt:

CS
Im Wert wird zwischen Groß- und Kleinschreibung unterschieden (case-sensitive), d.h., Benutzerprogramme interpretieren »a« und »A« verschieden.
CI
Im Wert wird nicht zwischen Groß- und Kleinschreibung unterschieden (case-sensitive), d.h., Benutzerprogramme interpretieren »a« und »A« gleich.
CN
Der Wert kann nicht von Groß- in Kleinschreibung oder umgekehrt geändert werden, z.B., weil es sich um eine Zahl oder ein Zeichen aus dem Dokument-Zeichensatz handelt.
CA
Die Element- oder Attributdefinition selbst gibt die Information zu Groß- bzw. Kleinschreibung.
CT
Lesen Sie die Information zu Groß- bzw. Kleinschreibung (case-sensitivity) in der Typ-Definition nach.

Ist ein Attribut eine Liste, gelten, wenn nicht anders angegeben, die Schlüssel für alle Werte der Liste.

6.2 Grunddatentypen in SGML

Die Dokumenttyp-Definition spezifiziert die Syntax der Inhalte von HTML-Elementen und der Werte von Attributen unter Verwendung von SGML-Tokens (z.B. PCDATA, CDATA, NAME, ID usw.). Die vollständige Definition ist in [ISO8879] zu finden. Nachfolgend eine Zusammenfassung der Schlüssel-Informationen:

6.3 Text-Zeichenfolgen

Mehrere Attribute (in der DTD: %Text;) nehmen Text auf, der so angelegt ist, dass er für Menschen lesbar ist (»human readable«). Für einführende Informationen über Attribute lesen Sie bitte Abschnitt 3.3.2, »Attribute«.

Anmerkung der Übersetzer:

Eines dieser Attribute, das %Text; erwartet, ist das title-Attribut. Wie drei der zum Zeitpunkt des Erscheinens dieses Buches gängigen Browser den Link

<A href="www.edition-w3c.de/" 
      title="
             Wert               des 
             &quot;title-Attributes&quot;"
            >mein Link</A>
<!-- (Zwischen "Wert" und "des" 
befinden sich zwei Tabulatorsprünge) -->

zeigen, ist in der Abbildung zu sehen.

6.4 URIs

Diese Spezifiaktion verwendet den Terminus URI, wie er in [URI] definiert ist (s.a. [RFC1630]).

Beachten Sie, dass URIs URLs (wie in [RFC1738] und [RFC1808] definiert) beinhalten.

Relative URIs werden unter Verwendung eines Basis-URIs in vollständige URIs aufgelöst. [RFC1808], Abschnitt 3 definiert den normativen Algorithmus für diesen Prozess. Mehr Informationen über Basis-URIs finden Sie im Abschnitt 12.4, »Pfadangaben: Das Base-Element« im Kapitel über Links.

URIs werden in der DTD durch den Parameter-Entity %URI; verkörpert.

Generell unterscheiden URIs ziwschen Groß- und Kleinschreibung. Es kann URIs oder Teile von URIs geben, in denen Groß- oder Kleinschreibung keine Rolle spielt (z.B. Namen von Maschinen), aber dies herauszufinden, wird nicht immer leicht sein. Benutzer sollten immer annehmen, dass URIs zwischen Groß- und Kleinschreibung unterscheiden (um auf der sicheren Seite zu sein).

Informationen über Nicht-ASCII-Zeichen in URI-Attributwerten finden Sie im Anhang B.

6.5 Farben

Der Typ »color« (%Color;) für Attributwerte verweist auf Farbdefinitionen, wie sie in [SRGB] spezifiziert sind. Ein Farbwert (color value) kann entweder eine Hexadezimalzahl (mit vorangestelltem Nummernzeichen) oder einer der folgenden 16 Farbnamen (color names) sein. Die Farbnamen unterscheiden nicht zwischen Groß- und Kleinschreibung.

Farbnamen und sRGB-Werte
Black = »#000000«Green = »#008000«
Silver = »#C0C0C0«Lime = »#00FF00«
Gray = »#808080«Olive = »#808000«
White = »#FFFFFF«Yellow = »#FFFF00«
Maroon = »#800000«Navy = »#000080«
Red = »#FF0000«Blue = »#0000FF«
Purple = »#800080«Teal = »#008080«
Fuchsia = »#FF00FF«Aqua = »#00FFFF«

Dementsprechend beziehen sich sowohl »#800080« als auch »Purple« auf die Farbe »Purpur«.

6.5.1 Bemerkungen zur Verwendung von Farben

Obwohl Farben Dokumenten merklich Informationswert hinzufügen und sie lesbarer machen können, bedenken Sie bitte die folgenden Richtlinien, wenn Sie Farben in Ihre Dokumente mit einbeziehen:

6.6 Maße

HTML spezifiziert drei Arten von Maßwerten für Attribute:

  1. Pixels: Der Wert (in der DTD: %Pixels;) ist eine ganze Zahl, die die Anzahl der Pixel des Canvas (Bildschirm, Papier) angibt. Der Wert »50« bedeutet folglich 50 Pixel. Für normative Informationen über die Definition von Pixel lesen Sie bitte in [CSS1] nach.
  2. Length: Der Wert (in der DTD: %Length;) kann entweder %Pixel; oder ein prozentualer Anteil des verfügbaren horizontalen Platzes sein. Folglich bedeutet der Wert »50%« die Hälfte des verfügbaren Platzes.
  3. MultiLength: Der Wert (in der DTD: %MultiLength;) kann %Length; sein oder ein relatives Maß. Ein relatives Maß hat die Form »i*«, wobei »i« eine ganze Zahl ist. Wenn Benutzerprogramme Elementen, die sich darum bewerben, Platz zuweisen, weisen sie zuerst Pixel- und Prozentwerte zu, dann verteilen sie den verbleibenden verfügbaren Platz unter den relativen Maßen. Jedes relative Maß erhält einen Anteil des verfügbaren Platzes, der proportional ist zu der dem »*« vorausgehenden ganzen Zahl. Der Wert »*« ist äquivalent zu »1*«. Folglich werden, wenn 60 Pixel an Platz verfügbar sind, nachdem das Benutzerprogramm Pixel- und Prozentwerte zugewiesen hat und die sich bewerbenden relativen Maße 1*, 2*, und 3* sind, der 1* 10 Pixel, der 2* 20 Pixel und der 3* 30 Pixel zugewiesen.

Für Maßwerte ist die Unterscheidung zwischen Groß- und Kleinschreibung nicht relevant.

6.7 Inhaltstypen (content type) (MIME types)

Anmerkung: Ein »Medientyp« (media type) (definiert in [RFC2045] und [RFC2046]) spezifiziert die Art der verlinkten Ressource. In Übereinstimmung mit dem allgemeinen Sprachgebrauch bevorzugt diese Spezifikation den Terminus »Inhaltstyp« (content type) gegenüber »Medientyp« (media type). Außerdem kann sich »Medientyp« in dieser Spezifikation auf das Medium beziehen, auf dem das Benutzerprogramm das Dokument darstellt.

Dieser Typ wird in der DTD durch %ContentType; dargestellt.

Inhaltstypen unterscheiden nicht zwischen Groß- und Kleinschreibung.

Beispiele für Inhaltstypen sind »text/html«, »image/png«, »image/gif«, »video/mpeg«, »text/css« und »audio/basic«. Die aktuelle Liste der registrierten MIME-Typen finden Sie unter [MIMETYPES].

6.8 Sprachcodes

Der Wert von Attributen vom Typ Sprachcode (language code) (in der DTD: %LanguageCode) weist auf einen Sprachcode, wie er durch [RFC1766] Abschnitt 2 spezifiziert wird, hin. Informationen zur Spezifizierung von Sprachcodes in HTML finden Sie im Abschnitt 8.1.1, »Sprachcodes«. Leerräume sind im Sprachcode nicht erlaubt.

Sprachcodes unterscheiden nicht zwischen Groß- und Kleinschreibung.

6.9 Zeichenkodierungen

Die »charset«-Attribute (in der DTD: %Charset) verweisen auf eine Zeichenkodierung wie in Abschnitt 5.2, »Zeichenkodierungen« beschrieben. Die Werte müssen Zeichenfolgen aus der IANA-Registrierung sein (z.B. »euc-jp«) (s. [CHARSETS] für eine komplette Liste).

Namen von Zeichenkodierungen unterscheiden nicht zwischen Groß- und Kleinschreibung.

Um die Zeichenkodierung einer externen Ressource zu bestimmen, müssen Benutzerprogramme die im Abschnitt 5.2.2, »Spezifizieren von Zeichenkodierungen« angeführten Schritte in der vorgegebenen Reihenfolge ausführen.

6.10 Einzelne Zeichen

Bestimmte Attribute verlangen nach einem einzelnen Zeichen aus dem Dokumentzeichensatz (siehe Abschnitt 5.1). Diese Attribute sind vom Typ %Character in der DTD.

Einzelne Zeichen können mit Hilfe von Zeichenreferenzen (z.B. »&amp;«) spezifiziert werden (siehe Abschnitt 5.3).

6.11 Datum und Zeit

[ISO8601] gestattet viele Optionen und Variationen in der Darstellung von Datum und Zeit. Die augenblickliche Spezifikation verwendet für ihre Definition gültiger Datum/Zeit-Zeichenfolgen (date/time strings) (in der DTD: %Datetime) eines der im Profil [DATETIME] beschriebenen Formate .

Das Format ist:

  YYYY-MM-DDThh:mm:ssTZD
mit:
     YYYY = vierstellige Angabe des Jahres
     MM   = zweistellige Monatsangabe (01=Januar usw.)
     DD   = zweistellige Angabe des Tags des Monats (01 bis 31)
     hh   = zweistellige Stundenangabe (00 bis 23) (am/pm sind nicht erlaubt)
     mm   = zweistellige Minutenangabe (00 bis 59)
     ss   = zweistellige Sekundenangabe (00 bis 59)
     TZD  = Zeitzonen-Kennzeichnung

Die Zeitzonen-Kennzeichnung ist eine von:

Z
weist auf UTC (Coordinated Universal Time) hin. Das »Z« muss groß geschrieben werden.
+hh:mm
weist darauf hin, dass es sich um eine lokale Zeit handelt, die hh Stunden und mm Minuten gegenüber UTC voraus ist.
-hh:mm
weist darauf hin, dass es sich um eine lokale Zeit handelt, die hh Stunden und mm Minuten gegenüber UTC zurück ist.

Exakt die hier gezeigten Komponenten mit exakt dieser Interpunktion müssen vorhanden sein. Beachten Sie, dass das »T« in der Zeichenfolge genau so vorkommen muss (es muss groß geschrieben werden), um den Beginn des Zeit-Elements wie in [ISO8601] spezifiziert anzuzeigen.

Wenn eine generierende Anwendung die Zeit nicht auf die Sekunde genau weiß, kann sie den Wert »00« für Sekunden benutzen (falls erforderlich analog für Minuten und Stunden).

Anmerkung: [DATETIME] geht nicht auf die Frage der Schaltsekunden ein.

6.12 Linktypen

Autoren können die nachfolgenden bekannten Linktypen verwenden -- hier aufgelistet mit ihrer üblichen Interpretation. In der DTD weist %LinkTypes auf eine durch Leerzeichen getrennte Liste von Linktypen. Leerraum-Zeichen (white space) sind innerhalb von Linktypen nicht erlaubt.

Diese Linktypen unterscheiden nicht zwischen Groß- und Kleinschreibung. Zum Beispiel hat »Alternate« dieselbe Bedeutung wie »alternate«.

Benutzerprogramme, Suchmaschinen usw. können diese Linktypen auf verschiedenste Art interpretieren. Zum Beispiel können Benutzerprogramme den Zugriff auf verlinkte Dokumente über eine Navigationsleiste anbieten.

Alternate
kennzeichnet Ersatzversionen des Dokuments, in dem der Link vorkommt. Wird es zusammen mit dem hreflang-Attribute verwendet, bedeutet dies, dass eine übersetzte Version des Dokuments vorliegt. Wird es zusammen mit dem media-Attribut verwendet, bedeutet dies, dass es sich um eine Version für ein anderes Medium handelt.
Stylesheet
verweist auf externes Stylesheet. Details lesen Sie in Abschnitt 14.3, »Externe Stylesheets«. Für durch den Benutzer wählbare Stylesheets wird es gemeinsam mit mit dem Linktyp »Alternate« eingesetzt.
Start
verweist auf das erste Dokument einer Kollektion von Dokumenten. Dieser Linktyp sagt Suchmaschinen, welches Dokument vom Autor als Startpunkt der Kollektion angesehen wird.
Next
verweist auf das nächste Dokument einer linearen Folge von Dokumenten. Benutzerprogramme können sich entschließen, das »nächste« Dokument vorzuladen, um die wahrgenommene Ladezeit zu reduzieren.
Prev
verweist auf das vorhergehende Dokument einer geordneten Folge von Dokumenten. Einige Benutzerprogramme unterstützen auch das Synonym »Previous«.
Contents
verweist auf ein Dokument, das als Inhaltsverzeichnis dient. Einige Benutzerprogramme unterstützen auch das Synonym ToC (von »Table of Contents«).
Index
verweist auf ein Dokument, das einen Index für das aktuelle Dokument anbietet.
Glossary
verweist auf ein Dokument, das ein Glossar zu Ausdrücken anbietet, die das aktuelle Dokument betreffen.
Copyright
verweist auf eine Copyright-Angabe des aktuellen Dokuments.
Chapter
verweist auf ein Dokument, das als Kapitel (chapter) in einer Kollektion von Dokumenten dient.
Section
verweist auf ein Dokument, das als Abschnitt in einer Kollektion von Dokumenten dient.
Subsection
verweist auf ein Dokument, das als Unterabschnitt in einer Kollektion von Dokumenten dient.
Appendix
verweist auf ein Dokument, das als Anhang in einer Kollektion von Dokumenten dient.
Help
verweist auf ein Dokument, das Hilfe anbietet (weitergehende Informationen, Links zu anderen Nachrichtenquellen usw.)
Bookmark
verweist auf ein Lesezeichen (bookmark). Ein Lesezeichen ist ein Link zu einem Schlüsseleintrittspunkt innerhalb eines ausgedehnten Dokuments. Das title-Attribut kann zum Beispiel dazu benutzt werden, das Lesezeichen zu beschriften. Beachten Sie, dass in jedem Dokument mehrere Lesezeichen definiert werden können.

Autoren könnten den Wunsch haben, zusätzliche Linktypen, die nicht in dieser Spezifikation beschrieben sind, zu definieren. Wenn dem so ist, sollten sie ein Profile benutzen (siehe Abschnitt 7), um die für die Definition des Linktyps verwendeten Konventionen anzuführen. Siehe profile-Attribut des HEAD-Elements für mehr Details.

Anmerkung der Übersetzer:

Die Verwendung eines Linktyps sieht in der Praxis zum Beispiel so aus:

<link rel="stylesheet" 
      type="text/css" 
      href="textseite.css" />

Hier wird eine CSS-Datei durch das link-Element im Kopf der HTML-Datei mit der HTML-Datei verknüpft.

Weitergehende Erörterungen zu Linktypen finden Sie im Abschnitt 12, »Links«.

6.13 Medien-Deskriptoren

Nachfolgend sind die anerkannten Medien-Deskriptoren (in der DTD: %MediaDesc) aufgelistet.

screen
ist bestimmt für nicht seitenorientierte Computer-Bildschirme.
tty
ist bestimmt für Medien, die ein äquidistantes Zeichenraster verwenden, wie Teleprinter, Terminals oder tragbare Geräte mit eingeschränkten Dartsellungsfähigkeiten.
tv
ist bestimmt für TV-ähnliche Geräte (geringe Auflösung, Farben, begrenzte Scroll-Möglichkeit).
projection
ist bestimmt für Projektoren.
handheld
ist bestimmt für Handheld-Geräte (kleiner Bildschirm, monochrom, Rastergrafiken, geringe Bandbreite).
print
ist bestimmt für seitenweises undurchsichtiges Material und für Dokumente, die am Bildschirm im Druckvorschau-Modus angesehen werden.
braille
ist bestimmt für Braille-Lesegeräte.
aural
ist bestimmt für Sprach-Synthesizer.
all
ist geeignet für alle Geräte.

Künftige HTML-Versionen können neue Werte einführen und parametrisierte Werte gestatten. Um die Einführung dieser Erweiterungen zu erleichtern, müssen konforme Benutzerprogramme in der Lage sein, den media-Attributwert folgendermaßen zu parsen:

  1. Der Wert ist eine durch Kommata getrennte Liste von Einträgen. Zum Beispiel wird
    media="screen, 3d-glasses, print and resolution > 90dpi"
    

    abgebildet auf:

    "screen"
    "3d-glasses"
    "print and resolution > 90dpi"
    
  2. Jeder Eintrag wird genau vor dem ersten Zeichen beschnitten, das weder ein US-ASCII-Zeichen [a-zA-Z] (ISO 10646 hex 41-5a, 61-7a), eine Ziffer [0-9] (hex 30-39) noch ein Bindestrich (hex 2d) ist. Im Beispiel ergibt dies:
    "screen"
    "3d-glasses"
    "print"
    
  3. Anschließend wird ( unter Beachtung von Groß- und Kleinschreibung) ein Vergleich mit dem Satz der oben definierten Medientypen durchgeführt. Benutzerprogramme können nicht passende Einträge ignorieren. Im Beispiel bleiben screen und print übrig.

Anmerkung: Stylesheets können medienunabhängige Variationen beinhalten (z.B. das CSS-@media-Konstrukt). In solchen Fällen kann es passend sein, »media=all« zu verwenden.

6.14 Skript-Daten

Skript-Daten (in der DTD: %Script;) können den Inhalt des SCRIPT-Elements oder den Wert innerer (intrinsic) Ereignisattribute (siehe Abschnitt 18) bilden. Benutzerprogramme dürfen Skript-Daten nicht als HTML-Auszeichnung auswerten, sondern müssen sie statt dessen an die Script-Engine weiterreichen.

Ob zwischen Groß- und Kleinschreibung unterschieden wird, hängt von Skript-Sprache ab.

Anmerkung der Übersetzer:

JavaScript unterscheidet zum Beispiel zwischen Groß- und Kleinschreibung, während VBScript das nicht tut. Das kleine Beispiel illustriert den Unterschied:

<SCRIPT type="text/javascript">
Nachricht = "World!";
nachricht = "Hello ";
alert(nachricht + Nachricht);
</SCRIPT>
<SCRIPT type="text/vbscript">
Nachricht = "World!"
nachricht = "Hello "
msgBox nachricht & Nachricht
</SCRIPT>

Das erste Skript (JavaScript) meldet sich mit »Hello World!«, weil »Nachricht« und »nachricht« zwei unterschiedliche Variablen bezeichen. Die Meldung des zweiten Skripts (VBScript) hingegen lautet »Hello Hello«, da nicht zwischen »Nachricht« und »nachricht« unterschieden wird.

Bite beachten Sie, dass Skript-Daten als Elementinhalt keine Zeichenreferenzen (siehe Abschnitt 5.3) enthalten können, Skript-Daten in Form von Attributwerten diese jedoch beinhalten dürfen. Der Anhang liefert weitere Informationen über die Spezifizierung von Nicht-HTML-Daten (siehe B.3.2).

Anmerkung der Übersetzer:

Im folgenden Beispiel wird der Benutzer bei Klick auf den Link mit »Grüß Gott« begrüßt werden, während die alert-Anweisung im SCRIPT-Element »Gr&uuml;ß Gott« unverändert, also mit unaufgelöstem Entity, wiedergibt

<SCRIPT type="text/javascript">
alert('Gr&uuml;ß Gott');
</SCRIPT>
<A href="http://edition-w3c.de" 
   onclick="alert('Gr&uuml;ß Gott')"
   >http://edition-w3c.de</A>

Zurzeit gängige Browser verhalten sich hier durchaus korrekt.

6.15 Stylesheet-Daten

Stylesheet-Daten (in der DTD: %StyleSheet;) können den Inhalt des STYLE-Elements oder den Wert des style-Attributs bilden. Benutzerprogramme dürfen Skript-Daten nicht als HTML-Auszeichnung auswerten.

Ob zwischen Groß- und Kleinschreibung unterschieden wird hängt von der Stylesheet-Sprache ab.

Bite beachten Sie, dass Stylesheet-Daten als Elementinhalt keine Zeichenreferenzen (siehe Abschnitt 5.3) enthalten können, Stylesheet-Daten in Form von Attributwerten diese jedoch beinhalten dürfen. Der Anhang liefert weitere Informationen über die Spezifizierung von Nicht-HTML-Daten (siehe B.3.2).

6.16 Namen von Ziel-Frames (target names)

Mit Ausnahme der weiter unten aufgelisteten reservierten Namen müssen Ziel-Frame-Namen (in der DTD: %FrameTarget;) mit einem alphabetischen Zeichen (a-zA-Z) beginnen. Benutzerprogramme sollten alle anderen Ziel-Namen ignorieren.

Die folgenden Ziel-Namen sind reserviert und haben besondere Bedeutungen.

_blank
Das Benutzerprogramm sollte das angegebene Dokument in ein neues unbenanntes Fenster laden.
_self
Das Benutzerprogramm sollte das Dokument in denselben Frame laden wie das Element, das auf dieses Ziel verweist.
_parent
Das Benutzerprogramm sollte das Dokument in das umgebende Eltern-FRAMESET (parent) des aktuellen Frames laden. Dieser Wert ist identisch mit _self, wenn es zum aktuellen Frame kein Eltern-Frameset gibt.
_top
Das Benutzerprogramm sollte das Dokument in das volle Original-Fenster laden (auf diese Art alle anderen Frames aufhebend). Dieser Wert ist identisch mit _self, wenn es zum aktuellen Frame kein Eltern-Frameset gibt.