edition W3C.de

HTML 4.01-Spezifikation

Deutsche Übersetzung

Diese Version:
http://www.edition-w3.de/TR/1999/REC-html401-19991224
Aktuelle Version:
http://www.edition-w3c.de/TR/html4
Übersetzer:
Christine Kühnel (Übersetzung, fachliche Kommentierung) <kuehnel@screenexa.net>
Stefan Mintert (Fachlektorat und fachliche Kommentierung) <www.mintert.com/stefan/mail/>
Stefan Schumacher (Übersetzung, fachliche Kommentierung) <sts@schumacher-netz.de>

Bei diesem Dokument handelt es sich um eine Übersetzung eines W3C-Textes. Dieser Text ist urheberrechtlich geschützt; bitte beachten Sie die nachfolgenden Hinweise des Originaldokuments. Die Rechte an der Übersetzung liegen bei den Übersetzern und dem Verlag Addison-Wesley. Die Übersetzung hat keine durch das W3C legitimierte, normative Wirkung. Das einzige maßgebliche Dokument ist das englische Original.

Bitte senden Sie Fehler und Korrekturen zur deutschen Fassung an die Übersetzer.

Kommentare der Übersetzer, die als solche gekennzeichnet sind, unterliegen dem Urheberrecht der Übersetzer. Sie sind nicht Bestandteil des Ursprungsdokuments.

Diese Veröffentlichung ist eine Vorveröffentlichung. Kein Teil dieses Textes darf kopiert werden. Alle Rechte vorbehalten. Nach Abschluss der Arbeit wird das endgültige Dokument unter der oben angegebenen Adresse veröffentlicht. Die jetzige Veröffentlichung während der laufenden Arbeit dient zur Information von Interessierten und zur Prüfung durch die Fachöffentlichkeit. Sollten Sie Fehler finden oder Verbesserungsvorschläge haben, schicken Sie diese bitte per Mail an die Übersetzer.
Folgende Teile liegen noch in Englisch vor und müssen noch in deutscher Fassung generiert werden: (a) Gesamtinhaltsverzeichnis (b) Index


2 Einführung in HTML 4

Inhaltsverzeichnis

2.1 Was ist das World Wide Web?

Das World Wide Web (Web) ist ein Netzwerk von Informationsquellen. Um diese Ressourcen dem größtmöglichen Publikum problemlos verfügbar zu machen, stützt sich das Web auf drei Mechanismen:

  1. Ein einheitliches Namensschema zum Lokalisieren von Ressourcen im Web (z.B. URIs)
  2. Protokolle für den Zugriff auf benannte Ressourcen über das Web (z.B. HTTP)
  3. Hypertext zur einfachen Navigation zwischen den Ressourcen (z.B. HTML)

Die Zusammenhänge zwischen den drei Mechanismen sind in der gesamten Spezifikation erkennbar.

2.1.1 Einführung in URIs

Jede im Netz verfügbare Ressource – HTML-Dokument, Grafik, Videoclip, Programm und so weiter – hat eine Adresse, die in Form eines Universal Resource Identifier oder »URI« kodiert werden kann.

URIs bestehen üblicherweise aus drei Teilen:

  1. Dem Namensschema des für den Zugriff auf die Ressource verwendeten Mechanismus
  2. Dem Namen des Rechners, auf dem sich die Ressource befindet
  3. Dem Namen der Ressource selbst, angegeben als Pfad

Nehmen wir den URI, der die »Technical Reports« des W3C kennzeichnet:

   http://www.w3.org/TR

Dieser URI kann folgendermaßen gelesen werden: Es gibt ein via HTTP-Protokoll verfügbares Dokument (s. [RFC2616]), das sich auf dem Rechner www.w3.org befindet und über den Pfad »/TR« erreichbar ist. Andere Schemata, die Ihnen in HTML-Dokumenten begegnen können, enthalten »mailto« für Email und »ftp« für FTP.

Anmerkung der Übersetzer:

In gewissem Sinne ist dies kein so gutes Beispiel. Zwar liefert der Web-Browser bei Eingabe von http://www.w3.org/TR die gewünschte Seite; wer aber genau hinsieht, stellt fest, dass die Adresse nach dem Laden anders lautet: http://www.w3.org/TR/. Der Schrägstrich am Ende rührt daher, dass der Server bei Zugriff auf /TR eine Umlenkung auslöst. Das heißt, der Browser wird angwiesen, es doch noch einmal an anderer Stelle zu probieren, in diesem Fall /TR/.

Auf Protokollebene sieht das so aus: Zuerst der Zugriff auf /TR:

HEAD /TR HTTP/1.0

HTTP/1.1 301 Moved Permanently
Date: Fri, 29 Nov 2002 18:11:17 GMT
Server: Apache/1.3.26 (Unix) PHP/3.0.18
Location: http://www.w3.org/TR/
Connection: close
Content-Type: text/html; charset=iso-8859-1

Zu erkennen ist die Antwort »301 Moved Permanently« und die neue Adresse »Location: http://www.w3.org/TR/«. Nun zum Vergleich der Zugriff auf /TR/:

HEAD /TR/ HTTP/1.0

HTTP/1.1 200 OK
Date: Fri, 29 Nov 2002 18:11:37 GMT
Server: Apache/1.3.26 (Unix) PHP/3.0.18
P3P: policyref="http://www.w3.org/2001/05/P3P/p3p.xml"
Cache-Control: max-age=600
Expires: Fri, 29 Nov 2002 18:21:37 GMT
Last-Modified: Sat, 16 Nov 2002 15:56:59 GMT
ETag: "3dd66acb"
Accept-Ranges: bytes
Content-Length: 102136
Connection: close
Content-Type: text/html; charset=iso-8859-1

Hier die Antwort »200 OK«. Im ersten Fall werden also zwei HTTP-Anfragen benötigt. In einer Situation wie dieser sollte der Schrägstrich nicht leichtfertig weggelassen werden. Andernfalls entsteht unnötiger Netzverkehr.

Hier ist ein weiteres Beispiel für einen URI. Dieser weist auf die Mailbox eines Benutzers:

   ...dies ist Text...
   Anregungen und Meinungen senden Sie bitte an 
   <A href="mailto:joe@someplace.com">Joe Cool</A>.

Anmerkung der Übersetzer:

An dieser Stelle sei darauf aufmerksam gemacht, dass ein Link, der auf ein anderes Protokoll als »http« verweist, bei seiner Aktivierung in aller Regel auch ein anderes Benutzerprogramm als den Web-Browser erfordert; in diesem Fall wäre das ein Mail-Client. Man sollte also nicht davon ausgehen, dass die Aktivierung des Links bei jedem Benutzer zum gewünschten Ergebnis führen muss.

Anmerkung: Den meisten Lesern wird der Begriff »URL« geläufig sein, nicht aber der Begriff »URI«. URLs bilden eine Teilmenge des umfassenderen URI-Namensschemas.

2.1.2 Fragmentbezeichner (fragment identifiers)

Einige URIs weisen auf ein Stelle innerhalb einer Ressource. Diese Art von URIs endet mit »#«, gefolgt von Bezeichner für einen Anker (genannt Fragmentbezeichner). Zum Beispiel zeigt dieser URI auf einen Anker namens section_2:

http://somesite.com/html/top.html#section_2

2.1.3 Relative URIs

Ein relativer URI enthält keinerlei Namensschemainformationen. Sein Pfad weist im Allgemeinen auf eine Ressource auf demselben Rechner wie das aktuelle Dokument. Relative URIs können relative Pfadkomponenten (z.B. meint »..« die nächsthöhere Ebene in der durch den Pfad festgelegten Hierarchie) und auch Fragementbezeichner enthalten.

Relative URIs werden unter Verwendung eines Basis-URIs zu vollständigen URIs aufgelöst. Als Beispiel für die Auflösung relativer URIs nehmen wir an, wir hätten den Basis-URI »http://www.acme.com/support/intro.html«. Der relative URI in folgender Auszeichnung eines Hypertext-Links

   <A href="suppliers.html">Suppliers</A>

würde erweitert zum vollständigen URI »http://www.acme.com/support/suppliers.html«, während der relative URI in der folgenden Auszeichnung für ein Bild

   <IMG src="../icons/logo.gif" alt="logo">

aufgelöst würde zum vollständigen URI »http://www.acme.com/icons/logo.gif«.

In HTML werden URIs verwendet, um

Mehr zu URIs lesen Sie bitte im Abschnitt 6.4, »URIs«.

2.2 Was ist HTML?

Um Informationen zur globalen Verbreitung zu publizieren, braucht man eine universell verständliche Sprache, eine Art Muttersprache der Publikation, die möglichst alle Computer verstehen können. Die vom World Wide Web benutze Publikationssprache ist HTML (HyperText Markup Language).

HTML gibt Autoren die Mittel an die Hand, um

2.2.1 Ein kurzer Abriss der Geschichte von HTML

HTML wurde ursprünglich von Tim Berners-Lee während seiner CERN-Zeit entwickelt und durch den von NCSA geschaffenen Mosaic-Browser populär gemacht. Mit dem explosiven Wachstum des Web erblühte es während der Neunzigerjahre. In dieser Zeit wurde HTML auf mehrere Arten erweitert. Das Web ist darauf angewiesen, dass Autoren von Webseiten und Produkthersteller dieselben Konventionen für HTML einhalten. Das hat zur gemeinsamen Arbeit an Spezifikationen für HTML angeregt.

HTML 2.0 (November 1995, s. [RFC1866]) wurde unter der Leitung der Internet Engineering Task Force (IETF) entwickelt, um die Ende 1994 gängige Praxis zu formalisieren. HTML+ (1993) und HTML 3.0 (1995, s. [HTML30]) schlugen reichhaltigere Versionen von HTML vor. Obwohl in den Diskussionen der Standards nie ein Konsens erreicht wurde, führten diese Entwürfe zur Übernahme einer Auswahl von neuen Features. Die Bemühungen der HTML Working Group des World Wide Web Consortiums to codify common practice in 1996 endeten mit HTML 3.2 (January 1997, s. [HTML32]). Änderungen gegenüber HTML 3.2 sind in Anhang A zusammengestellt.

Die Mehrheit ist sich darin einig, dass HTML-Dokumente über verschiedene Browser und Plattformen hinweg funktionieren sollten. Wird diese Interoperabilität erreicht, reduzieren sich die Kosten der Content-Provider, denn sie müssen nur eine Version eines Dokuments erarbeiten. Wird diese Anstrengung nicht unternommen, besteht eine wesentlich größere Gefahr, dass das Web auf eine proprietäre Welt inkompatibler Formate zugeht und sich letzten Endes das kommerzielle Potenzial des Web für alle Beteiligten verringert.

Jede Version von HTML hat versucht, den wachsenden Konsens unter den Industrievertretern widerzuspiegeln, so dass die Investitionen der Inhaltsanbieter nicht verschwendet und ihre Dokumente nicht in kurzer Zeit unlesbar werden.

HTML wurde mit der Vision entwickelt, dass alle Arten von Geräten in der Lage sein sollten, Informationen aus dem Web zu nutzen: PCs mit grafischen Displays unterschiedlichster Auflösung und Farbtiefe, Funktelefone, Handhelds, Geräte mit Sprachein- und -ausgabe, Geräte mit großer und kleiner Bandbreite usw.

2.3 HTML 4

HTML 4 erweitert HTML um Mechanismen für Stylesheets, Scripting, Frames, eingebundene Objekte, verbesserte Unterstützung für von rechts nach links zu lesende Texte sowie Texte mit unterschiedlichen Leserichtungen, reichhaltigere Tabellen und für Menschen mit Behinderungen bessere Zugänglichkeit bietende Erweiterungen bei Formularen.

HTML 4.01 ist eine Überarbeitung von HTML 4.0, in der Fehler korrigiert und einige Änderungen seit der vorhergehenden Überarbeitung vorgenommen wurden.

2.3.1 Internationalisierung

Diese HTML-Version wurde mit Hilfe von Experten auf dem Gebiet der Internationalisierung gestaltet, so dass Dokumente in jeder Sprache geschrieben und problemlos um die Welt transportiert werden können. Erreicht wurde das durch die Einbeziehung von [RFC2070], der sich mit der Internationalisierung von HTML befasst.

Ein bedeutender Schritt war die Aufnahme des Standards ISO/IEC:10646 (siehe [ISO10646]) als Dokument-Zeichensatz für HTML. Dies ist der weltweit umfassendste Standard zu Fragen der Darstellung internationaler Zeichen, Leserichtung, Zeichensetzung und anderer Themen bezüglich der Sprachen der Welt.

HTML bietet jetzt weitreichendere Unterstützung für verschiedene menschliche Sprachen innerhalb eines Dokuments. Dies ermöglicht die effektivere Indizierung von Dokumenten durch Suchmaschinen, qualitativ bessere Typographie, eine bessere Text-nach-Sprache-Konvertierung, bessere Silbentrennung usw.

Anmerkung der Übersetzer:

Mit Fragen der Internationalisierung beschäftigt sich eine eigene Activity, die »W3C Internationalization Activity«, die es sich zur Aufgabe gemacht hat, die Nutzbarkeit von Formaten und Protokollen des W3C weltweit in allen Sprachen sicherzustellen.

Näheres dazu finden Sie auf der zugehörigen Web-Site unter http://www.w3.org/International/.

2.3.2 Zugänglichkeit

Da die Web-Community wächst und ihre Mitglieder sich in ihren Fähigkeiten und ihrem Können voneinander unterscheiden, ist es entscheidend, dass die zugrunde liegenden Technologien an deren spezifische Bedürfnisse angepasst sind. HTML wurde darauf ausgelegt, Webseiten für Menschen mit physischen Einschränkungen besser zugänglich zu machen. Folgende HTML 4-Entwicklungen sind durch die wachsende Bedeutung der Zugänglichkeit angeregt worden:

Autoren, die die Aspekte der Zugänglichkeit nicht aus den Augen verlieren während sie Seiten gestalten, werden nicht nur den Segen der Accessibility-Gemeinschaft empfangen, sie werden auch in anderer Form Nutzen daraus ziehen: wohlgestaltete HTML-Dokumente, die Struktur und Präsentation trennen, werden sich leichter an neue Technologien anpassen.

Anmerkung: Für mehr Informationen über die Gestaltung zugänglicher HTML-Dokumente lesen Sie bitte [WAI].

2.3.3 Tabellen

Das neue Tabellen-Modell in HTML basiert auf [RFC1942]. Autoren haben jetzt größere Kontrolle über Struktur und Layout (z.B. Spaltengruppen). Dass Designer in der Lage sind, Spaltenbreiten zu empfehlen, erlaubt es Benutzerprogrammen, Tabellendaten inkrementell (so, wie sie eintreffen) anzuzeigen, ohne auf die vollständige Tabelle warten zu müssen bevor sie sie darstellen.

Anmerkung: Einige Autorenwerkzeuge stützen sich für Formatierungen beim Schreiben sehr stark auf Tabellen; das kann leicht zu Problemen bzgl. der Zugänglichkeit führen.

2.3.4 Zusammengesetzte Dokumente (compound documents)

HTML bietet jetzt einen Standard-Mechanismus zum Einbinden beliebiger Medienobjekte und Anwendungen in HTML-Dokumente. Das OBJECT-Element unterstützt (zusammen mit seinen spezifischeren Vorfahren IMG und APPLET) einen Mechanismus zum Einbinden von Bild-, Video-, Sound-, mathematischen, besonders spezialisierten Anwendungen und anderen Objekten in ein Dokument. Es gestattet Autoren auch, für Benutzerprogramme, die eine bestimmte Darstellung nicht unterstützen, eine Hierarchie alternativer Darstellungen vorzugeben.

2.3.5 Stylesheets

Stylesheets vereinfachen das HTML-Markup und entlasten HTML erheblich von der Verantwortung für die Präsentation. Sie geben sowohl Autoren als auch Nutzern Kontrolle über die Präsentation von Dokumenten – über Schriftarten, Ausrichtungen, Farben usw.

Style-Informationen können für einzelne Elemente oder Gruppen von Elementen angegeben werden. Style-Informationen können innerhalb eines HTML-Dokuments oder in externen Stylesheets angegeben werden.

Der Mechanismus der Zuordnung eines Stylesheets zu einem Dokument ist unabhängig von der Stylesheet-Sprache.

Vor dem Erscheinen der Stylesheets hatten Autoren eingeschränkte Kontrolle über die Darstellung. HTML 3.2 beinhaltete eine Anzahl von Attributen und Elementen, die Kontrolle über Ausrichtung, Schriftgröße und Textfarbe anboten. Die Autoren nutzten darüber hinaus Tabellen und Graphiken als Layout-Hilfsmittel. Es wird eine verhältnismäßig lange Zeit dauern, bis die Benutzer ihre Browser ersetzt haben, d.h., diese Features werden noch für einge Zeit Verwendung finden. Wie dem auch sei, da Stylesheets mächtigere Präsentations-Mechanismen bieten, wird das World Wide Web Consortium letzten Endes viele der HTML-Präsentationselemente und -attribute nach und nach zurückziehen. In der gesamten Spezifikation sind die gefährdeten Elemente und Attribute als »missbilligt« (siehe Abschnitt 4) gekennzeichnet. Sie werden begleitet von Beispielen, die zeigen, wie derselbe Effekt mit anderen Elementen oder Stylesheets zu erreichen ist.

2.3.6 Scripting

Mit Hilfe von Skripten können Autoren dynamische Webseiten gestalten (z.B. »Intelligente Formulare« (»Smart Forms«), die reagieren, wenn Benutzer sie ausfüllen) und HTML als Werkzeug verwenden, um Netz-Applikationen zu bauen.

Anmerkung der Übersetzer:

»Intelligent« sind Formulare dann, wenn sie bereits beim Ausfüllen auf Eingaben des Benutzers reagieren, z.B. Werte auf Zulässigkeit hin prüfen, Formularfelder in Abhängikeit von in anderen Feldern eingetragenen Werten vorbelegen usw. Da das bereits auf dem Client passiert, werden Formulare deutlich benutzerfreundlicher. Als Autor sollte man aber stets daran denken, dass zwingend notwendige Prüfungen eingegebener Werte nicht ausschließlich durch clientseitige Skripte erfolgen sollten. Ein Formular soll auch dann benutzbar sein, wenn Scripting nicht zur Verfügung steht, sei es, weil der Browser Scripting generell oder für die gewählte Skriptsprache nicht unterstützt, sei es, weil der Benutzer Scripting deaktiviert hat.

Die zum Einbinden von Skripten angebotenen Mechanismen sind unabhängig von der Skriptsprache.

2.3.7 Drucken

Manchmal werden Autoren wünschen, es Benutzern leicht zu machen, mehr als nur das aktuelle Dokument zu drucken. Wenn Dokumente Teil einer größeren Arbeit sind, kann der Zusammenhang zwischen ihnen durch das HTML-LINK-Element oder mit Hilfe des »Resource Description Framework (RDF)« (s. [RDF10]) vom W3C beschrieben werden.

2.4 Dokumente erstellen mit HTML 4

Wir empfehlen, dass Autoren und Entwickler die folgenden allgemeinen Regeln beachten, wenn sie mit HTML 4 arbeiten.

2.4.1 Trennen von Struktur und Präsentation

HTML hat seine Wurzeln in SGML, das stets eine Sprache zur Spezifikation strukturierter Auszeichnungen war. So wie sich HTML entwickelt, werden mehr und mehr seiner Präsentationselemente und -attribute durch andere Mechanismen ersetzt werden, insbesondere durch Stylesheets. Die Entwicklung hat gezeigt, dass die Trennung der Struktur eines Dokuments von seinen Präsentationsaspekten die Kosten für die Bedienung eines breiten Spektrums von Plattformen, Medien usw. reduziert und die Überarbeitung von Dokumenten erleichtert.

2.4.2 Allgemeine Zugänglichkeit zum Web beachten

Um das Web zugänglicher für jedermann zu machen, insbesondere für jene Personen mit Behinderungen, sollten Autoren darüber nachdenken, wie ihre Dokumente auf verschiedenen Plattformen dargestellt werden könnten wie z.B. durch sprachbasierte Browser, Braille-Leser usw. Wir fordern nicht etwa dazu auf, dass Autoren ihre Kreativität einschränken, sondern lediglich, dass sie alternative Darstellungen in ihrem Design bedenken. HTML bietet eine Anzahl von Mechanismen dafür (z.B. das alt-Attribut, das accesskey-Attribut usw.)

Darüber hinaus sollten Autoren bedenken, dass ihre Dokumente ein weit entferntes Publikum mit anderen Computer-Konfigurationen erreichen könnten. Damit Dokumente korrekt interpretiert werden, sollten Autoren in ihre Dokumente Informationen über die natürliche Sprache und die Leserichtung des Textes aufnehmen, darüber, wie das Dokument kodiert ist, und über andere Aspekte, die im Zusammenhang mit der Internationalisierung stehen.

2.4.3 Benutzerprogrammen bei inkrementeller Darstellung helfen

Durch sorgfältige Gestaltung ihrer Tabellen und Einsatz der neuen Tabellen-Features von HTML 4 können Autoren Benutzerprogrammen helfen, Dokumente schneller darzustellen. Autoren können lernen, wie man Tabellen für inkrementelle Darstellung gestaltet (siehe TABLE-Element). Entwickler sollten die »Anmerkungen zu Tabellen« im Anhang B konsultieren, um an Informationen zum inkrementellen Algorithmus zu kommen.