Eingerichtet am 19.06.2002 Zuletzt geändert am 27.10.2003
Volkmar Kobelt | HEIM "Technik" |
Wer zum ersten Mal im Web surft (oder auch nicht ganz zum ersten Mal), wird sich vielleicht fragen, wie denn der Browser auf seine Darbietung auf dem Bildschirm kommt, wieso er sinnvoll auf Maus-Klicks reagiert, wie denn die Informationen zum Beispiel durch ein Modem und eine dünne Telefonleitung hin- und hergehen. Dies kann nicht alles in Kürze beantwortet werden, aber einen Schritt hinter die Darstellung auf dem Bildschirm können wir tun.
Es kann ja nicht so sein, dass für jedes Raster-Element (Pixel, Picture Element) auf dem Bildschirm aus der Gegenstelle im Netz eine Angabe kommt, wie hell und von welcher Farbe das sein soll. Das sieht man schon daran, dass man am Browser Schriftart und Schriftgröße für einen Text einstellen kann, sofern die Quelle das nicht eigenmächtig überspielt (dann ist es etwas schwieriger). Ebenso passt sich der Zeilen-Umbruch einer veränderten Fensterbreite an. Dies geht viel schneller als das Übertragen einer Web-Seite, weil es eben auf dem eigenen Rechner geschieht. Umgekehrt kann dann auch ein Mausklick nicht einfach zur Übertragung von Orts-Koordinaten, also Abständen von geeigneter linker und oberer Kante, des Maus-Zeigers über das Netz führen, da diese Koordinaten von der Darstellung auf dem eigenen Rechner abhängen.
Dann bleibt nichts übrig, als dass es eine abstraktere Darstellung der Daten im Rechner und für die Übertragung gibt, die nach Maßgabe von Browser- und Monitoreinstellungen zu dem Bild auf dem Schirm führt. Diese Darstellung ist ein Text in der Sprache HTML, Hypertext Markup Language. Hinzu kommen noch speziell codierte Darstellungen von Hör- und Sehbarem (Auditivem und Visuellem), auf die aus dem Text heraus verwiesen wird. Der Browser muss das dann alles verstehen und umsetzen, oder jedenfalls manches sinnvoll ignorieren können.
Dieser HTML-Text beschreibt in abstrakter Form das auf dem Bildschirm Darzustellende, steht dafür jeweils auf dem eigenen Rechner zur Verfügung, wird also so oder so selbst, mit einem Erscheinungsbild ähnlich dem eines einfachen Schreibmaschinentextes, vom Benutzer einzusehen sein. Dieser Text besteht also aus aneinander gereihten Zeichen aus einem beschränkten Vorrat (grob: Menge von Zeichen, wiederholt als Abbildung verwendbar, angeordnet z.B: Alphabet). Diese Zeichen sind ihrerseits im Speicher des Rechners und für die Übertragung geeignet codiert; was wir hier nicht weiter verfolgen wollen.
Ein Bedürfnis und eine technische Möglichkeit (das hängt wohl oft voneinander ab), textliche Elemente und die Art ihrer Darbietung voneinander getrennt anzugeben, war schon einige Zeit vor dem WWW (World Wide Web) aufgekommen. Textliche Elemente sind hier z. B. Absätze und Überschriften; dargeboten und unterschieden werden sie z. B. mit Hilfe von Zeilenumbrüchen, Abständen, Einrückungen, Schriftart und -größe. Dem Inhalt eines Manuskripts wurde so für den Druck immer schon ein Layout gemäß dem Stil eines Verlages, einer Schriftenreihe oder einer Zeitschrift beigegeben. Dabei waren die vom Autor verwendeten Kennzeichnungen für Absätze, Überschriften usw. von einem verständigen Menschen zu interpretieren.
Eine Automatisierung solcher Interpretation mit Hilfe des Computers gelingt dann aber besser mit Hilfe einer so genannten Auszeichnungssprache (Markup Language), mit der die genannten Elemente und z. B. Aufzählungen, Aufbau von Tabellen explizit gekennzeichnet und beschrieben werden, einschließlich natürlich des ursprünglichen Textes. Aus einem Text, der so vom Autor ausgezeichnet wurde, kann man dann mit einem Computerprogramm eine Druckvorlage mit diesem oder jenem Layout herstellen.
Ein Absatz des Inhalts Blablabla erschiene in der Web-Sprache HTML dann etwa als
<p>Blablabla</p>
Das p steht für (englisch) paragraph, Absatz; die Winkelklammern heben die Auszeichnung von dem darzubietenden Text ab, der Schrägstrich bedeutet das Ende des ausgezeichneten Elements.
Eine Überschrift 2. Ordnung sähe so aus (h für header):
<h2>Statt Überschrift</h2>
(Unter Umständen abgesehen von Feinheiten der Umlaut-Codierung.)
Der ursprüngliche Ansatz für dieses Auszeichnen von Text ist SGML, Standard Generalized Markup Language. Dort sind die Bedeutungen von Worten wie h2 und p noch nicht festgelegt. Und gewählt werden können Bedeutungen nicht nur für strukturelle Festlegungen (die zusammen mit einem Layout die Darbietung bestimmen), sondern auch inhaltsbezogene. Festgelegt ist eine Syntax. HTML ist dann eine Spezialisierung oder Anwendung von SGML.
Bei Lexikon-Artikeln ist man daran gewöhnt, dass zur Erklärung einer Sache Begriffe herangezogen werden, für deren Erklärung wiederum auf andere Artikel im Lexikon verwiesen wird. Dieses in die Automatisierungsmöglichkeiten eines Computers übertragen, ergibt einen Hypertext oder nichtlinearen Text: Ein Wort, eine Textstelle oder z. B. eine Grafik in der Darbietung auf dem Bildschirm ist hervorgehoben dargestellt. Dann weiß der Betrachter, dass sich dahinter ein Verweis auf eine andere Stelle im Dokument oder in einem anderen Dokument oder gar ein Dokument sonst wo auf der Welt verbirgt. Das er am einfachsten nach einem Mausklick auf die hervorgehobene Stelle dargeboten bekommt.
Ein Bedarf für ein solches Verfahren konkretisierte sich 1989 in der europäischen Kernforschungseinrichtung CERN. Dabei ging es um effizienten Nachrichtenaustausch zwischen Wissenschaftlern, die verschiedene Computer und Bildschirme mit entsprechend verschiedenen Darstellungsmöglichkeiten verwendeten. Da bot sich dann die Möglichkeit an, in einer Auszeichnungssprache Texte zu übertragen mit Kennzeichnung z. B. von Absätzen, aber ohne Festlegung von Zeilenlängen, da sowieso nicht vorherzusehen gewesen wäre, wie die Zeilen auf die Bildschirme verschiedener Breite passen würden.
In der hierfür geschaffenen (bereits erwähnten) Sprache HTML kann nun für Dokument-Elemente (z. B. ein Wort, ein Bild) als ein Attribut neben anderen ein Verweis wie oben beschrieben angegeben werden, in Form einer (eines) URL, Uniform Resource Locator. Dann würde ein solches Element auf einen Mausklick entsprechend reagieren, d. h., der Browser holt das bezogene Dokument (eine Web-Seite) und bietet es dar. Die URL einer Web-Seite (es gibt noch andere URL-Typen) beginnt mit einem http://, wie man sie als Browser-Benutzer ja auch schon gesehen oder selbst eingegeben hat. Dann folgt eine Adresse (oder ein Name) im Netz und auf einem Rechner, die ein Dokument irgendwo in der Welt eindeutig identifiziert. HTTP ist das Hypertext Transfer Protocol, mit dem also Web-Seiten übertragen werden. Ein Protokoll ist dabei, ähnlich wie in der Diplomatie, ein Satz von Regeln zum Verkehr zwischen Instanzen. Etwa Rechner A und B.; nach Herstellung einer Verbindung: A: Schicke mir Dokument sowieso. B: Schickt. Fertig. A: Angekommen, danke. Mit Vorkehrungen für den Fall des Misslingens.
Was da übertragen wird, ist also z. B. ein Dokument mit einem HTML-Text, der abhängig von Browser-Programm und Monitor zu verschiedenen Darstellungen auf dem Bildschirm führen kann. Die Gesamtheit solcher Dokumente bildet vermöge der eingebetteten Verweise eine Art globalen Hypertext.
Der Browser steht dann zu den Programmen, die auf gespeicherte HTML-Dokumente zugreifen können und sie auf Anforderung versenden, im Verhältnis eines Client (der einen Dienst in Anspruch nimmt) zu einem Server (der den Dienst leistet).
Das Erscheinungsbild der meisten Web-Seiten auf gängigen PC-Monitoren steht etwas im Gegensatz zum ursprünglichen Motiv der HTML-Entwicklung. Man sieht eine grafische Gestaltung, gar mit bewegten Bildern (Animationen), mit aufeinander abgestimmten Abmessungen von Teil-Gestaltungen. Dies erfordert einerseits dafür geeignete Browser-Programme und Bildschirme. Andrererseits wurden der Sprache HTML in etwas unsystematischer Weise Ausdrucksmöglichkeiten hinzugefügt. Zum Beispiel kann man einem Absatz (oder sonstigen Text-Element) als Attribut eine Schriftart oder -größe zuweisen. Das zuständige Standardisierungs-Gremium hat in jüngerer Zeit gegengesteuert und Ausdrucksmöglichkeiten für eine sauberere Trennung von Struktur- und Darbietungs-Vorgaben geschaffen; die Browser müssen aber für die neuen Codierungsmöglichkeiten jeweils immer wieder überarbeitet werden.
Die Probleme verschiedener Darbietung in verschiedenen Umgebungen werden schon bei der Codierung eines einfachen Bildes deutlich. Sie besteht in einem Verweis aus einem HTML-Text auf eine Bild-Datei, die per HTTP auch vom Server zum Client zu übertragen ist. In der Bild-Datei ist ein Rechteck aus Pixeln codiert. Das erscheint entsprechend pixelweise auf dem Bildschirm, also bei verschiedenen Pixel-Abständen (verschiedener "Auflösung" auf dem Bildschirm) entsprechend verschieden groß; obwohl der Browser die Schriftgröße des benachbarten Textes möglicherweise der Auflösung angepasst hat.
Auf Seiten des Servers können Programme z. B. Daten mit einer Datenbank austauschen und HTML-Dokumente automatisch erzeugen, um sie dem Client zu schicken gemäß dem aktuellen Bedarf des Benutzers.
(HTML selbst ist keine Programmiersprache.)
Raffinierte Programme ermöglichen einem Autor ein bequemeres Grafik-Design und nehmen ihm dabei auch noch das HTML-Codieren ab.
Eine Page im Web ist auf Deutsch eine Seite. Mehrere Seiten, die unter einer Domäne (domain, z.B. boris.de) von deren Eigentümer auf einem Server bereitgestellt sind, bilden eine Site, also eine Stelle, auch als Web-Auftritt bezeichnet.
Zur Abrundung sei noch XML erwähnt, die Extensible Markup Language. Sie ist ein modifiziertes: vereinfachtes SGML mit strengerer Syntax. Also auch wieder eine Art verallgemeinerter Auszeichnungssprache, mit der man speziellere definieren kann, so wie HTML mit SGML definiert wurde. Für XML-basierte Sprachen können dann aber leichter Browser konstruiert (d. h. programmiert) werden, um in solchen Sprachen geschriebene Texte (zwecks Darbietung) zu interpretieren. Auf der anderen Seite erlaubt die Syntax von XML ein natürliches Abbilden zwischen Strukturen von Datenbanken und XML-Basiertem; also Transport und Darbietung dort enthaltener Daten mit XML.
tmp@volkmar-kobelt.de | Zum Seitenanfang | HEIM "Technik" |