Publizieren im Web

Einführung

Das World Wide Web (WWW)

WWW ist ein verteilter, Hypertext-basierter Informationsdienst im Internet. Ursprünglich enwickelt im CERN in Genf um 1990, hat er eine rasante Verbreitung erfahren. Heute bieten weltweit Universitäten, Firmen, Verlage, Institutionen und Privatpersonen Informationen im World Wide Web an. In den zahlreichen Presseveröffentlichungen zum Thema Information-Highways bzw. Datenautobahnen geht es - wenn es konkret wird - um WWW, das dann oft mit dem Internet gleichgesetzt wird.

Einige Gründe für den immensen Erfolg von WWW:

Technischer Hintergrund

Client und Server beim WWW

[Veranschaulichung der Client-Server-Beziehung bei WWW]

Exkurs: Client und Server unter Verwendung eines Proxy-Servers

Ein Proxy-Server erledigt im Auftrag von Clients die Verbindungen mit den Original-Servern und liefert deren Resultate zurück. Im World Wide Web spricht der Client mit dem Proxy-Server HTTP, der Proxy (als Client!) u.U. auch andere Protokolle wie Gopher und FTP.

[Vernaschaulichung des Proxy-Servers]

Anwendungszwecke eines Proxy:

Hypertext - Hypermedia

Hypertext
Text, der Verweise auf andere Texte enthält, die - mit einer geeigneten graphischen Benutzeroberfläche präsentiert - durch z.B. einfaches Anklicken eines hervorgehobenen Textteils angewählt werden können.
Beispiele: Microsoft-Hilfe, Apple's Hypercard.
Hypermedia
Multimediale Dokumente (Bilder, Sound, Animationen etc.) mit Verweisen auf andere.
Anker (anchor)/Hyperlinks
Verweise (links) auf andere Dokumente; bei WWW können Nicht-Text-Dokumente nur Ziel von Ankern sein.

Hypertext Transport Protocol (HTTP)

Den Protokollablauf kann man per Telnet ausprobieren.

HTTP ist im Grunde ein reines File-Server-Protokoll unabhängig von der speziellen Anwendung im WWW; insbesondere sind die Beziehungen zwischen den von einem Server bereitgestellten Dokumenten und allgemein die Anker im Protokoll nicht sichtbar.

Ausblick: Neuere Entwicklungen beim HTTP-Protokoll

HTTP/1.1
Erweiterung bei den Methoden, den Header-Zeilen und dem Content-Transfer-Encoding; spezielle Vorkehrungen und Klarstellungen bezüglich der Verwendung des Protokolls bei Proxy-Caching-Servern; Verbindung kann gehalten werden für weitere Übertragungen.
HTTP-NG
HTTP Next Generation - ermöglicht u.a. parallele Übertragung mehrerer Dokumente in einer TCP-Verbindung, nicht mehr wie bisher: eigene TCP-Verbindung für jedes Inline-Image in einem Dokument.

Uniform Resource Locator (URL)

Die Adressierung von Dokumenten und die Verweise zwischen Dokumenten im WWW werden über die sogenannten Uniform Resource Locator (URL) realisiert.

Vollständige URLs bestehen aus der Angabe des

  • Protokolls, z.B. http, gopher, ftp,
  • Trennzeichen :,
  • Hostnamen des Servers, eingeleitet durch doppelte Slashs //,
  • bei Bedarf gefolgt von :Port,
  • Pfadangabe und/oder Dateiname.
  • Partiellen URLs fehlen Bestandteile von links her, die der Client von den Angaben des aktuellen Dokumentes ergänzt. Z.B. wird im Kontext von http://www.uni-duesseldorf.de/~cappel/WebKurs/Einfuehrung.html Welcome.html ergänzt zu http://www.uni-duesseldorf.de/~cappel/WebKurs/Welcome.html.

    Beispiele für URLs:

  • http://www.uni-duesseldorf.de/WWW/URZ/RZ/Sose95termine.html
  • gopher://gopher.rz.uni-duesseldorf.de/1
  • ftp://ftp.uni-duesseldorf.de/pub/doc/rfc/RFC800-899/rfc822.txt
  • telnet://opac.ub.uni-duesseldorf.de
  • news:hhu.forum
  • news:kottwitz.58.00064A34@uni-duesseldorf.de
  • mailto:cappel@rz.uni-duesseldorf.de
  • MIME-Typen von WWW-Dokumenten

    Für die Beschreibung der Typen seiner Dokumente benutzt WWW einen etablierten Internet-Standard: MIME - Multipurpose Internet Mail Extensions. MIME-Typen werden angegeben in der Form: type/subtype, so z.B. zu finden als Wert hinter dem Header-Feld Content-Type:.

    Beispiele für häufig vorkommende MIME-Typen:

    text/plain
    Einfacher ASCII-Text.
    text/html
    Das WWW-eigene Format.
    image/gif, image/jpeg, image/pict
    Bilder im GIF-, JPEG- bzw. PICT-Format.
    video/mpeg, video/quicktime
    Video-Sequenzen im MPEG- bzw. Quicktime-Format.
    audio/basic, audio/x-wav, audio/aiff, audio/x-mpeg
    Diverse Audio-Formate für Sound-Dateien unterschiedlicher Qualität (Telefon- bis CD-Qualität).
    application/postscript
    Postscript-Dateien.
    application/x-rtf
    Rich Text Format von Word und anderen Textverarbeitungsprogrammen.
    application/x-dvi
    DVI-Files von TeX.

    Hypertext Markup Language (HTML)

    Die Hypertext Markup Language (HTML) ist die WWW-eigene Dokumentensprache, definiert als spezielle Ausprägung der Structured Generalized Markup Language (SGML). HTML enthält Sprachmittel zur logischen Strukturierung von Dokumenten ähnlich wie LaTeX und Sprachmittel für die Angabe von Ankern, den Hyperlinks auf andere Dokumente, sowie für die Einbettung von Bildern (Inline-Images).

    HTML gibt eine logische Strukturierung von Dokumenten vor; die Umsetzung in ein konkretes Layout ist Sache der WWW-Browser und kann mit unterschiedlicher Software und in unterschiedlicher Umgebung gänzlich anders aussehen.

    (Näheres folgt später.)

    HTTP-Server-Software

    CERN-httpd
    Mächtiger Server mit u.a. vielfachen Abbildungsregeln von Pfaden in URLs auf reale Dateinamen, individuellem Zugriffsschutz auf Dokumente, Skript-Fähigkeit über das Common Gateway Inerface (CGI); verfügbar als Source-Code für diverse Unix-Systeme und VMS. Spezielle Eigenschaft: Kann als Proxy- und Caching-Server eingesetzt werden wie bei uns.
    NCSA-httpd
    Mächtiger Server mit u.a. vielfachen Abbildungsregeln von Pfaden in URLs auf reale Dateinamen, individuellem Zugriffsschutz auf Dokumente, Skript-Fähigkeit über das Common Gateway Inerface (CGI); verfügbar als Source-Code für diverse Unix-Systeme.
    Apache
    Freie Weiterentwicklung des NCSA-Servers, mittlerweile die Nummer 1 im Einsatz. Unter dem Namen Appache-SSL gibt es eine Version mit dem gesicherten Protokoll HTTPS (die einzige frei und ohne Exportrestriktionen erhältliche).
    Netsite
    Die kommerziellen Server von Netscape: Netscape Communications Server, Netscape Commerce Server und Netscape Proxy Server.
    Information über weitere Server-Software finden Sie im Original-Dokument.

    Einen Test der Web-Server für Unix enthält Heft 11/95 der Zeitschrift iX.
    Web Servers Feature Chart

    WWW-Client-Software

    Vollständige Übersicht siehe hier.

    Die goldene Regel, die ich gelernt habe, für alle, die Dokumente für WWW (in HTML) erstellen: Sehen Sie sich Ihre Dokumente nicht nur mit einem Browser an! Optimieren Sie sie nicht z.B. für z.B. Netscape, u.U. noch mit einer bestimmten Fenster- und Font-Größe! Testen Sie mit so vielen verschiedenen Browsern, wie Ihnen zur Vefügung stehen, und auch mit mindestens einem Linemode-Browser wie Lynx!
    (Dies ist der Grund, warum dieser Abschnitt hierhin gehört.)

    Diese Regel ist heute durchaus umstritten - viele Seiten werden für einen der beiden gängigsten Browser optimiert entwickelt: Netscape (an 1. Stelle) oder Microsoft Internet Explorer (an 2. Stelle).


    Bernd Cappel, 24.4.1995
    Erstellt für eine Lehrveranstaltung des URZ der HHU im Sommersemester 1995
    Zuletzt geändert: 23.10.1996