Tipps & Tricks 10.10.2014, 12:23 Uhr

Die Internetadresse erklärt

Internetadressen sind nicht gerade intuitiv zu lesen. Mit unseren Grundlagentipps finden Sie heraus, was hinter jeder Adresse steckt.
Die URL (Uniform Resource Locator) ist die wohl wichtigste Identifikationsmethode im Internet. Anhand der URL findet sich der Browser im Netz zurecht und auch Sie können aus der Adresse einige nützliche Informationen herauslesen. Etwas Grundwissen über die URL hilft beispielsweise gegen Phishing. Nehmen wir zum Anfang die folgende URL:
https://www.youtube.com/watch?v=KolfEhV-KiA&list=FLHA9rSRkb_OGDZrV2gWQpMg&index=46
Diese lässt sich folgendermassen unterteilen:
Die URL, unterteilt in ihre Bestandteile

Das Protokoll (rot)

Der erste Teil ist das Protokoll. Auf Webseiten ist das meistens entweder http: (unverschlüsselt) oder https: (verschlüsselt). Anhand dieser Information sehen Sie, ob Sie gerade private Informationen über eine unverschlüsselte Verbindung senden. Ein weiteres häufiges Protokoll ist ftp:, das vor allem für Dateiübertragungen verwendet wird.

Der Server (schwarz)

Nach dem Protokoll kommt die Serveridentifikation. Diese ist wiederum in drei Teile unterteilt. Youtube.com ist in diesem Fall die Domain. Diese leitet den Browser an die korrekte IP-Adresse weiter. Jeder Computer im Netz besitzt so eine Nummer, die ihn identifiziert. Da IP-Adressen jedoch schwer merkbar sind, gibt es Domains. Vor der Domain steht der Server //www. Dieser kann je nach Dienst variieren. Beispielsweise verwenden viele Seiten //www für die Webseite und //mail für den Maildienst.
Der dritte Teil der Serveridentifikation ist in der Domain versteckt. Das .com zeigt, die Herkunft oder die Zugehörigkeit der Domain an und nennt sich TLD (top-level domain). Länderspezifische TLDs wie .ch oder .de sind jedoch nicht geschützt und können auch von Auswärtigen verwendet werden. Länderunabhängige TLDs wie .com oder .biz zeigen in der Regel an, um was es sich beim Seitenbetreiber handelt. .com steht für Company, .biz für Business, .gov für Government etc.
In unserem Beispiel geht es also um den Webserver (//www.) von der Adresse von Youtube (youtube) innerhalb der Gruppe «Unternehmen» (.com).

Der Ordner (blau)

Webseiten sind im Prinzip gleich aufgebaut wie die Ordner auf unseren PCs zu Hause. Nachdem der Browser weiss, auf welchen Server er zugreifen soll, muss er dort auch noch den richtigen Ordner finden. Dieser steht nach der Domain, getrennt durch einen Slash. Im Fall von YouTube greifen wir auf den Ordner /watch zu.
Beim PCtipp zeigen die Ordner beispielsweise die Unterkategorien der Artikel an. Die Adresse pctipp.ch/tests/hardware/audio führt zum Beispiel zu allen Hardware-Tests aus der Kategorie Audio. Bei einfacheren Webseiten findet man nach den Ordnern jeweils eine Datei, wie zum Beispiel testbericht.html. Mittlerweile arbeiten jedoch viele Webseiten nicht mehr mit festen Dateien, sondern mit Parametern, die der Seite mitteilen, welche Inhalte sie laden sollen.

Die Parameter (grün/lila/gelb)

Erscheint in der URL ein Fragezeichen, verwendet die Webseite Parameter. Nach dem Trennzeichen «?» funktionieren die Parameter immer nach dem gleichen Muster. Erst kommt der Schlüssel. In unserem Beispiel «v», dann ein Gleichzeichen, gefolgt vom Wert «KolfEhV-KiA». Das erklärt dem Browser, dass er das Video (v) mit dem Namen KolfEhV-KiA laden soll.
Nach dem ersten Parameter ist aber noch nicht Schluss. Das Ampersandzeichen (&) zeigt an, dass ein weiterer Parameter folgt. In diesem Fall ist es list=FLHA9rSRkb_OGDZrV2gWQpMg. Das bedeutet, dass der Browser das Video mit der Playlist zusammen laden soll. Um innerhalb der Playlist das richtige Video zu finden, benötigt der Browser den dritten Parameter: index=46, was so viel heisst wie: das 46. Video in der Liste. Die Schlüssel zu den Parametern können vom Seitenbetreiber selbst festgelegt werden und heissen nicht überall gleich.

Kurz zusammengefasst:

Unsere Beispiel-URL verbindet uns über eine verschlüsselte Verbindung (https:) mit dem Server «www.youtube.com», greift dort auf den Ordner «/watch» zu und wendet die Parameter «v=KolfEhV-KiA» «list=FLHA9rSRkb_OGDZrV2gWQpMg» und «index=46» an.

Bonus-Tipp für Tracking-Gegner

Tracking-Daten werden ebenfalls häufig über Parameter an einen Link angehängt. Man erkennt die Tracker an Schlüsseln wie «utm_campaign» oder «utm_source». Diese Parameter messen diverse Daten wie zum Beispiel, woher die Besucher kommen und welchem Link sie gefolgt sind.
Wenn Sie diese Tracker entfernen möchten, sollten Sie nicht direkt auf Links klicken, sondern diese erst kopieren. Danach fügen Sie den Link in die Adresszeile des Browsers ein und entfernen alles ab dem Fragezeichen. Aus http://www.pctipp.ch/tests/flyer-check/artikel/digitec-die-top-angebote-im-flyer-check-81065/?utm_source=RSS&utm_medium=Feedreader&utm_campaign=RSSFeed wird somit http://www.pctipp.ch/tests/flyer-check/artikel/digitec-die-top-angebote-im-flyer-check-81065. Die Seite wird normal funktionieren, jedoch keine Tracking-Informationen aus Ihrer URL schliessen können. Ein Sonderfall sind hierbei die Kurz-URLs. Lesen Sie mehr dazu in unserer Anleitung.



Kommentare
Avatar
Wotan
11.10.2014
War eigentlich immer der Meinung, dass .com für "commercial" steht ... Ja und nein, Wikipedia schreibt dazu .com ist eine generische Top-Level-Domain, die durch Verisign betrieben wird. Sie wurde am 1. Januar 1985 eingeführt und war damals primär für Unternehmen bestimmt, hat diese enge Bedeutung aber durch die Dotcom-Blase verloren. Die Abkürzung com steht für die englischen Begriffe commercial oder commerce, zu Deutsch geschäftlich. Was ebenfalls noch interessant sein könnte, es gibt URL's welche nach dem www eine Zahl einsetzen (zB. Sunrise). Diese setzen ein "LoadBalancing"-System ein; dabei werden die Anfragen aus dem Internet über einen vorgeschalteten Server, den sog. "Sprayer", auf mehrere WebServer verteilt. Das System dient dazu, bei vielen gleichzeitigen Anfragen die "Last" auf mehrere Server verteilen zu können, um a) die Server gleichmässig zu belasten und b) den anfragenden Rechnern (also im Grunde dem, der vor seinem Browser sitzt) die gewünschte Seite möglichst schnell liefern zu können, ohne dass er dabei bei vielen gleichzeitigen Anfragen lange warten muss. Gruss Wotan

Avatar
patrick
12.10.2014
Dass das direkt nach dem FQDN der Ordner kommt, ist völliger quatsch. Kann sein, muss aber nicht sein. Mit ModRewrite kann man das ganz schön umbiegen. Vor allem bei der Beispielurl ist das sehr unwarscheinlich; das /watch ist wohl eher ein (PHP?)Script.