Etwas im Web schnell zu finden ist kein Problem. Ob das Dokument jedoch auch die gewünschten Informationen bereit hält, ist hingegen jedoch all zu oft fraglich. Bei einfachen, eher privat angelegten Suchen, spielt dies oft eine untergeordnete Rolle. Wer sich jedoch schon einmal versucht hat eine Facharbeit mit Hilfe von Informationen aus dem Netz zu schreiben, stellt schnell fest das der Gang in die Bibliothek oft erfolgreicher ist.
Suchmaschinen durchstöbern das Netz und stufen die Informationen nach bestimmten Mustern ein. Sie entscheiden anhand verschiedenster Kriterien, ob eine Information aktuell, wichtig oder besonders wertvoll ist. Insbesondere die großen Suchmaschinenbetreiber haben hier beachtliche Suchalgorithmen erstellt, die gute Ergebnisse jedoch ausschließlich auf der Ebene der Schreibweise liefern. Hier setzt das semantische Web an: nicht die Schreibweise steht im Vordergrund, sondern die Semantik, also der Bedeutungsinhalt.
Das Konzept des semantischen Web beruht auf dem W3C-Begründer Tim Berners-Lee, welches insbesondere zwei Ansätze verfolgt. Zum einen sollen die Informationen über Links genauer werden: Wohin führt der Link? Wer ist der Autor? Welchen Charakter hat der Link (Verweis auf andere Webseite oder Login-Button?). Zum anderen sollen weitere Informationen zur Webseite erschlossen werden: Beschäftigt sich die Webseite zum Beispiel mit „Michael Jackson“, so ließe sich gleichzeitig festhalten, dass sich die Webseite um das allgemeinere Thema „Musik“ handelt.
Je dichter die Informationen zu einer Webseite, desto leichter wäre die Indexierung von Webseiten voranzutreiben. Im Idealfall würde man mit Hilfe dieser zusätzlichen Daten Suchanfragen formulieren können, die einem ausschließlich die gewünschte Antwort liefern, z.B. „Wie viele CDs hat Madonna bisher veröffentlicht?“

Einen ersten Schritt in diese Richtung geht das 2001 ins Leben gerufene Projekt „Annotea“, welches als Teilprojekt des „Semantic Web Advanced Development (SWAD)“ entstand. Bei diesem Projekt geht es darum, die Produktivität in der Gruppenarbeit mittels geteilter Informationen wie Metadata, Stichwörter, Anmerkungen und Lesezeichen zu erhöhen. Wenn der Nutzer auf eine Webseite kommt, kann er sich über einen speziell eingerichteten Annotations-Server oder öffentliche Annotations-Server Zusatzinformationen anderer Nutzer abrufen. Durch die Möglichkeit eigene Server zu betreiben, können z.B. Fachgruppen den Zugang auf eigene Mitglieder beschränken, um die Qualität der Daten zu sichern.
Der erste Webbrowser, in dem die Funktion von Annotea integriert wurde, war Amaya – der hauseigene Webbrowser des W3C. Des weiteren gibt es das „Annotea Ubimarks“ Plugin für den Browser Firefox. Hiermit können sehr leicht zusätzliche Informationen anderer Nutzer zur Webseite angezeigt und eigene Daten hinzugefügt werden.
Das W3C hat dieses Projekt bereits im Jahr 2001 angeregt. Mittlerweile gibt jedoch es auch kommerzielle Angebote, die sich dieses Dienstes in abgewandelter Form bedienen. Ein Unternehmen ist z.B. http://del.icio.us/ - dieses richtet sich jedoch eher an ein privates Publikum und bietet auch nicht die Möglichkeit einhergehende Informationen zu einer Webseite zu sammeln.
Zur Webseite von Annotea
Download des Firefox-Plugin Annotea Ubimarks