4. Existierende Suchdienste und Verzeichnisse

4.1. Webkataloge
Schon mit Beginn dessen, was man heute gemeinhin als "das Internet" bezeichnet wurde versucht, Ordnung in die Informationsanarchie zu bringen. Sammlungen, sogenannte Webkataloge, geordnet nach Sparten, Themenschwerpunkten und aktuellen Beiträgen wie Yahoo 1 (http://www.yahoo.com) oder Dino-Online (http://www.dino-online.de/) versuchten dieses Chaos zu ordnen und für Suchende überschaubar zu machen. Hierbei gingen sie von folgenden Voraussetzungen aus: "Eines der wesentlichen Merkmale des Internets ist die überwältigende Menge der darin enthaltenen Informationen. Informationen, die früher nur lokal über Zeitungen, Fernsehen oder Broschüren verbreitet wurden, sind heute national und sogar international verfügbar. Sie können in einer weit entfernten Stadt nach Stellenanzeigen suchen. Sie können Ihre Münzsammlung bundesweit in einer Kleinanzeige anbieten. Sie können die Telefonnummer eines Restaurants in Paris nachschlagen. Diese große Fülle von Informationen hat aber auch ihren Preis, nämlich den der Orientierungslosigkeit. Der vernetzte und dynamische Charakter des Netzes verhindert eine klare Struktur, wie sie bei den klassischen Medien gegeben ist, z.B. bei einem Buch oder einer Zeitung." 2

Strukturiert sind die Webkataloge nach Themen, Sichtworten und logisch oder inhaltlich zusammenhängenden Oberthemen, die immer weiter in Einzelgebiete unterteilt werden, je weiter man sich in die Verzeichnisstrukturen bewegt.


Einstiegsseite des deutschen Yahoo 3

Durch die riesige Menge der Web-Seiten haben diese Kataloge mittlerweile kaum noch eine Chance: zu einen müssen die Seiten bei den Betreibern solcher Web-Kataloge angemeldet und danach manuell oder automatisch auf den Inhalt geprüft werden. Erst dann wird die Webseite in den Katalog aufgenommen. Zum anderen verschwinden sehr viele Seiten schnell wieder aus dem Netz, so daß der Suchende allzu oft die Meldung erhält, daß die angefragte Seite nicht existiere.

Auch diese Webkataloge sind durchsuchbar, allerdings ist die Menge der möglichen Treffer wie schon geschildert sehr viel geringer. Es wird zwar eine Suche vergleichbar der der Suchmaschinen durchgeführt, allerdings nur im Datenbestand des Kataloges. Eine neue Kooperation geht darüber hinaus: sollte bei der Suche innerhalb eines Webkatalogs nichts gefunden werden, wird die Anfrage an eine mit Robots arbeitende Suchmaschine weitergeleitet.

Trotzdem bieten gerade Webkataloge eine hervorragende Einstiegsmöglichkeit, gerade wenn der Suchende auf eine allgemeine Themenübersicht aus ist.

4.2. Suchmaschinen
Suchmaschinen sind im allgemeinen Robotsysteme, die das Internet selbständig nach neuen Inhalten durchsuchen.
Die kleinen Programme, die sogenannten Robots, durchsuchen selbständig das World Wide Web auf der Suche nach neuen Inhalten. Sie schaffen es, durch die Konzentration auf relevante Teile des HTML-Dokumentes wie Titel, Meta-Tags und Kurzbeschreibungen, die Dokumente richtig zu indexieren und somit eine hohe Relevanz an Suchtreffern zu erzielen.


Die Arbeitsweise von Suchmaschinen 4

Ihre Ergebnisse bringen sie in eine zentrale Datenbank ein, die wiederum durchsucht werden kann. Dieses Verfahren benötigt natürliche große Speicherkapazitäten.
Der Informationssuchende stellt seine Anfrage also an die Suchmaschine, die daraufhin Ihre zentrale Datenbank nach Ergebnissen durchsucht. Als Ergebnis des Information Retrieval erhält der Nutzer dann eine Anzahl von Hyperlinks und Kurzbeschreibungen.
Auf Dauer können allerdings auch Suchmaschinen das Problem des Informationsüberangebotes im WWW nicht lösen. Welchen Nutzen bringt dem Benutzer schon eine Liste von 6000 Treffern? Klassische Suchmaschinen versuchen, dieses Problem durch elaborierte Retrievalsprachen mit Boolscher Logik und mannigfaltigen Suchmöglichkeiten zu lösen, die aber die Benutzung in aller Regel stark verkompliziert.
Zudem müssen die Web-Dokumente richtig aufgebaut sein, sonst erhält der Suchende einzelne, nutzlose Frames, Seiten zu einem völlig anderen Thema oder einfach auch gar keine Treffer.

4.3. Metasucher
Der nächste Schritt in der Entwicklung waren die sogenannten Metasucher. Hiermit werden Suchmaschinen bezeichnet, die eine einzige Anfrage an mehrere einzelne Suchmaschinen weiterleiten, die Ergebnisse sammeln und dann dem Anfragenden auf einer einheitlichen Oberfläche präsentieren.
"Als Metasucher werden Systeme bezeichnet, von denen Suchanfragen an mehrere Suchmaschinen, bzw. durchsuchbare Datenbanken des Internets delegiert werden kann. Bei diesen Metasuchern wird zwischen den Multisuchern und den Multisuchmaschinen unterschieden." 5
Mit einer einzigen Anfrage erhält man somit bereits einen guten Überblick über Webseiten, die die verschiedenen Suchmaschinen kennen. Man erspart sich so die Anfrage bei den einzelnen Suchmaschinen.
Ein Nachteil dieser Metasucher ist es, daß oft keine erweiterte Suchkonfiguration möglich ist da die verschiedensten Verfeinerungsmöglichkeiten bei den Einzelnen Suchmaschinen vorhanden sind, die eine einzelne Oberfläche nun einmal kaum bieten kann. Desweiteren ist die Suchzeit durch die vielen gleichzeitigen Abfragen oftmals ziemlich lang. Ausgefeiltere Metasucher filtern doppelte Anzeigen gleicher Dokumente heraus. Weiterhin wartet eine Metasuchmaschine nur eine gewisse Zeit auf die Rückmeldung der einzelnen Server. Damit kann es passieren, daß je nach Auslastung einzelne Server, obwohl Sie Suchergebnisse anzeigen würden, aufgrund der längeren Wartezeit vom Metasucher nicht mehr berücksichtigt werden.
Ein weiterer Nachteil von Metasuchmaschinen besteht darin, daß in der Regel von jeder Suchmaschine nur nur eine gewisse Anzahl von Ergebnissen, beispielsweise die ersten 10 gefundenen Webseiten, angezeigt werden. Sofern bei einer einzelnen Suchmaschine sehr viele gefundene Seiten zu finden sind, muß man diese doch selbständig abfragen.
Zu beachten ist, daß Sammelsuchmasken nicht unter den Begriff "Metasucher" fallen - es handelt sich hierbei nämlich lediglich um mehrere, auf einem anderen Server befindliche Eingabemasken.
Auch diese Entwicklung, die sehr viel mehr Treffer bei einer Suche bringt, wird früher oder später an ihre Grenzen stoßen. Denn mit dieser Methode werden sich auch die falschen Treffer bzw. einfach auch die Ergebnismasse um ein vielfaches steigern.


1 YAHOO bedeutet übrigens "Yet Another Hierarchical Officious Oracle", also soviel wie: "Und noch ein hierarchischer übereifriger Besserwisser", vgl. com!online 2/99, S. 61
2 Yahoo.de: Einführung in das Internet, Suchen im Netz (S. 1 von 4), http://www.yahoo.de/sfs/kapitel/2/1.html
3 Screenshot vom 3.2.1999 von der Seite http://www.yahoo.de/
4 Babiak, Ulrich: Effektive Suche im Internet, Köln 1997, S. 70
5 Potempa, S. 171

 

eMail an den Autor
Homepage des Autors
Letzte Änderung am 10.02.1999