Die besten Erfindungen resultieren manchmal aus purer Frustration. Tippt man einen bestimmten Begriff z. B. bei Google ein, blicken einem meist Tausende Resultate entgegen, die nicht unbedingt mit der Anfrage etwas zu tun haben. Das mag einer von vielen Gründen gewesen sein, warum Raul Valdes Perez sich dazu entschloss eine neue Suchmaschine namens Clusty auf den Markt zu bringen. Mit Erfolg.
Umso mehr Informationen, desto größer das Chaos. Suchmaschinen versuchen seit Jahren der wachsenden Fülle von Informationen Herr zu werden. Sie entwickeln neue Algorithmen und schnellere Server zum Indexieren. Dabei ist die Lage nicht besser als früher: Wo immer man in den öffentlichen Suchmaschinen sucht, Informationen scheinen nicht klar gegliedert zu sein. Volltextsuchmaschinen wie beispielsweise Google verzichten auf eine Kategorisierung. Das hat jedoch einen klaren Nachteil, welches am besten am folgenden Beispiel erkennbar wird: Sucht man nach dem Begriff “Apple” spuckt die Suchmaschine alles aus, was die Begriffe enthält. Der Nutzer muss dann zwischen Macintosh, New York (Big Apple) und Obst mühselig herausfinden, welche Treffer für ihn eigentlich relevant sind.
Auf der einen Seite gibt es die Verzeichnisse, wie zum Beispiel Yahoo oder das Open Directory Project (wir berichteten darüber). Hier werden Webseiten von Redakteuren gepflegt und in bestimmte Kategorien geordnet: Das Resultat ist aber nicht unbedingt ergreifend. Intellektuelle Handarbeit kann die exponentiell wachsenden Datenmengen nicht bewältigen. Obwohl die größte mit Editoren vorangetriebene Suchmaschine ODP eine Satte Summe von 4 Millionen Webseiten ausspuckt, kann sie der Fülle von Milliarden Webseiten nicht standhalten. Das Dilemma ist klar auf der Hand: Qualitativ sortierte Informationen sind nicht quantitativ und quantitative Informationen sind nicht qualitativ verfügbar.
Die Innovation von Valdes-Perez soll das nun ändern. Seine Idee soll beides kombinieren. Eine Suchanfrage nach “Apple” bietet nun auf der linken Spalte dem Anwender die Möglichkeit, seinen Bereich weiter zu differenzieren. Dabei tauchen dann Begriffe auf wie “Fruit”, “Pictures”, “Laptops”, und letztendlich auch “Big Apple” und “New York”. Gleichzeitig kann der Benutzer dann auch sehen, welcher dieser Kategorien, wie viele Treffer aufweisen. Und das Innovative an der Sache: Die Suchmaschine sortiert voll automatisch, ähnlich wie Google.
Mit dieser Technologie möchte Valdes-Perez eine Nische im Suchmaschinenmarkt decken. Die Suchtechnologie kann auch für unternehmensinterne oder auch als Suchalgorithmus für öffentliche Portale genutzt werden. Clusty startete insgesamt mit einer Förderung von US$ 1 Mio. von der National Science Foundation. Zu seinen Kunden gehören mittlerweile NASA und Johnson & Johnson, die die Technologie bereits erfolgreich nutzen. Clusty ist derzeit als Betaversion verfügbar unter: clusty.com.
Aktueller Hinweis von November 2024: Dieser Artikel erschien im Magazin Wissenskapital am 17. August 2004 verfasst und befindet sich somit in diesem Digitalwelt-Archiv. Mittlerweile heißt die Suchmaschine Yippy und sie ist unter der Website yippy.com zu erreichen.