Beschreibung

Design-Ziel

Bessere Ergebnisqualität zu niedrigeren Kosten unter Beibehaltung der einfachen Bedienung und der Geschwindigkeit herkömmlicher Suchmaschinen.

Architektur

Verteiltes Crawling

Wenn ein Nutzer eine Seite im Browser aufruft, wird diese in den verteilten Index des P2P-Netzes eingestellt oder aktualisiert. Der zusätzliche Netzwerkverkehr und das Anmelden von Seiten bei einem traditionellen Crawler entfällt. Eine hohe Verbreitung von FAROO ermöglicht einem nahezu vollständigen, in Echtzeit aktualisertem Index.

Verteilter Index

Bei FAROO gibt es keinen zentralen Index-Server. Jeder FAROO-Nutzer ist Teil eines verteilten Index.
Dabei ist jeder Nutzer für bestimmte Worte zuständig. Wenn Faroo-Nutzer eine Webseite besuchen, in der das betreffende Wort vorkommt, speichern sie die URL der Webseite in der Liste des zuständigen Nutzers ab.
Es sind immer mehrere Nutzer für ein Wort zuständig, damit die Information erhalten bleibt, auch wenn ein Nutzer das Netz verlässt. Dann nimmt ein anderer FAROO-Nutzer seine Stelle ein.

Verteiltes Ranking: PeerRank

Mit PeerRank wurde ein neues Ranking-Verfahren entwickelt. FAROO zieht das Nutzerverhalten beim Betrachten der Seite zur Bewertung heran. Dies erfolgt automatisch, ohne das der Nutzer eine explizite Bewertung abgeben muss. Damit entscheidet erstmalig der Nutzer für den die Seite bestimmt ist auch über deren Bewertung. Bei bisherigen Verfahren entscheiden nur die Webseitenbetreiber durch die Verlinkung zwischen den Seiten über deren Bewertung.

Durch PeerRank wird das Ranking auf eine breitere Basis gestellt und damit demokratisiert. Erstmalig entscheiden die Nutzer selbst darüber, welche Ergebnisse für sie am wichtigsten sind. Dieses Verfahren ist somit eine Form des Social Search, vermeidet aber dessen bisherige Nachteile. So werden nicht nur die Bekannten in die Bewertung eingezogen, sondern alle FAROO-Nutzer. Es ist keine Anmeldung nötig, und es wird kein Nutzerprofil oder Suchhistorie auf einem zentralen Server gespeichert. Bisheriges Social Search geht von der Annahme aus, das sich das Interessens-/Suchprofil von Bekannten ähnelt, bzw. das man zu jeder Frage Experten im Bekanntenkreis hat.

Personalisiertes Ranking: PersonalRank

Die personalisierte Seitenbewertung basiert auf den Interessensgebieten des suchenden Nutzer. Um den Interessensschwerpunkt zu ermitteln werden neben den besuchten Webseiten auch die Inhalte lokaler Dokumente des User ausgewertet.

Wenn jemand nach Auto sucht und er hat ein PDF-Prospekt von VW auf dem Desktop, dann werden die Ergebnisse für Auto, in denen auch VW vorkommt höher gerankt. Wenn jemand viele Kölner Adressen in seinen Dokumenten hat und er sucht nach Pizzeria, dann werden die Kölner Pizzerien höher gerankt.
Die Auswertung erfolgt aber auf dem Rechner des Users. Diese Informationen werden zu keinem Zeitpunkt nach aussen gesendet. Der Nutzer kann die Personalisierung auch deaktivieren. Gegenwärtig ist noch kein Ranking aktiviert.