FAQ - Frequently Asked Questions
- Warum ist der Crawler so langsam?
- Warum liefert FAROO noch so wenig Ergebnisse?
- Warum zeigt FAROO nur die Top-1000 Ergebnisse an?
- Worin unterscheidet sich FAROO von anderen P2P-Web-Suchmaschinen?
- FAROO liest meinen Netzwerkverkehr um die besuchten Seiten zu indexieren. Verletzt das meine Privatsphäre?
- Warum funktioniert das Indexieren besuchter Seiten bei mir nicht?
- Wie kann ich verhindern, dass FAROO meine Website indexiert?
- Mein Port 80 ist belegt, warum kann ich die Port-Nummer nicht ändern?
- Wieso ist FAROO's Schutz der Privatsphäre viel stärker als nur nur auf Log Files zu verzichten?
- Unterstützen FAROOs Anonymisierung und Verschlüsselung nicht eine missbräuchliche Nutzung?
- Ist FAROOs Attention Based Ranking nicht anfällig gegen Manipulationen?
- Wie stark belastet FAROO meinen Rechner?
- Warum ist FAROO nicht Open Source, so dass sich jeder beteiligen kann?
- Wie passen Demokratisierung der Suche und kommerzielle Nutzung zusammen?
Q: Warum ist der Crawler so langsam?
A: FAROO's collaborative crawler swarm is very fast. The number of a crawled pages per single client is relatively low for two reasons:
- It is designed as low impact crawler for a smooth user experience, without using to much bandwidth, IO and processor load from a single user. The power is rather defined by its massive scalability.
- Other than in centralized systems the crawler speed is determinded by the distribution of the data to the decentalized index, not by fetching and parsing the web pages. FAROO is crawling only as much pages, as it is able to immediately distribute the contained information with a n-fold redundancy to the index. This prevents the distribution of outdated content and waste of bandwith and harddisk space (for crawled, but never distributed pages).
Q: Warum liefert FAROO noch so wenig Ergebnisse?
A: We are still in beta. This is mainly intended to test and improve our distributed architecture. Due to the restricted number of users during the beta test also the number of pages indexed is limited. Using a dedicated crawler we are now increasing the number of indexed documents to prevent a "chicken or egg problem".
So while trying FAROO you should rather judge the quality of the technology than the current quantity of the index.
Q: Warum zeigt FAROO nur die Top-1000 Ergebnisse an?
A: For index compression there are only the top 1000 results (equals 100 result pages) for each query guaranteed.
Barerely anyone looks beyond 100 result pages. Instead the query is refined. And for the refined query FAROO again guarantees the top-1000 results. In this way despite a heavy index compression no relevant information gets lost.
Query example: car race
- Top 1000 results for car
- Top 1000 results for race
- Top 1000 results for car race
We will display an estimated absolute result number in the future.
Q: Worin unterscheidet sich FAROO von anderen P2P-Web-Suchmaschinen?
A: Speed, Scalability, Efficiency, Ranking and Simplicity.
FAROO is able to answer queries with multiple keywords very fast. This is very important because only 15 % are single keyword searches. The search response time and traffic are independent from the number of query terms. FAROO’s index structure eliminates the need of intersecting long posting lists for Boolean queries. Nevertheless also for a huge index size complete results are guaranteed.
FAROO scales unlimited:
- Most other peer to peer search engines store all results for a specific keyword at a single peer.
This architecture does not scale. One billion results for a frequent term do not fit on a single peer. - And a search with multiple search terms is infeasible due to the amount of data to be transferred. To guarantee complete results for two search terms with each 1 billion results at two separate peers the transfer of at least 10 GByte would be required, some naive implementations require even two times of that. Even compressed by factor 10, the transfer of 1 GByte for a single search is still infeasible.
- So either those search engines are really slow or return absolute incomplete results despite of having a huge index.
- Index Efficiency = mean number of results / number of indexed pages.
- All crawled Pages are almost instantly available for search.
- There is no search horizon nor truncated result lists.
- Every page is counted uniquely across all peers, without repeatedly counting pages which are crawled by several peers, pages which are not yet distributed, redundantly stored pages or pages indexed across several peers.
FAROO offers an easy installation, a clean user interface and a seamless browser and OS integration.
Q: FAROO liest meinen Netzwerkverkehr um die besuchten Seiten zu indexieren. Verletzt das nicht meine Privatsphäre?
A: Nein. FAROO liest HTTP ähnlich wie ein Proxy mit, allerdings bleiben die Daten im Gegensatz zum Proxy unverändert und die Browser müssen nicht konfiguriert werden. FAROO indiziert nur Seiten die sich im Internet befinden, aber keine Intranetseiten oder HTTPS-Seiten. Durch FAROO verlassen keine personenbezogenen Daten den Rechner des Nutzers.
Es ist aber wichtig sich bewusst zu sein, dass es beim Besuchen von Internetseiten keine Privatsphäre gibt. Den ISPs mit Vorratsdatenspeicherung, zahlreichen Stationen im Internet und schließlich den besuchten Seiten selbst ist das Nutzerverhalten bekannt.
Im Gegensatz dazu gibt es bei FAROO keine zentrale Institution, die Daten erfasst. Die (ohnehin öffentlichen) Webseiten werden noch auf dem Rechner des Nutzers gehasht und verschlüsselt und dann in den verteilten Index eingestellt. Im Index befinden sich nur verschlüsselte Informationen. Der Index enthält keine Informationen darüber, wer die Webseiten in den Index eingestellt hat.
Q: Warum funktioniert das Indexieren besuchter Seiten bei mir nicht?
A: FAROO nutzt Raw Sockets um die besuchten Webseiten zu lesen und zu indizieren. Dieses Verfahren ist browserunabhängig und vermeidet zusätzlichen Traffic. Leider ist die Unterstützung von Raw Sockets in den unterschiedlichen Windows Versionen nicht konsistent.
- Windows XP SP1 und Vista nicht unterstützt (kein Monitoring von outgoing Packets).
- Windows 2000 nur mit Admin-Rechten oder Patch unterstützt.
- Windows XP SP2 und Windows 2003 unterstützt, aber nicht in Verbindung mit alle Wlan-Karten.
Q: Wie kann ich verhindern, dass FAROO meine Website indexiert?
A: Because FAROO does not require a dedicated crawler, it is also not accessing files on your web server, so that there is no additional load for you. Anyway, as FAROO is a well behaving search engine, it respects the Robots Meta Tag according to www.robotstxt.org.
Q: Mein Port 80 ist belegt, warum kann ich die Port-Nummer nicht ändern?
A: FAROO hat einen eingebauten Webserver. Dieser hat zwei Funktionen. Einerseits wird darüber die Benutzeroberfläche zur Verfügung gestellt und andererseits werden darüber der Index gefüllt und Suchanfragen anderer Peers beantwortet. Wenn Port 80 belegt ist, sucht sich FAROO automatisch einen anderen freien Port. Das Suchen ist also weiterhin möglich. Allerdings funktioniert FAROO dann nicht mehr als aktiver Peer, d.h. als aktiver Teil des verteilten Index.
Dies wurde so festgelegt, da eine erhebliche Anzahl Nutzer nur über Port 80 ins Internet kommen (wegen Firewalls). Wenn ein Teil der aktiven Peers für diese Nutzer nicht erreichbar ist, dann würde das DHT Prinzip verletzt. Dadurch besteht die Gefahr, dass die Port-80-only-Sucher für manche Worte nicht die optimalen, im Worst Case gar keine Ergebnisse bekommen.
Q: Wieso ist FAROO's Schutz der Privatsphäre viel stärker als nur nur auf Log Files zu verzichten?
A: Some search engines do not log search queries, others delete or anonymize them after a certain time or at users wish.
The security gain of this measures is almost virtualy only. It does not help much if the search engine company obstains from collecting logfiles, but your ISP or system admin are monitoring your search. According to European law all connectiond data are collected and retained for at leat six month.
By the following measures FAROO can provide superior privacy protection:
No search log
- This is by architecture, not only by policy.
- As FAROO has a completly distributed architecture, there does no central instance for monitoring exists. Therefore not collecting search logs is not just a promise, it's technically infeasible.
- Logging by ISP (connection data retention law) or system admin does not hurt your privacy as all queries are encrypted .
- Your search queries are immune to blocking or filtering by ISP or system admin as all queries are encrypted.
Q: Unterstützen FAROOs Anonymisierung und Verschlüsselung nicht eine missbräuchliche Nutzung?
A: Nein. Verantwortlich ist derjenige der Inhalte einstellt und derjenige der Inhalte konsumiert. FAROO ist für einen möglichen Missbrauch seiner Technologie sowenig verantwortlich wie die Entwickler eines Webservers, eines Browsers, des HTTPS-Protokolls oder der AES-Verschlüsselung, oder die Hersteller eines Bildschirms, einer Festplatte oder eines Speichers nicht für illegale Inhalte verantwortlich sind die damit gespeichert, übermittelt oder angezeigt werden.
Jede Technologie kann nutzbringend oder missbräuchlich eingesetzt werden. Ebenso unterschiedlich sind die Rechtsauffassungen in den einzelnen Ländern. Freiheit der Rede und Schutz der Privatsphäre sind in vielen Verfassungen garantiert, in anderen Ländern dagegen strafbar.
FAROO stellt keine Inhalte ins Internet, macht sie verfügbar, oder gewährt anonymen Zugang dazu. FAROO hilft einzig und allein den Nutzern, sich gegenseitig beim Auffinden bereits im Internet vorhandener Informationen unter Wahrung ihrer Privatsphäre zu unterstützen.
Q: Is FAROOs Attention Based Ranking nicht anfällig gegen Manipulationen?
A: FAROOs attention based Ranking is not so different from to Googles Page Rank. While in Google webmasters are voting by linking to webpages, in FAROO users are voting by visiting webpages.
Therefore also the kind of ranking attacks and counter measures are similar. There are a lot of statistical measures by which a cheating peer could be identified. But of course, as with every anti-spam and anti-virus solution it's a continually ongoing fight. Therefore FAROO can instantly change the ranking algorithm and/or encryption by its auto-update feature, once it becomes compromised.
Q: Wie stark belastet FAROO meinen Rechner?
A: FAROO ist so konzipiert, das es die Leistung des Rechners nicht beeinträchtigt.
Es ist nur aktiv, wenn keine Useraktivität und keine Prozessorlast zu verzeichnen sind.
Der zur Verfügung gestellte Plattenplatz kann in den Optionen definiert werden. Wenn der Plattenplatz knapp wird, gibt FAROO automatisch den belegen Plattenplatz wieder frei.
Damit steht die volle Kapazität des Rechners jederzeit ausschließlich dem Nutzer zur Verfügung steht, sobald dieser sie benötigt.
Q: Warum ist FAROO nicht Open Source, so dass sich jeder beteiligen kann?
A: Well, everybody participates in ranking, crawling, serving results and in revenue sharing! For most of the users this kind of participation is probably more interesting than having access to source code. The source code is not public for two reasons:
First: OpenSource is perfect when competing by a cost advantage with a commercial product on the same technological level (Linux, OpenOffice). But it's not a good idea to hand over your technological advantage to a monopoly, when competing with its free service with enormous brand power.
Second: We, like others, don't believe in big development teams if you are aiming radical changes.
Q: How democratizing the search and making money out of it go together?
Well, we think everybody needs to make some money for living, as long there is no open source housing, food, clothing and transportation ;-)
Isn't it better to make a living from an idea you believe in, than to waste your time in a boring job and dream in your spare time only?
Besides the ranking FAROO democratizes also the search business. While today the biggest and fastest growing market in the internet is dominated by a single player, FAROO allows everybody to take part and profit from it.