YaCy

Yacy
YaCy logo.png
Yacy-buscador.png
Originalautor (en) Michael Christen
Entwickler (en) Yacy Community
Erstveröffentlichung 2003; Vor 19 Jahren[1]
Stabile Version
1.924 / 14. Dezember 2020; Vor 19 Monaten
Repository Github.com/yacy/yacy_Suche_Server
Geschrieben in Java
Betriebssystem Plattformübergreifend
Typ Overlay -Netzwerk, Suchmaschine
Lizenz GPL-2.0-or-Later
Webseite Yacy.Netz/en/

Yacy (ausgesprochen "ya siehe") ist a frei verteilte Suchmaschine, basiert auf den Prinzipien von Peer-To-Peer (P2P) Netzwerke.[2][3] Sein Kern ist a Computer Programm geschrieben in Java auf mehrere hundert Computer verteilt, ab September 2006, sogenannte Yacy-Peers. Jedes Yacy-Peer krabbelt unabhängig durch das Internet, Analysen und Indizes haben Webseiten gefunden und speichert Indexierungsergebnisse in einer gemeinsamen Datenbank (sogenannten Index), die mit anderen YACY-Peers unter Verwendung von Prinzipien von P2P-Netzwerken gemeinsam genutzt wird. Es ist ein Suchmaschine Dass jeder ein Suchportal für sein Intranet erstellen und dabei helfen kann, das öffentliche Internet klar zu durchsuchen.

Im Vergleich zu halbverteilten Suchmaschinen verfügt das Yacy-Network über eine verteilte Architektur. Alle Yacy-Peers sind gleich und zentral Server existiert. Es kann entweder in einem ausgeführt werden Krabbeln Modus oder als Lokal Proxy Server, Indizierung von Webseiten, die von der Person besucht werden, die Yacy auf ihrem Computer läuft. Es werden mehrere Mechanismen bereitgestellt, um die Privatsphäre des Benutzers zu schützen. Der Zugriff auf die Suchfunktionen erfolgt von einem lokal ausgeführten Webserver, der ein Suchfeld zum Eingeben von Suchbegriffen bereitstellt und die Suchergebnisse in einem ähnlichen Format an andere beliebte Suchmaschinen zurückgibt.

Yacy wurde 2003 von Michael Christen geschaffen.[4]

Systemkomponenten

Die Yacy -Suchmaschine basiert auf vier Elementen:[5]

Crawler
Ein Suchroboter, der zwischen Webseiten durchquert und deren Inhalte analysiert.[6]
Indexer
Es schafft a Reverse Word Index (RWI), d. H. Jedes Wort aus der RWI hat eine eigene Liste relevanter URLs und Ranking -Informationen. Wörter werden in Form von Worthashes gespeichert.[7]
Such- und Verwaltungsschnittstelle
Made als Weboberfläche, die von einem lokalen Bereich bereitgestellt wird Http Servlet mit Servlet -Motor.[8]
Datenspeicher
Wird verwendet, um die Reverse Word Index -Datenbank mit a verteilte Hash -Tabelle.
Homepage von Yacy

Suchmotentechnologie

Yacy -Netzwerk
  • Yacy ist eine vollständige Suche Gerät mit Benutzeroberfläche, Index, Verwaltung und Überwachung.
  • Yacy erntet Webseiten mit einem Web -Crawler. Dokumente werden dann analysiert, indiziert und der Suchindex lokal gespeichert. Wenn Ihr Peer Teil eines Peer -Netzwerks ist, wird Ihr lokaler Suchindex auch in den freigegebenen Index für dieses Netzwerk zusammengefasst.
  • Eine Suche wird gestartet, dann trägt der lokale Index zusammen mit einem globalen Suchindex von Peers im YACY -Suchnetzwerk bei.
  • Das Yacy-Gitter ist eine Implementierung der Yacy-Peer-to-Peer-Suche der zweiten Generation. Eine Yacy -Gitterinstallation besteht aus Microservices, die mit dem Master Connect -Programm (MCP) kommunizieren.
  • Der Yacy -Parser ist ein Microservice, der mithilfe von Verwendung bereitgestellt werden kann Docker. Wenn die Parser -Komponente gestartet wird, sucht sie nach einem MCP und stellt eine Verbindung damit her. Standardmäßig wird der lokale Host nach einem MCP gesucht, aber Sie können selbst eines konfigurieren.

YACY -Plattformarchitektur

Websuche zeigt Ergebnisse der verschiedenen Komponenten, die yacy verwendet

Yacy verwendet eine Kombination von Techniken für die Netzwerk, Verwaltung und Wartung der Indexierung der Suchmaschine, einschließlich der Schwarzenliste, der Mäßigung und der Kommunikation mit der Community. So führt Yacy diese Operationen aus:

  • Community -Komponenten
    1. Webforum[9]
    2. Statistiken
    3. XML -API
  • Wartung
    1. Webserver
    2. Indizierung
    3. Crawler mit Balancer
    4. Peer-to-Peer-Serverkommunikation
  • Inhaltsorganisation
    1. Blacklisting und Filterung
    2. Suchschnittstelle
    3. Lesezeichen
    4. Überwachung von Suchergebnissen

Verteilung

Yacy ist in Paketen für Linux, Windows, Macintosh und auch als Docker -Bild verfügbar. Yacy kann auch auf jedem anderen Betriebssystem installiert werden, indem es entweder durch manuelles Kompilieren oder mit a Tarball.[10] Yacy erfordert Java 8, OpenJDK 8 wird empfohlen.

Das Debian Das Paket kann aus einem Repository installiert werden, das auf der Subdomain der Website des Projekts verfügbar ist.[11][12] Das Paket wird im offiziellen Debian -Paket -Repository noch nicht verwaltet.[13]

Siehe auch

  • Dooble -Ein Open-Source-Webbrowser mit einem integrierten YACY-Suchmaschinen-Tool-Widget

Verweise

  1. ^ "Ich entwickle eUn P2P-Basierende Suchmaschine. Wer MACHT MIT?". Heise online (auf Deutsch). 2003-12-15. Abgerufen 2018-05-09.
  2. ^ "Yacy übernimmt Google mit Open Source -Suchmaschine". Das Register. 2011-11-29. Abgerufen 2012-04-16.
  3. ^ "Yacy: Es geht um Freiheit, die Google nicht schlägt". PC Welt. 2011-12-03. Abgerufen 2012-04-16.
  4. ^ "Ich entwickle eUn P2P-Basierende Suchmaschine. Wer MACHT MIT?". Heise online (auf Deutsch). 2003-12-15. Abgerufen 2018-05-09.
  5. ^ "Yacy Technology Architecture". Yacy.net. Abgerufen 2012-02-14.
  6. ^ Github: Yacy Grid Crawler, Yacy-Suchmaschine, 2021-02-28, S. Yacy / Yacy_Grid_Crawler, abgerufen 2021-03-11
  7. ^ Github: Yacy Grid Parser, Yacy-Suchmaschine, 2021-02-28, S. Das Yacy-Gitter ist die Implementierung der zweiten Generation von YACY, abgerufen 2021-03-11
  8. ^ Github: Yacy -Suche, Yacy-Suchmaschine, 2021-02-28, S. Yacy / Yacy-Search, die von Creme / Yacy-Suche gegabelt wurde, abgerufen 2021-03-11
  9. ^ "Forum.yacy.de". Abgerufen 6. Juni 2017.
  10. ^ "Download - Yacy". yacy.net. Abgerufen 2021-07-27.
  11. ^ "En: debianinstall". Yacywiki. Abgerufen 6. Oktober 2019.
  12. ^ "Dev: Tasksharing". Yacywiki. Abgerufen 6. Oktober 2019.
  13. ^ "#452422 - RFP: YACY - Distributed Web Crawler und Suchmaschine". Debian Bug Report Protokolle. Abgerufen 2. Mai 2020.

Weitere Lektüre

Yacy bei LinuxReviews

Externe Links