YaCy
Originalautor (en) | Michael Christen |
---|---|
Entwickler (en) | Yacy Community |
Erstveröffentlichung | 2003[1] |
Stabile Version | 1.924 / 14. Dezember 2020 |
Repository | Github |
Geschrieben in | Java |
Betriebssystem | Plattformübergreifend |
Typ | Overlay -Netzwerk, Suchmaschine |
Lizenz | GPL-2.0-or-Later |
Webseite | Yacy |
Yacy (ausgesprochen "ya siehe") ist a frei verteilte Suchmaschine, basiert auf den Prinzipien von Peer-To-Peer (P2P) Netzwerke.[2][3] Sein Kern ist a Computer Programm geschrieben in Java auf mehrere hundert Computer verteilt, ab September 2006[aktualisieren], sogenannte Yacy-Peers. Jedes Yacy-Peer krabbelt unabhängig durch das Internet, Analysen und Indizes haben Webseiten gefunden und speichert Indexierungsergebnisse in einer gemeinsamen Datenbank (sogenannten Index), die mit anderen YACY-Peers unter Verwendung von Prinzipien von P2P-Netzwerken gemeinsam genutzt wird. Es ist ein Suchmaschine Dass jeder ein Suchportal für sein Intranet erstellen und dabei helfen kann, das öffentliche Internet klar zu durchsuchen.
Im Vergleich zu halbverteilten Suchmaschinen verfügt das Yacy-Network über eine verteilte Architektur. Alle Yacy-Peers sind gleich und zentral Server existiert. Es kann entweder in einem ausgeführt werden Krabbeln Modus oder als Lokal Proxy Server, Indizierung von Webseiten, die von der Person besucht werden, die Yacy auf ihrem Computer läuft. Es werden mehrere Mechanismen bereitgestellt, um die Privatsphäre des Benutzers zu schützen. Der Zugriff auf die Suchfunktionen erfolgt von einem lokal ausgeführten Webserver, der ein Suchfeld zum Eingeben von Suchbegriffen bereitstellt und die Suchergebnisse in einem ähnlichen Format an andere beliebte Suchmaschinen zurückgibt.
Yacy wurde 2003 von Michael Christen geschaffen.[4]
Systemkomponenten
Die Yacy -Suchmaschine basiert auf vier Elementen:[5]
- Crawler
- Ein Suchroboter, der zwischen Webseiten durchquert und deren Inhalte analysiert.[6]
- Indexer
- Es schafft a Reverse Word Index (RWI), d. H. Jedes Wort aus der RWI hat eine eigene Liste relevanter URLs und Ranking -Informationen. Wörter werden in Form von Worthashes gespeichert.[7]
- Such- und Verwaltungsschnittstelle
- Made als Weboberfläche, die von einem lokalen Bereich bereitgestellt wird Http Servlet mit Servlet -Motor.[8]
- Datenspeicher
- Wird verwendet, um die Reverse Word Index -Datenbank mit a verteilte Hash -Tabelle.
Suchmotentechnologie
- Yacy ist eine vollständige Suche Gerät mit Benutzeroberfläche, Index, Verwaltung und Überwachung.
- Yacy erntet Webseiten mit einem Web -Crawler. Dokumente werden dann analysiert, indiziert und der Suchindex lokal gespeichert. Wenn Ihr Peer Teil eines Peer -Netzwerks ist, wird Ihr lokaler Suchindex auch in den freigegebenen Index für dieses Netzwerk zusammengefasst.
- Eine Suche wird gestartet, dann trägt der lokale Index zusammen mit einem globalen Suchindex von Peers im YACY -Suchnetzwerk bei.
- Das Yacy-Gitter ist eine Implementierung der Yacy-Peer-to-Peer-Suche der zweiten Generation. Eine Yacy -Gitterinstallation besteht aus Microservices, die mit dem Master Connect -Programm (MCP) kommunizieren.
- Der Yacy -Parser ist ein Microservice, der mithilfe von Verwendung bereitgestellt werden kann Docker. Wenn die Parser -Komponente gestartet wird, sucht sie nach einem MCP und stellt eine Verbindung damit her. Standardmäßig wird der lokale Host nach einem MCP gesucht, aber Sie können selbst eines konfigurieren.
YACY -Plattformarchitektur
Yacy verwendet eine Kombination von Techniken für die Netzwerk, Verwaltung und Wartung der Indexierung der Suchmaschine, einschließlich der Schwarzenliste, der Mäßigung und der Kommunikation mit der Community. So führt Yacy diese Operationen aus:
- Community -Komponenten
- Webforum[9]
- Statistiken
- XML -API
- Wartung
- Webserver
- Indizierung
- Crawler mit Balancer
- Peer-to-Peer-Serverkommunikation
- Inhaltsorganisation
- Blacklisting und Filterung
- Suchschnittstelle
- Lesezeichen
- Überwachung von Suchergebnissen
Verteilung
Yacy ist in Paketen für Linux, Windows, Macintosh und auch als Docker -Bild verfügbar. Yacy kann auch auf jedem anderen Betriebssystem installiert werden, indem es entweder durch manuelles Kompilieren oder mit a Tarball.[10] Yacy erfordert Java 8, OpenJDK 8 wird empfohlen.
Das Debian Das Paket kann aus einem Repository installiert werden, das auf der Subdomain der Website des Projekts verfügbar ist.[11][12] Das Paket wird im offiziellen Debian -Paket -Repository noch nicht verwaltet.[13]
Siehe auch
- Dooble -Ein Open-Source-Webbrowser mit einem integrierten YACY-Suchmaschinen-Tool-Widget
Verweise
- ^ "Ich entwickle eUn P2P-Basierende Suchmaschine. Wer MACHT MIT?". Heise online (auf Deutsch). 2003-12-15. Abgerufen 2018-05-09.
- ^ "Yacy übernimmt Google mit Open Source -Suchmaschine". Das Register. 2011-11-29. Abgerufen 2012-04-16.
- ^ "Yacy: Es geht um Freiheit, die Google nicht schlägt". PC Welt. 2011-12-03. Abgerufen 2012-04-16.
- ^ "Ich entwickle eUn P2P-Basierende Suchmaschine. Wer MACHT MIT?". Heise online (auf Deutsch). 2003-12-15. Abgerufen 2018-05-09.
- ^ "Yacy Technology Architecture". Yacy.net. Abgerufen 2012-02-14.
- ^ Github: Yacy Grid Crawler, Yacy-Suchmaschine, 2021-02-28, S. Yacy / Yacy_Grid_Crawler, abgerufen 2021-03-11
- ^ Github: Yacy Grid Parser, Yacy-Suchmaschine, 2021-02-28, S. Das Yacy-Gitter ist die Implementierung der zweiten Generation von YACY, abgerufen 2021-03-11
- ^ Github: Yacy -Suche, Yacy-Suchmaschine, 2021-02-28, S. Yacy / Yacy-Search, die von Creme / Yacy-Suche gegabelt wurde, abgerufen 2021-03-11
- ^ "Forum.yacy.de". Abgerufen 6. Juni 2017.
- ^ "Download - Yacy". yacy.net. Abgerufen 2021-07-27.
- ^ "En: debianinstall". Yacywiki. Abgerufen 6. Oktober 2019.
- ^ "Dev: Tasksharing". Yacywiki. Abgerufen 6. Oktober 2019.
- ^ "#452422 - RFP: YACY - Distributed Web Crawler und Suchmaschine". Debian Bug Report Protokolle. Abgerufen 2. Mai 2020.