Apache Lucene

Lucene
Apache Lucene logo.svg
Entwickler (en) Apache Software Foundation
Erstveröffentlichung 1999; Vor 23 Jahren
Stabile Version
9.3.0 / 29. Juli, 2022; Vor 0 Tagen[1]
Repository
Geschrieben in Java
Betriebssystem Plattformübergreifend
Typ Suche und Index
Lizenz Apache -Lizenz 2.0
Webseite Lucene.Apache.org

Apache Lucene ist ein frei und offen Suchmaschine Softwarebibliothek, ursprünglich geschrieben in Java durch Doug schneiden. Es wird von der unterstützt Apache Software Foundation und wird unter dem freigelassen Apache -Software -Lizenz. Lucene wird häufig als Standardgrundlage für Nichtforschungssuchanwendungen verwendet.[2][3][4]

Lucene wurde auf andere Programmiersprachen einschließlich der Teilnahme an Objekt Pascal, Perl, C#, C ++, Python, Rubin und Php.[5]

Geschichte

Doug schneiden Ursprünglich schrieb Lucene 1999.[6] Lucene war seine fünfte Suchmaschine, nachdem er zuvor zwei im Xerox -Parc, eines bei Apple und einem vierten bei ERRITE geschrieben hatte.[7] Es wurde zunächst zum Download von zu Hause in der verfügbar SourceForge Webseite. Es schloss sich der Apache Software Foundation an Jakarta Familie der Open-Source-Java-Produkte im September 2001 und wurde im Februar 2005 ein eigenes Apache-Projekt auf höchstem Niveau.[8]

Lucene enthielt früher eine Reihe von Unterprojekten wie Lucene.net, Mahout, Tika und Nutsch. Diese drei sind jetzt unabhängige Projekte auf höchster Ebene.

Im März 2010 die Apache Solr Der Suchserver, der als Lucene-Unterprojekt beigetragen wurde und die Entwicklergemeinschaften verschmelzen.

Version 4.0 wurde am 12. Oktober 2012 veröffentlicht.[9]

Im März 2021 änderte Lucene sein Logo und Apache Solr Wurde wieder ein Apache -Projekt auf höchster Ebene, unabhängig von Lucene.

Merkmale und gemeinsame Verwendung

Zwar für jede Anwendung geeignet, für die Volltext erforderlich ist Indizierung und die Suche nach Fähigkeiten wird Lucene für seinen Nutzen bei der Umsetzung von anerkannt Internet -Suchmaschinen und lokale Suchen in Einzel-Site.[10][11]

Lucene enthält eine Funktion für eine Fuzzy -Suche basierend auf Entfernung bearbeiten.[12]

Lucene wurde auch zur Implementierung von Empfehlungssystemen verwendet.[13] Zum Beispiel kann Lucenes "Morelikethis" -Klasse Empfehlungen für ähnliche Dokumente generieren. In einem Vergleich des Begriffs vektorbasierter Ähnlichkeitsansatz von 'Morelikethis' mit zitierbasierten Dokumentenähnlichkeitsmessungen wie z. Co-Zitat Die Analyse der Proximität der Co-Citation Proximity war der Ansatz von Lucene hervorragend, Dokumente mit sehr ähnlichen strukturellen Merkmalen und engeren Verwandtschaft zu empfehlen.[14] Im Gegensatz dazu waren zitierbasierte Dokumenten-Ähnlichkeitsmaßnahmen eher geeignet, um allgemein verwandte Dokumente zu empfehlen.[14] Bedeutung zitierbasierter Ansätze können besser zum Erzeugen geeignet sein Zufall Empfehlungen, solange Dokumente empfohlen werden sollen, enthalten In-Text-Zitate.

Projekte in Lucene

Lucene selbst ist nur eine Indexierungs- und Suchbibliothek und enthält nicht Krabbeln und html Parsing Funktionalität. Mehrere Projekte erweitern jedoch die Fähigkeit von Lucene:

Siehe auch

Verweise

  1. ^ "Willkommen bei Apache Lucene". Lucene ™ News -Abschnitt. Archiviert vom Original am 12. Februar 2020. Abgerufen 12. Februar 2020.
  2. ^ Kamphuis, Chris; de vries, Arjen P.; Boytsov, Leonid; Lin, Jimmy (2020), Jose, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo (Hrsg.), "Welcher BM25 meinst du? Eine großflächige Reproduzierbarkeitsstudie zu Bewertungsvarianten", Fortschritte beim Abrufen von Informationen, Cham: Springer International Publishing, 12036: 28–34, doi:10.1007/978-3-030-45442-5_4, ISBN 978-3-030-45441-8, PMC 7148026, abgerufen 2021-06-07
  3. ^ Grand, Adrien; Muir, Robert; Ferenczi, Jim; Lin, Jimmy (2020), Jose, Joemon M.; Yilmaz, Emine; Magalhães, João; Castells, Pablo (Hrsg.), "Von MaxScore bis Block-Max-Zauberstab: Die Geschichte, wie Lucene die Leistung der Abfragebewertung erheblich verbessert hat", Fortschritte beim Abrufen von Informationen, Cham: Springer International Publishing, 12036: 20–27, doi:10.1007/978-3-030-45442-5_3, ISBN 978-3-030-45441-8, PMC 7148045, abgerufen 2021-06-07
  4. ^ Azzopardi, Leif; Moshfeghi, Yashar; Halvey, Martin; Alkhawaldeh, Rami S.; Balog, Krisztian; Di Buccio, Emanuele; Ceccarelli, Diego; Fernández-Luna, Juan M.; Rumpf, Charlie; Mannix, Jake; Palchowdhury, Sauparna (2017-02-14). "Lucene4ir: Entwicklung von Informationsabruf -Bewertungsressourcen mit Lucene". ACM Sigir Forum. 50 (2): 58–75. doi:10.1145/3053408.3053421. ISSN 0163-5840.
  5. ^ "LuceneImplementationen". apache.org. Archiviert Aus dem Original am 6. Oktober 2015. Abgerufen 23. September 2015.
  6. ^ Keywordanalyzer "Bessere Suche mit Apache Lucene und Solr" (PDF). 19. November 2007. archiviert von das Original (PDF) am 31. Januar 2012.
  7. ^ Schneiden, Doug (2019-06-07). "Ich habe ein paar Suchmaschinen bei Xerox Parc, dann V-Twin bei Apple, geschrieben und dann die Suche von Excite neu geschrieben, dann Lucene. Also könnte Lucene als V-Twin 3,0 angesehen werden. Fast 25 Jahre später lebt V-Twin immer noch, noch lebt V-Twin immer noch V-Twin Auf AS Mac OS X Search Kit! ". @Schneiden. Abgerufen 2019-06-19.
  8. ^ Barker, Deane (2016). Web -Content -Verwaltung. O'Reilly. p. 233. ISBN 978-1491908105.
  9. ^ "Apache Lucene - Willkommen bei Apache Lucene". apache.org. Archiviert Aus dem Original am 4. Februar 2016. Abgerufen 4. Februar 2016.
  10. ^ McCandless, Michael; Hatcher, Erik; Gospodnetić, Otis (2010). Lucene in Action, zweite Ausgabe. Manning. p.8. ISBN 978-1933988177.
  11. ^ "GNU/Linux Semantic Speichersystem" (PDF). GLSCUbe.org. Archiviert von das Original (PDF) Am 2010-06-01.
  12. ^ "Apache Lucene - Parser -Syntax Abfrage". lucene.apache.org. Archiviert vom Original am 2017-05-02.
  13. ^ J. Beel, S. Langer und B. Gipp, „Die Architektur und Datensätze des Research Paper -Empfehlungssystems von Docear“, in Proceedings of the 3. International Workshop zum Mining Scientific Publications (WOSP 2014) auf der ACM/IEEE Joint Conference on Digital Bibliotheken (JCDL 2014), London, Großbritannien, 2014
  14. ^ a b M. Schwarzer, M. Schubotz, N. Meuschke, C. Breiter, V. Marklund B. gipp, https://www.gipp.com/wp-content/papercite-data/pdf/schwarzer2016.pdf "Bewertung von Link-basierten Empfehlungen für Wikipedia" in Proceedings der 16. ACM/IEEE-CS Joint Conference on Digital Libraries (JCDL), New York, NY, USA, 2016, S. 191-200.
  15. ^ "Die Zukunft von Compass & Elasticsearch". Der Typ bleibt. Archiviert von das Original Am 2015-10-15. Abgerufen 2015-10-14.
  16. ^ Wayner, Peter. "11 hochmoderne Datenbanken, die es wert sind, jetzt erkundet zu werden". InfoWorld. Archiviert Aus dem Original am 21. September 2015. Abgerufen 21. September 2015.
  17. ^ "ElasticSearch: RESTFOR, DISTISTIONISCHE Such & Analytics - elastisch". elastic.co. Archiviert Aus dem Original am 8. Oktober 2015. Abgerufen 23. September 2015.
  18. ^ a b Nativividad, Angela. "SocialText Updates Search, geht Kino". CMS -Kabel. Archiviert vom Original am 09.09.2012. Abgerufen 2011-05-31.
  19. ^ Marvin Humphrey. "KinoSearch - Suchmaschinenbibliothek. - metacpan.org". p3rl.org. Abgerufen 23. September 2015.
  20. ^ Diment, Kienen; Trout, Matt S (2009). "Katalysatorkochbuch". Der endgültige Leitfaden zum Katalysator. Apress. p.280. ISBN 978-1-4302-2365-8.
  21. ^ Wishart, D. S.; et al. (Januar 2009). "HMDB: Eine Wissensbasis für das menschliche Metabolom". Nukleinsäuren Res. 37 (Datenbankproblem): D603–10. doi:10.1093/nar/gkn810. PMC 2686599. PMID 18953024.
  22. ^ Lim, Emilia; Pon, Allison; Djoumbou, Yannick; Knox, Craig; Shrivastava, Savita; Guo, ein Chi; Neveu, Vanessa; Wishart, David S. (Januar 2010). "T3DB: Eine umfassend kommentierte Datenbank mit gemeinsamen Toxinen und deren Zielen". Nukleinsäuren Res. 38 (Datenbankproblem): D781–6. doi:10.1093/nar/gkp934. PMC 2808899. PMID 19897546.

Literaturverzeichnis

  • Gospodnetic, otis; Erik Hatcher; Michael McCandless (28. Juni 2009). Lucene in Aktion (2. Aufl.). Manning Publications. ISBN 978-1-9339-8817-7.
  • Gospodnetic, otis; Erik Hatcher (1. Dezember 2004). Lucene in Aktion (1. Aufl.). Manning Publications. ISBN 978-1-9323-9428-3.

Externe Links