Informationsrückgewinnung
Informationsrückgewinnung (Ir) in Computer und Informationswissenschaft ist der Prozess des Erhaltens Informationssystem Ressourcen, die für einen Informationen aus einer Sammlung dieser Ressourcen relevant sind. Suchanfragen können auf basieren voller Text oder andere inhaltsbasierte Indexierung. Informationsabruf ist das Wissenschaft[1] nach Informationen in einem Dokument zu suchen, selbst nach Dokumenten zu suchen und auch nach dem zu suchen Metadaten das beschreibt Daten und für Datenbanken von Texten, Bildern oder Tönen.
Automatisierte Informationsabrufsysteme werden verwendet, um das zu reduzieren, was genannt wurde Informationsüberlastung. Ein IR -System ist ein Softwaresystem, das Zugriff auf Bücher, Zeitschriften und andere Dokumente bietet. Speichert und verwaltet diese Dokumente. Web -Suchmaschinen sind die sichtbarsten IR -Anwendungen.
Überblick
Ein Informationsabrufprozess beginnt, wenn ein Benutzer eine Abfrage in das System eingibt. Abfragen sind formale Aussagen von Informationsanforderungen, beispielsweise Suchzeichenfolgen in Web -Suchmaschinen. Im Informationsabruf identifiziert eine Abfrage ein einzelnes Objekt in der Sammlung nicht eindeutig. Stattdessen können mehrere Objekte mit der Abfrage übereinstimmen, möglicherweise mit unterschiedlichen Grad von Relevanz.
Ein Objekt ist eine Entität, die durch Informationen in einer Inhaltserfassung oder dargestellt wird Datenbank. Benutzerabfragen werden mit den Datenbankinformationen übereinstimmen. Im Gegensatz zu klassischen SQL -Abfragen einer Datenbank können die zurückgegebenen Ergebnisse im Informationsabruf jedoch mit der Abfrage übereinstimmen oder nicht, sodass die Ergebnisse normalerweise eingestuft werden. Dies Rangfolge Die Ergebnisse sind ein wesentlicher Unterschied zur Suche nach Informationen im Vergleich zur Datenbanksuche.[2]
Abhängig von Anwendung Die Datenobjekte können beispielsweise Textdokumente, Bilder, sein,[3] Audio,[4] Gedächniskarten[5] oder Videos. Oft werden die Dokumente selbst nicht direkt im IR -System aufbewahrt oder gespeichert, sondern stattdessen im System durch Dokumente Ersatz- oder Metadaten.
Die meisten IR -Systeme berechnen eine numerische Punktzahl darüber, wie gut jedes Objekt in der Datenbank mit der Abfrage übereinstimmt, und bewerten die Objekte nach diesem Wert. Die Top -Ranking -Objekte werden dann dem Benutzer angezeigt. Der Prozess kann dann iteriert werden, wenn der Benutzer die Abfrage verfeinern möchte.[6]
Geschichte
Es gibt ... eine Maschine namens Univac ... wobei Buchstaben und Figuren als Muster magnetischer Flecken auf einem langen Stahlband codiert werden. Auf diese Weise kann der Text eines Dokuments, dem sein Subjekt -Code -Symbol vorausgeht, aufgezeichnet werden ... die Maschine ... wählt automatisch die Referenzen aus, die auf gewünschte Weise mit einer Geschwindigkeit von 120 Wörtern pro Minute codiert wurden
-J. E. Holmstrom, 1948
Die Idee, Computer zur Suche nach relevanten Informationen zu verwenden, wurde im Artikel populär gemacht As We May Think durch Vannevar Bush 1945.[7] Es scheint, dass Bush von Patenten für eine "statistische Maschine" inspiriert wurde - eingereicht von von Patenten Emanuel Goldberg In den 1920er und 30er Jahren - die nach Dokumenten suchte, die auf Film gespeichert waren.[8] Die erste Beschreibung eines Computers, der nach Informationen suchte, wurde 1948 von Holmstrom beschrieben.[9] Detaillierung einer frühen Erwähnung der Univac Computer. In den 1950er Jahren wurden automatisierte Informationsabrufsysteme eingeführt: einer sogar in der romantischen Komödie von 1957, vorgestellt. Schreibtischset. In den 1960er Jahren wurde die erste große Forschungsgruppe für große Informationsabrufe gebildet von Gerard Salton in Cornell. In den 1970er Jahren wurde gezeigt, dass mehrere verschiedene Abruftechniken bei kleiner Leistung gut abschneiden Textkorpora wie die Cranfield -Sammlung (mehrere tausend Dokumente).[7] Große Abrufsysteme wie das Lockheed-Dialogsystem wurden Anfang der 1970er Jahre in Gebrauch genommen.
1992 das US -Verteidigungsministerium zusammen mit dem Nationales Institut für Standards und Technologie (NIST), kehrte das aus Textabnahmekonferenz (TREC) als Teil des Tipper -Textprogramms. Das Ziel war es, die Informationsabrufgemeinschaft zu untersuchen, indem die Infrastruktur bereitgestellt wurde, die für die Bewertung von Methoden zur Abrufen von Text in einer sehr großen Textsammlung erforderlich war. Diese katalysierte Forschung zu Methoden, die Skala zu riesigen Korpora. Die Einführung von Web -Suchmaschinen hat die Notwendigkeit von sehr großen Abrufsystemen noch weiter erhöht.
Anwendungen
Zu den Bereichen, in denen Informationsabruftechniken eingesetzt werden, gehören (die Einträge befinden sich in jeder Kategorie in alphabetischer Reihenfolge):
Allgemeine Anwendungen
- Digitale Bibliotheken
- Informationsfilterung
- Mediensuche
- Blogsuche
- Bildabruf
- 3D -Abruf
- Musikabruf
- Nachrichtensuche
- Sprachabnahme
- Video -Abruf
- Suchmaschinen
- Seitensuche
- Desktop -Suche
- Enterprise -Suche
- Föderierte Suche
- Mobile Suche
- Soziale Suche
- Web-Suche
Domänenspezifische Anwendungen
- Expertensuche Erkenntnis
- Genomische Informationsabnahme
- Geografisches Informationsabruf
- Informationsabruf für chemische Strukturen
- Informationsabruf in Softwareentwicklung
- Rechtsinformationsabruf
- Vertikale Suche
Andere Abrufmethoden
Methoden/Techniken, bei denen Informationsabruftechniken eingesetzt werden, umfassen:
- Kontüativer Informationsabruf
- Automatische Zusammenfassung
- Zusammengesetzte Term Processing
- Kreuzsprachiger Abruf
- Dokumentklassifizierung
- Spamfilterung
- Frage Beantwortung
Modelltypen
Um relevante Dokumente durch IR -Strategien effektiv abzurufen, werden die Dokumente in der Regel in eine geeignete Darstellung umgewandelt. Jede Abrufstrategie enthält ein bestimmtes Modell für die Darstellungszwecke für Dokumenten. Das Bild rechts zeigt die Beziehung einiger gängiger Modelle. Im Bild werden die Modelle nach zwei Dimensionen kategorisiert: der mathematischen Basis und den Eigenschaften des Modells.
Erste Dimension: mathematische Grundlage
- Theoretisch Modelle repräsentieren Dokumente als Sets von Wörtern oder Phrasen. Ähnlichkeiten werden normalerweise aus set-theoretischen Operationen an diesen Sätzen abgeleitet. Gemeinsame Modelle sind:
- Algebraische Modelle Dokumente und Abfragen darstellen normalerweise als Vektoren, Matrizen oder Tupeln. Die Ähnlichkeit des Abfragevektors und des Dokumentvektors wird als skalarer Wert dargestellt.
- Probabilistische Modelle Behandeln Sie den Prozess des Dokumentenabrufs als probabilistische Inferenz. Ähnlichkeiten werden als Wahrscheinlichkeit berechnet, dass ein Dokument für eine bestimmte Abfrage relevant ist. Probabilistische Theoreme wie die Bayes 'Theorem werden oft in diesen Modellen verwendet.
- Binärer Unabhängigkeitsmodell
- Probabilistisches Relevanzmodell auf welches basiert die Okapi (BM25) Relevanzfunktion
- Ungewisse Schlussfolgerung
- Sprachmodelle
- Divergenz-From-Randomness-Modell
- Latent Dirichlet Allocation
- Merkmalsbasierte Abrufmodelle Dokumente als Vektoren von Werten von anzeigen Feature -Funktionen (oder nur Merkmale) und suchen den besten Weg, um diese Merkmale zu einer einzigen Relevanzbewertung zu kombinieren, typischerweise von Rang lernen Methoden. Feature -Funktionen sind willkürliche Funktionen von Dokument und Abfrage und können als solches problemlos fast jedes andere Abrufmodell als eine weitere Funktion einbeziehen.
Zweite Dimension: Eigenschaften des Modells
- Modelle ohne Terminabendenzen Behandle verschiedene Begriffe/Wörter als unabhängig. Diese Tatsache wird normalerweise in Vektorraummodellen durch die dargestellt Orthogonalität Annahme von Begriffsvektoren oder in probabilistischen Modellen von einem Unabhängigkeit Annahme für Termvariablen.
- Modelle mit immanenten Begriff Interdependenzen Ermöglichen Sie eine Darstellung von Interdependenzen zwischen den Begriffen. Der Grad der Interdependenz zwischen zwei Begriffen wird jedoch durch das Modell selbst definiert. Es wird normalerweise direkt oder indirekt abgeleitet (z. B. durch Dimensionsreduktion) von dem Auftreten dieser Begriffe in der gesamten Reihe von Dokumenten.
- Modelle mit transzendenten Begriffen Interdependenzen Erlauben Sie eine Darstellung von Interdependenzen zwischen den Begriffen, behaupten jedoch nicht, wie die Interdependenz zwischen zwei Begriffen definiert ist. Sie sind eine externe Quelle für den Grad der Interdependenz zwischen zwei Begriffen. (Zum Beispiel ein menschlicher oder ausgefeilter Algorithmen.)
Leistung und Korrektheit Maßnahmen
Die Bewertung eines Informationsabrufsystems ist der Prozess der Bewertung, wie gut ein System den Informationsbedarf seiner Benutzer erfüllt. Im Allgemeinen berücksichtigt die Messung eine Sammlung von Dokumenten, die durchsucht werden sollen, und eine Suchabfrage. Herkömmliche Bewertungsmetriken, entwickelt für Boolean Abruf[Klarstellung erforderlich] oder Top-K-Abruf, einschließlich Präzision und Rückruf. Alle Maßnahmen nehmen a an Grundwahrheit Relevanzbegriff: Jedes Dokument ist für eine bestimmte Abfrage entweder relevant oder nicht relevant. In der Praxis können Anfragen sein schlecht gepasiert Und es kann unterschiedliche Relevanztöne geben.
Zeitleiste
- Vor dem 1900er Jahre
- 1801: Joseph Marie Jacquard erfindet die Jacquard Loom, Die erste Maschine, die Lochkarten verwendet, um eine Abfolge von Operationen zu steuern.
- 1880er Jahre: Herman Hollerith Erfindet einen elektro-mechanischen Datentabulator mit Punchkarten als maschinenlesbares Medium.
- 1890 Hollerith Karten, Tastaturen und Tabulatoren verwendet, um die zu verarbeiten 1890 US -Volkszählung Daten.
- 1920er bis 1930er Jahre
- Emanuel Goldberg Ergibt Patente für seine "statistische Maschine" eine Dokumentsuchmaschine, in der photoelektrische Zellen und Mustererkennung verwendet wurden, um die Metadaten auf Rollen von Mikrofilmdokumenten zu durchsuchen.
- 1940er bis 1950er Jahre
- Ende der 1940er Jahre: Das US -Militär konfrontierte Probleme beim Indexieren und Abrufen von wissenschaftlichen Forschungsdokumenten in Kriegszeiten, die von Deutschen erfasst wurden.
- 1945: Vannevar Bush's As We May Think erschien in Atlantic Monthly.
- 1947: Hans Peter Luhn (Forschungsingenieur bei IBM seit 1941) begann mit der Arbeit an einem mechanisierten Punch-Karten-basierten System zur Suche nach chemischen Verbindungen.
- 1950er Jahre: Wachsende Besorgnis in den USA um eine "Wissenschaftslücke" mit der UdSSR motiviert, ermutigte die Finanzierung und bot einen Hintergrund für mechanisierte Literatursuchsysteme (Allen Kent et al.) und die Erfindung der Zitierindex durch Eugene Garfield.
- 1950: Der Begriff "Informationsabruf" wurde von geprägt von Calvin Mooers.[10]
- 1951: Philip Bagley führte das früheste Experiment im computergestützten Dokumentenabruf in einer Master -These bei MIT.[11]
- 1955: Allen Kent schloss sich an Fall Western Reserve Universityund wurde schließlich Associate Director des Zentrums für Dokumentation und Kommunikationsforschung. Im selben Jahr veröffentlichten Kent und Kollegen ein Papier in amerikanischer Dokumentation, in dem die Präzisions- und Rückrufmaßnahmen beschrieben wurden, sowie ein vorgeschlagenes "Rahmen" zur Bewertung eines IR -Systems, das statistische Stichprobenmethoden zur Bestimmung der Anzahl der nicht abgerufenen relevanten Dokumente enthielt.[12]
- 1958: Internationale Konferenz über wissenschaftliche Informationen Washington DC beinhaltete die Berücksichtigung von IR -Systemen als Lösung für identifizierte Probleme. Sehen: Proceedings der Internationalen Konferenz über wissenschaftliche Information, 1958 (National Academy of Sciences, Washington, DC, 1959)
- 1959: Hans Peter Luhn Veröffentlicht "Auto-Kodierung von Dokumenten zum Abrufen von Informationen".
- Ende der 1940er Jahre: Das US -Militär konfrontierte Probleme beim Indexieren und Abrufen von wissenschaftlichen Forschungsdokumenten in Kriegszeiten, die von Deutschen erfasst wurden.
- 1960er Jahre:
- frühe 1960er Jahre: Gerard Salton begann mit der Arbeit an IR in Harvard und zog später nach Cornell.
- 1960: Melvin Earl Maron und John Lary Kuhns[13] Veröffentlicht "Relevanz, probabilistische Indexierung und Informationsabruf" im Journal of the ACM 7 (3): 216–244, Juli 1960.
- 1962:
- Cyril W. Cleverdon Veröffentlichte frühe Ergebnisse der Cranfield -Studien und entwickelte ein Modell für die IR -Systembewertung. Siehe: Cyril W. Cleverdon, "Bericht über die Prüfung und Analyse einer Untersuchung der vergleichenden Effizienz von Indexierungssystemen". Cranfield Collection of Aeronautics, Cranfield, England, 1962.
- Kent veröffentlicht Informationsanalyse und Abruf.
- 1963:
- Weinberg berichtet "Wissenschaft, Regierung und Informationen" gaben eine vollständige Artikulation der Idee einer "Krise wissenschaftlicher Informationen". Der Bericht wurde nach Dr. benannt Alvin Weinberg.
- Joseph Becker und Robert M. Hayes Veröffentlichter Text zum Abrufen von Informationen. Becker, Joseph; Hayes, Robert Mayo. Informationsspeicherung und -abruf: Tools, Elemente, Theorien. New York, Wiley (1963).
- 1964:
- Karen Spärck Jones beendete ihre These in Cambridge, Synonymie und semantische Klassifizierungund fuhr fort Computerlinguistik wie es für IR gilt.
- Das Nationales Büro für Standards sponserte ein Symposium mit dem Titel "Statistische Assoziationsmethoden zur mechanisierten Dokumentation". Mehrere hochwertige Artikel, darunter G. Saltons erste veröffentlichte Referenz (wir glauben) auf die CLEVER System.
- Mitte der 1960er Jahre:
- Nationalbibliothek der Medizin entwickelt Medlare Analyse und Abrufsystem für medizinische Literatur, das erste wichtige maschinenlesbare Datenbank und das Batch-Retrival-System.
- Projekt Intrex am MIT.
- 1965: J. C. R. Licklider veröffentlicht Bibliotheken der Zukunft.
- 1966: Don Swanson war an Studien an der University of Chicago über Anforderungen an zukünftige Kataloge beteiligt.
- Ende der 1960er Jahre: F. Wilfrid Lancaster Abschluss der Evaluierungsstudien des Medlars -Systems und veröffentlichte die erste Ausgabe seines Textes zum Abrufen von Informationen.
- 1968:
- Gerard Salton veröffentlicht Automatische Informationsorganisation und Abruf.
- John W. Sammon, Jr.'s RADC -Tech -Bericht "Einige Mathematik des Informationsspeichers und -abrufs ..." skizzierte das Vektormodell.
- 1969: Sammon's "Eine nichtlineare Zuordnung für die Datenstrukturanalyse"(IEEE -Transaktionen auf Computern) war der erste Vorschlag für die Visualisierungsschnittstelle zu einem IR -System.
- 1970er Jahre
- frühe 1970er Jahre:
- Erste Online-Systeme-NLMs AIM-TWX, Medline; Lockheeds Dialog; SDC -Umlaufbahn.
- Theodor Nelson Förderung des Konzepts von Hypertext, veröffentlicht Computer Lib/Traummaschinen.
- 1971: Nicholas Jardine und Cornelis J. van Rijsbergen Veröffentlicht "Die Verwendung von hierarchischer Clustering im Informationsabruf", das die "Cluster -Hypothese" artikulierte.[14]
- 1975: Drei hoch einflussreiche Veröffentlichungen von Salton haben seinen Vektorverarbeitungsrahmen vollständig artikuliert und Begriff Diskriminierung Modell:
- 1978: Der Erste ACM Sigir Konferenz.
- 1979: C. J. Van Rijsbergen veröffentlicht Informationsrückgewinnung (Butterworths). Starker Schwerpunkt auf probabilistischen Modellen.
- 1979: Tamas doszkocs implementierten das Zitat Benutzeroberfläche für natürliche Sprache für Medline in der National Library of Medicine. Das CITE -System unterstützte die Eingabe von Abfragen, die Ausgabe und Relevanz -Feedback der Freiformform.[15]
- frühe 1970er Jahre:
- 1980er Jahre
- 1980: Erste internationale ACM Sigir -Konferenz, gemeinsam mit der British Computer Society IR Group in Cambridge.
- 1982: Nicholas J. BelkinRobert N. Oddy und Helen M. Brooks schlugen den Ask -Standpunkt (anomaler Wissensstand) zum Abrufen von Informationen vor. Dies war ein wichtiges Konzept, obwohl sich ihr automatisiertes Analysetool letztendlich enttäuschend erwies.
- 1983: Salton (und Michael J. McGill) veröffentlicht Einführung zum modernen Informationsabruf (McGraw-Hill) mit starkem Schwerpunkt auf Vektormodellen.
- 1985: David Blair und Bill Maron Veröffentlichung: Eine Bewertung der Abrufwirksamkeit für ein Volltext-Dokument-Retrival-System
- Mitte der 1980er Jahre: Bemühungen, Endbenutzerversionen von kommerziellen IR-Systemen zu entwickeln.
- 1985–1993: Schlüsselpapiere und experimentelle Systeme für Visualisierungsschnittstellen.
- Arbeit von Donald B. Crouch, Robert R. Korfhage, Matthew Chalmers, Anselm Spoerri und andere.
- 1989: Zuerst Weltweites Netz Vorschläge von Tim Berners-Lee bei Cern.
- 1990er Jahre
- 1992: Zuerst TREC Konferenz.
- 1997: Veröffentlichung von Korfhage's Speicherung und Abrufinformation[16] mit Schwerpunkt auf Visualisierungs- und Multi-Referenzpunkt-Systemen.
- 1999: Veröffentlichung von Ricardo Baeza-yates und Berthier Ribeiro-Neto's Modernes Informationsabruf von Addison Wesley, dem ersten Buch, das versucht, alle IRs zu behandeln.
- Ende der 1990er Jahre: Web -Suchmaschinen Implementierung vieler Merkmale, die früher nur in experimentellen IR -Systemen gefunden wurden. Suchmaschinen werden die häufigste und vielleicht beste Instanziierung von IR -Modellen.
Hauptkonferenzen
- Sigir: Konferenz über Forschung und Entwicklung im Informationsabruf
- ECIR: Europäische Konferenz zum Abrufen von Information
- Cikm: Konferenz über Informations- und Wissensmanagement
- Www: Internationale World Wide Web Conference
- WSDM: Konferenz über Websuche und Data Mining
- ICTIR: Internationale Konferenz über Theorie des Informationsabrufs
Auszeichnungen im Feld
Siehe auch
- Kontüativer Informationsabruf- Informationsabrufstrategien in Datensätzen
- Computerspeicher- Gerät, das auf einem Computer zum Speichern von Daten verwendet wird
- Kontrolliertes Wortschatz- Methode zur Organisation von Wissen
- Cross-Language Information Abruf
- Data Mining- Prozess des Extrahierens und Entdeckens von Mustern in großen Datensätzen
- Europäische Sommerschule im Informationsabruf
- Informationsabruf von Menschen und Computer(HCIR)
- Informationsextraktion- Maschinenlesung unstrukturierter Dokumente
- Informationssuche- Prozess oder Aktivität des Versuchs, Informationen in menschlichen und technologischen Kontexten zu erhalten
- Information Retrieval Facility
- Wissensvisualisierung
- Multimedia Information Abruf
- Personalinformationsmanagement- Tools und Systeme zum Verwalten der eigenen Daten
- Abfrageverständnis
- Relevanz (Informationsabruf)
- Relevanz -Feedback
- Rocchio -Klassifizierung
- Suchmaschinenindizierung
- Spezialinteressensgruppe zum Abrufen von Informationen
- Subjektindexierung
- Temporalinformation Abruf
- tf -idf- Nummer, die die Bedeutung eines Wortes für ein Dokument in einem Korpus widerspiegelt
- XML -Abruf
- Webabbau
Verweise
- ^ Luk, R. W. P. (2022). "Warum ist Informationsabruf eine wissenschaftliche Disziplin?". Grundlagen der Wissenschaft. 27 (2): 427–453. doi:10.1007/s10699-020-09685-x.
- ^ Jansen, B. J. und Rieh, S. (2010) Die siebzehn theoretischen Konstrukte von Informationssuche und Informationsabruf Archiviert 2016-03-04 bei der Wayback -Maschine. Journal der American Society for Information Sciences and Technology. 61 (8), 1517-1534.
- ^ Goodrum, Abby A. (2000). "Abruf von Bildinformationen: Ein Überblick über die aktuelle Forschung". Wissenschaft informieren. 3 (2).
- ^ Foote, Jonathan (1999). "Ein Überblick über das Abrufen von Audioinformationen". Multimedia -Systeme. 7: 2–10. Citeseerx 10.1.1.39.6339. doi:10.1007/s005300050106. S2CID 2000641.
- ^ Beel, Jöran; Gipp, Bela; Stiller, Jan-Olaf (2009). Informationsabruf auf Mind Maps - Wofür könnte es gut sein?. Proceedings der 5. Internationalen Konferenz über Collaborative Computing: Networking, Anwendungen und Worksharing (Collaboratecom'09). Washington, DC: IEEE. Archiviert von das Original Am 2011-05-13. Abgerufen 2012-03-13.
- ^ Frakes, William B.; Baeza-yates, Ricardo (1992). Datenstrukturen und Algorithmen zum Abrufen von Informationsabrechnungen. Prentice-Hall, Inc. ISBN 978-0-13-463837-9. Archiviert von das Original 2013-09-28.
- ^ a b Singhal, Amit (2001). "Modernes Informationsabruf: Eine kurze Übersicht" (PDF). Bulletin des technischen Komitees der IEEE Computer Society für Data Engineering. 24 (4): 35–43.
- ^ Mark Sanderson & W. Bruce Croft (2012). "Die Geschichte der Informationsabrufforschung". Proceedings of the IEEE. 100: 1444–1451. doi:10.1109/jproc.2012.2189916.
- ^ Je Holmstrom (1948). "'Abschnitt III. Eröffnung der Plenarsitzung ". Die Royal Society Scientific Information Conference, 21. Juni 2. Juli 1948: Bericht und Papiere eingereicht: 85.
- ^ Mooers, Calvin N.; Die Theorie des digitalen Umgangs mit nicht numerischen Informationen und ihrer Auswirkungen auf die Maschinenwirtschaftswissenschaften (Zator Technical Bulletin Nr. 48), zitiert in Fairthorne, R. A. (1958). "Automatisches Abrufen von aufgezeichneten Informationen". Das Computerjournal. 1 (1): 37. doi:10.1093/comjnl/1.1.36.
- ^ Doyle, Lauren; Becker, Joseph (1975). Informationsabruf und Verarbeitung. Melville. S. 410 pp. ISBN 978-0-471-22151-7.
- ^ Perry, James W.; Kent, Allen; Berry, Madeline M. (1955). "Maschinenliteratur suchen X. Maschinensprache; Faktoren, die ihrem Design und der Entwicklung zugrunde liegen". Amerikanische Dokumentation. 6 (4): 242–254. doi:10.1002/ASI.5090060411.
- ^ Maron, Melvin E. (2008). "Eine historische Anmerkung zu den Ursprüngen der probabilistischen Indexierung" (PDF). Informationsverarbeitung und -verwaltung. 44 (2): 971–972. doi:10.1016/j.ipm.2007.02.012.
- ^ N. Jardine, C. J. Van Rijsbergen (Dezember 1971). "Die Verwendung eines hierarchischen Clustering im Informationsabruf". Speicherung und Abrufinformation. 7 (5): 217–240. doi:10.1016/0020-0271 (71) 90051-9.
- ^ Doszkocs, T.E. & Rapp, B.A. (1979). "Durchsuchen von Medline in Englisch: Ein Prototyp-Benutzer-Inter-Face mit natürlicher Sprachabfrage, Rangliste und Relevanz-Feedback", in: Proceedings of the ASIS-Jahresversammlung, 16: 131-139.
- ^ Korfhage, Robert R. (1997). Speicherung und Abrufinformation. Wiley. pp.368 PP. ISBN 978-0-471-14338-3.
Weitere Lektüre
- Ricardo Baeza-Yates, Berthier Ribeiro-Neto. Modernes Informationsabruf: Die Konzepte und Technologie hinter der Suche (zweite Ausgabe). Addison-Wesley, Großbritannien, 2011.
- Stefan Büttcher, Charles L. A. Clarke und Gordon V. Cormack. Informationsabruf: Implementierung und Bewertung von Suchmaschinen. MIT Press, Cambridge, Massachusetts, 2010.
- "Informationsabrufsystem". Bibliotheks- und Informationswissenschaftsnetzwerk. 24. April 2015.
- Christopher D. Manning, Prabhakar Raghavan und Hinrich Schütze. Einführung zum Informationsabruf. Cambridge University Press, 2008.
Externe Links
- ACM SIGIR: Information Abrufenspezifische Interessengruppe
- BCS IRSG: British Computer Society - Fachgruppe für Informationsabrufe
- Textabnahmekonferenz (TREC)
- Forum für Informationsabrufbewertung (Feuer)
- Informationsrückgewinnung (Online -Buch) von C. J. Van Rijsbergen
- Informations -Abruf -Wiki
- Information Retrieval Facility
- Informationsabruf @ duth
- TREC -Bericht über Informationsabruf -Bewertungstechniken
- Wie eBay die Suchrelevanz misst
- Informationsabruf -Leistungsbewertungsinstrument @ Athena Research Center