Gerard Salton
Gerard Salton | |
---|---|
Geboren | 8. März 1927 |
Gestorben | 28. August 1995 (68 Jahre) |
Alma Mater | Harvard Universität |
Bekannt für | Der Vater des Informationsabrufs[1] Gerard Salton Award |
Wissenschaftliche Karriere | |
Felder | Informationsrückgewinnung |
Institutionen | Cornell Universität |
These | Ein automatisches Datenverarbeitungssystem für die öffentliche Versorgungsrevenue Accounting (1958) |
Doktorand | Howard Aiken |
Doktorand |
Gerard A. "Gerry" Salton (8. März 1927 in Nürnberg - 28. August 1995) war Professor von Informatik bei Cornell Universität. Salton war vielleicht der führende Informatiker, der im Bereich von arbeitete Informationsrückgewinnung während seiner Zeit und "der Vater des Informationsabrufs".[1] Seine Gruppe bei Cornell entwickelte die Smart Information Retrieval System, was er initiierte, als er in Harvard war. Es war das allererste System, das das mittlerweile beliebte Vektorraummodell zum Abrufen von Informationen nutzte.
Salton wurde am 8. März 1927 in Gerhard Anton Sahlmann geboren Nürnberg, Deutschland. Er erhielt einen Bachelor (1950) und einen Master (1952) in Mathematik von Brooklyn Collegeund ein Ph.D. aus Harvard in angewandte Mathematik 1958 der letzte von Howard AikenDoktorandenstudenten und dort bis 1965 unterrichtet, als er sich anschloss Cornell Universität und war Mitbegründer seines Abteilung für Informatik.
Salton war vielleicht am bekanntesten für die Entwicklung des inzwischen weit verbreiteten Gebrauchs Vektorraummodell zum Abrufen von Informationen.[2] In diesem Modell werden sowohl Dokumente als auch Abfragen als Vektoren der Begriffszahlen dargestellt, und die Ähnlichkeit zwischen einem Dokument und einer Abfrage wird durch den Cosinus zwischen dem Begriff Vektor und dem Dokumentvektor angegeben. In diesem Artikel stellte er auch vor Tf-idfoder Begriffsfrequenz-Invers-Dokument-Häufigkeit, ein Modell, bei dem die Punktzahl eines Begriffs in einem Dokument das Verhältnis der Anzahl der Begriffe in diesem Dokument ist, geteilt durch die Häufigkeit der Anzahl der Dokumente, in denen dieser Begriff auftritt. (Das Konzept der umgekehrten Dokumentfrequenz, ein Maß für die Spezifität, wurde 1972 von 1972 eingeführt Karen Sparck-Jones.[3]) Später im Leben interessierte er sich für automatische Textübersicht und -analyse.[4] sowie automatische Hypertextgenerierung.[5] Er veröffentlichte während seines Lebens über 150 Forschungsartikel und 5 Bücher.
Salton war Chefredakteur der Kommunikation der ACM und die Journal of the ACMund geleitet Spezialinteressensgruppe zum Abrufen von Informationen (Sigir). Er war Associate Editor der ACM -Transaktionen auf Informationssystemen. Er war ein ACM Fellow (gewählt 1995),,[6] erhielt eine Preisverleihung von der Amerikanische Gesellschaft für Informationswissenschaft (1989) und war der erste Empfänger des Sigir Award für herausragende Beiträge zum Studium des Informationsabrufs (1983) - jetzt als The The genannt Gerard Salton Award.
Literaturverzeichnis
- Salton, Automatische Informationsorganisation und Abruf, 1968.
- Gerard Salton (1975). Eine Theorie der Indexierung. Gesellschaft für industrielle und angewandte Mathematik. p.56. ISBN 9780898710151.
- --- und Michael J. McGill, Einführung zum modernen Informationsabruf, 1983. ISBN0-07-054484-0
- Gerard Salton (1989). Automatische Textverarbeitung. Addison-Wesley Publishing Company. p.530. ISBN 978-0-201-12227-5.
- Gerard Salton bei DBLP Bibliographieserver
- G. Salton, A. Wong und C. S. Yang (1975), ","Ein Vektorraummodell für die automatische Indizierung, " Kommunikation der ACM, vol. 18, nr. 11, Seiten 613–620. (Artikel, in dem ein Vektorraummodell vorgestellt wurde)
Siehe auch
Verweise
- ^ a b "Der Vater des Informationsabrufs" (PDF). cs.cornell.edu. Abgerufen 10. März 2015.
Gründungsmitglied der Abteilung und der Vater des Informationsabrufs.
- ^ Salton, G.; Wong, a.; Yang, C. S. (1975). "Ein Vektorraummodell für die automatische Indizierung". Kommunikation der ACM. 18 (11): 613. doi:10.1145/361219.361220. HDL:1813/6057. S2CID 6473756.
- ^ Spärck Jones, K. (1972). "Eine statistische Interpretation der Begriffspezifität und ihre Anwendung beim Abrufen". Journal of Dokumentation. 28: 11–21. Citeseerx 10.1.1.115.8343. doi:10.1108/eb026526.
- ^ Salton, G.; Allan, J.; Buckley, C.; Singhal, A. (1994). "Automatische Analyse, Themengenerierung und Zusammenfassung maschinenlesbarer Texte". Wissenschaft. 264 (5164): 1421–1426. Bibcode:1994sci ... 264.1421s. doi:10.1126/science.264.5164.1421. PMID 17838425. S2CID 32296317.
- ^ "Gerard Salton". Cs.cornell.edu. Abgerufen 2013-09-14.
- ^ "Gerard Salton ACM Fellows 1995". ACM.org. Abgerufen 10. März 2015.
Beiträge über 30 Jahre zur Informationsorganisation und Abruf
Externe Links
- In Memoriam
- Fraktale des Wandels: Durchsuchen Sie die Vergangenheit
- Das einflussreichste Papier, das Gerard Salton nie geschrieben hat - Dieses 2004er Bibliothekstrends Papier von David Dubin dient als historische Überprüfung der Metamorphose des Begriffs Diskriminierungswertmodells (TDV) in das Vektorraummodell als Informationsabrufmodell (VSM als IR -Modell). Dieses Papier stellt in Frage, was die Forschungsgemeinschaft des Informationsabrufs glaubte, dass das Vektor -Raummodell von Salton ursprünglich modelliert war. Was viel später zu einem Informationsabrufmodell wurde, war ursprünglich ein datenzentriertes mathematisches und computationales Modell, das als erklärendes Gerät verwendet wurde. Darüber hinaus weist Dubins Papier darauf hin, dass ein zitiertes Saltonpapier von 1975 nicht existiert, aber wahrscheinlich eine Kombination aus zwei anderen Papieren ist, von denen sich keiner tatsächlich auf das VSM als IR -Modell bezieht.