Maschinenlesbares Wörterbuch

Maschinenlesbares Wörterbuch (MRD) ist ein Wörterbuch Speichern Sie als Computerdaten (Computer), anstatt auf Papier gedruckt zu werden. Es ist ein elektronisches Wörterbuch und lexikalische Datenbank.

Ein maschinenlesbares Wörterbuch ist ein Wörterbuch in elektronischer Form, das in einer Datenbank geladen und über Anwendungssoftware abgefragt werden kann. Es kann sich um ein einsprachiges Erklärungswörterbuch oder ein Multisprachler-Wörterbuch zur Unterstützung von Übersetzungen zwischen zwei oder mehr Sprachen oder einer Kombination aus beiden handeln. Übersetzungssoftware zwischen mehreren Sprachen wenden normalerweise bidirektionale Wörterbücher an. Eine MRD kann ein Wörterbuch mit einer proprietären Struktur sein, die von dedizierter Software (z. Anwendungen. Konventionelle Wörterbücher enthalten a Lemma mit verschiedenen Beschreibungen. Ein maschinenlesbares Wörterbuch kann zusätzliche Funktionen haben und wird daher manchmal als intelligentes Wörterbuch bezeichnet. Ein Beispiel für ein intelligentes Wörterbuch ist die Open Source Gellish English Dictionary.
Der Begriff Wörterbuch wird auch verwendet, um sich auf eine elektronische zu beziehen Wortschatz oder Lexikon wie zum Beispiel in verwendet in Rechtschreibprüfung. Wenn Wörterbücher in einer Subtyp-Supertype-Hierarchie von Konzepten (oder Begriffen) angeordnet sind, wird es a genannt Taxonomie. Wenn es auch andere Beziehungen zwischen den Konzepten enthält, wird es als als bezeichnet Ontologie. Suchmaschinen können entweder ein Wortschatz, eine Taxonomie oder eine Ontologie verwenden, um die Suchergebnisse zu optimieren. Spezialisierte elektronische Wörterbücher sind Morphologische Wörterbücher oder syntaktische Wörterbücher.

Der Begriff MRD wird oft im Gegensatz zu stehen NLP Wörterbuch in dem Sinne, dass eine MRD die elektronische Form eines Wörterbuchs ist, das zuvor auf dem Papier gedruckt wurde. Obwohl beide von Programmen verwendet werden, wird der Begriff NLP -Wörterbuch bevorzugt, wenn das Wörterbuch unter Berücksichtigung von NLP von Grund auf neu gebaut wurde. Ein ISO -Standard für MRD und NLP kann beide Strukturen darstellen und heißt Lexikaler Markup -Framework.[1]

Geschichte

Die ersten weit verbreiteten MRDs waren das Merriam-Webster Seventh Collegiate (W7) und das Merriam-Webster New Pocket Dictionary (MPD). Beide wurden von einem von der Regierung finanzierten Projekt bei produziert Systementwicklungsgesellschaft Unter der Leitung von John Olney. Sie wurden manuell tastaturiert, da keine Typen der Bänder eines beiden Buches verfügbar waren. Ursprünglich wurde jeder auf mehreren Rollen von Magnetband als Kartenbilder mit jedem separaten Wort jeder Definition auf einer separaten Stanzkarte mit zahlreichen speziellen Codes verteilt, die die Details ihrer Verwendung im gedruckten Wörterbuch angeben. Olney skizzierte einen großen Plan für die Analyse der Definitionen im Wörterbuch, sein Projekt lief jedoch ab, bevor die Analyse durchgeführt werden konnte. Robert Amsler an der Universität von Texas in Austin nahm die Analyse wieder auf und absolvierte eine taxonomische Beschreibung des Taschenwörterbuchs unter Nationale Wissenschaftsstiftung Die Finanzierung, sein Projekt lief jedoch ab, bevor die taxonomischen Daten verteilt werden konnten. Roy Byrd et al. Bei IBM Yorktown Heights wurde die Analyse des siebten Collegiate des Webster nach Amslers Arbeit wieder aufgenommen. Schließlich in den 1980er Jahren beginnend mit der ersten Unterstützung von Bellcore und später von verschiedenen US -Bundesbehörden, einschließlich NSF, finanziert, Arda, DARPA, Dtound Reflex, George Armitage Miller und Christiane Fellbaum an der Princeton University absolvierte die Schaffung und breite Verteilung eines Wörterbuchs und seine Taxonomie in der Wordnet Das Projekt, das heute die am weitesten verbreitete rechnerische Lexikologie -Ressource ist.

Verweise

  1. ^ Gil Francopoulo (herausgegeben von) LMF Lexical Markup Framework, ISTE / Wiley 2013 ( ISBN978-1-84821-430-9)