Lemma (Morphologie)
Im Morphologie und Lexikographie, a Lemma (Plural Lemmas oder lemmata) ist der kanonische Form,[1] Wörterbuchform, oder Zitierform von einem Satz von Wörter.[2] Im Englisch, zum Beispiel, Unterbrechung, geht kaputt, Pleite, gebrochen und Brechen sind Formen derselben Lexeme, mit Unterbrechung als das Lemma, durch das sie indiziert sind. Lexemebezieht sich in diesem Zusammenhang auf den Satz aller gebogenen oder abwechselnden Formen im Paradigma eines einzelnen Wortes, und Lemma Bezieht sich auf die jeweilige Form, die durch die Konvention ausgewählt wird, um das Lexem darzustellen. Lemmas haben in hohem Maße eine besondere Bedeutung gebogene Sprachen wie zum Beispiel Arabisch, Türkisch und Russisch. Der Prozess der Bestimmung des Lemma für ein bestimmtes Wort heißt genannt Lemmatisierung. Das Lemma kann als Chef der angesehen werden Hauptteileobwohl die Lemmatisierung zumindest teilweise willkürlich ist.
Morphologie
Die Form eines Wortes, das ausgewählt wird, um als Lemma zu dienen markiert Form, aber es gibt mehrere Ausnahmen wie die Verwendung des Infinitivs für Verben in einigen Sprachen.
Für Englisch die Zitierform von a Substantiv ist der Singular: Maus statt Mäuse. Für MultiWord -Lexeme, die enthalten Possessive Adjektive oder ReflexivpronomenDie Zitierform verwendet eine Form der unbestimmtes Pronomen eines: sein Bestes geben, sich selbst verständigen. In europäischen Sprachen mit grammatikalisches GeschlechtDie Zitierform von regulären Adjektiven und Substantiven ist normalerweise der männliche Singular. Wenn die Sprache auch hat FälleDie Zitierform ist oft der männliche singuläre Nominative.
Für viele Sprachen die Zitierform von a Verb ist der Infinitiv: Französisch aller, Deutsch gehen, Hindustani जाना/جانا, Spanisch ir. Für Englisch fällt dies normalerweise mit der unbefestigten, am wenigsten markierten Form des Verbs (dh "Break", nicht "Breaks" oder "Breaking") zusammen, aber die Gegenwart wird für einige verwendet defekte Verben (soll, kann, und muss nur eine Form haben). Zum Latein, Altgriechisch, Modernes Griechisch, und bulgarisch Die erste Person einzigartig Gegenwart wird traditionell verwendet, aber einige moderne Wörterbücher verwenden stattdessen den Infinitiv. (Bulgarisch fehlte Infinitive. Für Vertragsverben Im alten Griechischen wird eine nicht vertragliche erste Person Singular Presse verwendet, um den Vertragsvokal zu enthüllen: φιλέω Philéō zum φιλῶ Philō "Ich liebe" [impliziert Zuneigung]; ἀγαπάω Agapáō zum ἀγαπῶ Agapō "Ich liebe" [Rücksicht]). finnisch Wörterbücher listen Verben nicht unter ihrer Wurzel, sondern unter dem ersten Infinitiv, markiert mit -(t) a, -(t) ä.
Zum japanischDie Nicht-Past-(gegenwärtige und Zukunft) wird verwendet. Zum Arabisch Das einzelne männliche Männlichkeit der Vergangenheit/Perfekte ist die am wenigsten markierte Form und wird für Einträge in modernen Wörterbüchern verwendet. In älteren Wörterbüchern, die immer noch häufig verwendet werden, die triliteral Von dem Wort wird entweder ein Verb oder ein Substantiv verwendet. Dies ist ähnlich wie hebräisch, der auch die einzigartige männliche perfekte Form der dritten Person verwendet, z. ברא Bara ' erstellen, כפר KAPHAR leugnen. georgisch verwendet die Verbalsubstantiv. Zum Koreanisch, -da ist am Stiel befestigt.
In dem Tamilisch, ein agglutinative Sprache, der Verb -Stamm wird oft zitiert, z. B., இரு
Im irisch, Wörter werden von Fall (Genitiv, Nominativ, Dativ und Vokativ) und durch ihren Platz innerhalb eines Satzes aufgrund ihres Platzes stark abgeschnitten Anfangsmutationen. Das Nomen CainteoirDas Lemma für das Substantiv "Sprecher" hat eine Vielzahl von Formen: Chainteoir, gcainteoir, Cainteora, Chainteora, Cainteoirí, chainteoirí und gcainteoirí.
Einige Sätze werden in einer Art Lemma zitiert: Carthago Delenda Est (buchstäblich "Karthago muss zerstört werden") ist eine häufige Art des Zitierens Cato, aber was er sagte, war näher zu Censeo Carthaginem Esse Delendam ("Ich halte Karthago, um Zerstörung zu brauchen").
Lexikographie
In einem Wörterbuch repräsentiert das Lemma "Go" die gebeugt Formulare "Go", "Goes", "Going", "Gent" und "Gone". Die Beziehung zwischen einer gebogenen Form und seinem Lemma wird normalerweise durch eine Winkelklammer bezeichnet, z. B. "GET" <"go". Natürlich ist der Nachteil solcher Vereinfachungen die Unfähigkeit, eine abgelehnte oder konjugierte Form des Wortes zu betrachten, aber einige Wörterbücher wie Websters Wörterbuch, Liste "GET". Mehrsprachige Wörterbücher variieren in der Art und Weise, wie sie mit dieser Ausgabe umgehen: die Langenscheidt Das Wörterbuch von Deutsch wird nicht aufgeführt Ging (< Gehen), aber der Cassell tut es.
Lemmas oder Wortstämme werden oft in verwendet Korpuslinguistik zur Bestimmung der Worthäufigkeit. In dieser Verwendung ist die spezifische Definition von "Lemma" je nach Aufgabe flexibel, für die sie verwendet wird.
Aussprache
Ein Wort kann anders haben Aussprachen, abhängig von seiner phonetisch Umgebung (die benachbarten Geräusche) oder auf dem Grad von betonen in einem Satz. Ein Beispiel für letztere ist das schwache und starke Formen von bestimmten Englisch Funktionswörter wie etwas und aber (ausgesprochen /sʌm/, /bʌt/ wenn gestresst aber /s (ə) m/, /bət/ wenn nicht gestresst). Wörterbücher geben normalerweise die ausgestrichene Aussprache an, wenn das Wort allein ausgesprochen wird (es Isolationsform) und mit Stress, aber sie können auch häufige schwache Formen der Aussprache feststellen.
Unterschied zwischen STEM und Lemma
Das Stengel ist der Teil des Wortes, der sich nie ändert, selbst wenn sich morphologisch eingebogen hat; Ein Lemma ist die Grundform des Wortes. Zum Beispiel ist das Lemma aus "produziert" "produziert", aber der Stamm ist "produziert". Dies liegt daran, dass es Wörter wie gibt wie Produktiontion. und Produktioning[3][Fehlgeschlagene Überprüfung] In der sprachlichen Analyse wird der STEM allgemeiner als die analysierte Basisform definiert, aus der alle gebogenen Formen gebildet werden können. Wann Phonologie berücksichtigt wird, die Definition des unveränderlichen Teils des Wortes ist nicht nützlich, wie in den phonologischen Formen der Wörter im vorhergehenden Beispiel zu sehen ist: "produziert" /prəˈDJuːst/ vs. "Produktion" /prəˈdʌkʃən/.
Einige Lexeme haben mehrere Stängel, aber ein Lemma. Zum Beispiel das Verb "zu gehen" hat die Stiele "Go" und "Gent" aufgrund Suppletion: Die Vergangenheitsform wurde von einem anderen Verb "zu Wend" kooptiert.
Stichwort
A Stichwort, Lemma, oder Schlagwort[4] ist der Wort unter denen eine Reihe von verwandten Wörterbuch oder Enzyklopädie Einträge erscheint. Das Headwort wird verwendet, um den Eintrag zu lokalisieren und seine alphabetische Position zu bestimmen. Abhängig von der Größe und Art des Wörterbuchs oder der Enzyklopädie kann der Eintrag alternative Bedeutungen des Wortes enthalten, der Etymologie, Aussprache und Beugungen, zusammengesetzte Wörter oder Phrasen, die das Headword und enzyklopädische Informationen über die vom Wort dargestellten Konzepte enthalten.
Zum Beispiel das Headword brot Kann die folgenden (vereinfachten) Definitionen enthalten:
- Brot
- (Substantiv)
- (Verb)
- In Brotkrumen beschichten
- — Um zu wissen, welche Seite Ihr Brot gebuttert ist zu wissen, wie man in Ihren eigenen Interessen handelt.
Das Akademisches Wörterbuch von Litauisch Enthält rund 500.000 Kopfwörter. Das Oxford Englisch Wörterbuch (OED) hat rund 273.000 Kopfwörter zusammen mit 220.000 Lemmas,[5] während Websters drittes neues internationales Wörterbuch hat ungefähr 470.000.[6] Das Deutsche Wörterbuch (DWB), das größte Lexikon des deutsche Sprache, hat rund 330.000 Kopfwörter.[7] Diese Werte werden von den Wörterbuchherstellern zitiert und verwenden möglicherweise nicht genau die gleiche Definition eines Headwords. Darüber hinaus spiegeln Headwords möglicherweise nicht genau die physische Größe eines Wörterbuchs wider. Das OED und die DWBenthalten beispielsweise erschöpfende historische Bewertungen und genaue Zitate von Quelldokumente nicht normalerweise in Standardwörterbüchern gefunden.
Der Begriff "Lemma" stammt aus der Praxis in der griechisch-römischen Antike, das Wort zu verwenden, um auf die Headwörter von Rand zu beziehen Glosses in Scholia; Aus diesem Grund die Altgriechisch Pluralform wird manchmal verwendet, nämlich nämlich lemmata (Griechisch λῆμα, pl. Λήμματα).
Siehe auch
Verweise
- ^ Zgusta, Ladislav (2006). Dolezal, Fredric F.M. (ed.). Lexikographie damals und heute. p. 202. ISBN 3484391294.
Ein kleines Problem kann auftreten, wenn die kanonische Form des Headwords, d. H. Die Form, in der es zitiert werden soll, ausgewählt werden soll.
- ^ Francis, W.N.; Kučera, H (1982). Frequenzanalyse des englischen Gebrauchs: Lexikon und Verwendung. Boston: Houghton Mifflin.
- ^ "Natural Language Toolkit - NLTK 3.0 -Dokumentation". Nltk.org. 2015-09-05. Abgerufen 2015-09-27.
- ^ Oxford Englisch Wörterbuch, 3.. Ausgabe, 2018, S.V., Definition 5
- ^ "Glossar - Oxford English Dictionary". public.oed.com. Abgerufen 3. Oktober 2016.
- ^ "Mwunabridged". www.merriam-webster.com. Abgerufen 3. Oktober 2016.
- ^ Die Deutschen wörterbuch am BBAW 22-Juni-2012 abgerufen.