Korreferenz
Im Linguistik, Korreferenz, manchmal geschrieben Co-Referenz, tritt auf, wenn sich zwei oder mehr Ausdrücke auf dieselbe Person oder Sache beziehen; Sie haben das gleiche Referenz. Zum Beispiel in Bill sagte, Alice würde bald eintreffen, und sie tat es, die Wörter Alice und sie Beziehen Sie sich auf dieselbe Person.[1]
Es ist häufig nicht trivial zu bestimmen. Zum Beispiel in Bill sagte, er würde kommen, das Wort er kann sich auf die Rechnung beziehen. Die Bestimmung, welche Ausdrücke Kernkern sind ("Titanic"), grammatikalische Geschlechter oder andere Eigenschaften.
Linguisten verwenden häufig Indizes, um eine Kernvorgänge zu notieren, wie in Rechnungi sagte eri kommen würde. Solche Ausdrücke sollen sein coindexed, was darauf hinweist, dass sie als kernfertig interpretiert werden sollten.
Wenn die Ausdrücke koreferentiell sind, ist die erste, die auftritt, häufig eine vollständige oder beschreibende Form (z. B. ein ganzer persönlicher Name, möglicherweise mit einem Titel und einer Rolle), während spätere Vorkommen kürzere Formulare verwenden (z. oder Pronomen). Das frühere Ereignis ist als das bekannt vorgezogen) und der andere wird genannt (a Proform, Anaphor oder Referenz). Pronomen können jedoch manchmal nach vorne verweisen, wie in "Als sie nach Hause kam, ging Alice schlafen." In solchen Fällen wird die Koreferenz genannt Kataphorie eher als anaphorisch.
Die Koreferenz ist wichtig für Bindung Phänomene im Bereich der Syntax. Die Theorie der Bindung untersucht die syntaktische Beziehung, die zwischen koreferentiellen Ausdrücken in Sätzen und Texten besteht.
Typen
Bei der Erforschung der Korreference können zahlreiche Unterscheidungen getroffen werden, z. Anaphora, Kataphora, geteilte Antezedenzien, Coreferring Nomen -Phrasen usw.[2] Einige dieser spezifischeren Phänomene sind hier dargestellt:
- Anaphora
- a. Die Musiki war so laut, dass das esi konnte nicht genossen werden. –Die Anapher es folgt dem Ausdruck, auf den es sich bezieht (sein Vorgänger).
- b. Unsere Nachbarni mag die Musik nicht. Wenn siei Sind wütend, die Bullen werden bald auftauchen. - Die Anaphor sie folgt dem Ausdruck, auf den es sich bezieht (sein Vorgänger).
- Kataphora
- a. Wenn siei sind wütend über die Musik, die Nachbarni ruft die Polizisten an. - Die Katapher sie geht dem Ausdruck voraus, auf den es sich bezieht (sein Posten).
- b. Trotz Siei Schwierigkeit, Wilmai kam, um den Punkt zu verstehen. - Die Katapher Sie geht dem Ausdruck voraus, auf den es sich bezieht (sein Posten)
- Splittere Vorgeschichte
- a. Caroli gesagt Bobi an der Party teilnehmen. Siei zusammen angekommen. - Die Anaphor sie hat einen geteilten Vorgänger, der sich auf beide bezieht Carol und Bob.
- b. Wann Caroli hilft Bobi und Bobi hilft Caroli, siei kann jede Aufgabe erfüllen. - Die Anaphor sie hat einen geteilten Vorgänger, der sich auf beide bezieht Carol und Bob.
- Coreferring Nomen -Phrasen
- a. Der Projektleiteri weigert sich zu helfen. Der Rucki denkt nur an sich. - Coreferring Nomen -Phrasen, wobei die zweite Substantivphrase eine Prädikation über die erste ist.
- b. Einige unserer Kollegen1 werden unterstützend sein. Diese Art von Menschen1 wird unsere Dankbarkeit verdienen. - Coreferring Nomen -Phrasen, wobei die zweite Substantivphrase eine Prädikation über die erste ist.
Beziehung zu gebundenen Variablen
Semantiker und Logiker unterscheiden manchmal zwischen Korreference und dem, was als bekannt ist gebundene Variable.[3] Gebundene Variablen treten auf, wenn das Vorgänger zum Proform eine unbestimmte quantifizierte Expression ist, z.[4][Klarstellung erforderlich]
- a. Jeder Studenti hat erhalten seinei Klasse. - Das Pronomen seine ist ein Beispiel für eine gebundene Variable
- b. Kein Studenti war verärgert über seinei Klasse. - Das Pronomen seine ist ein Beispiel für eine gebundene Variable
Quantifizierte Ausdrücke wie zum Beispiel jeder Student und Kein Student werden nicht als referentiell angesehen. Diese Ausdrücke sind grammatikalisch einzigartig, wählen jedoch keine einzelnen Referenten im Diskurs oder im realen Welt aus. So sind die Vorgänger zu seine In diesen Beispielen sind nicht ordnungsgemäß referentiell, und auch nicht seine. Stattdessen wird es als als betrachtet Variable das ist gebunden durch sein Vorgänger. Seine Referenz variiert basierend darauf, an welchen Schülern der Diskurswelt gedacht wird. Die Existenz von gebundenen Variablen ist mit dem folgenden Beispiel möglicherweise deutlicher:
- c. Nur Jacki Likes seinei Klasse. - Das Pronomen seine Kann eine gebundene Variable sein.
Dieser Satz ist mehrdeutig. Es kann bedeuten, dass Jack seine Note mag, aber alle anderen mögen Jacks Note nicht. oder dass niemand ihre mag besitzen Note außer Jack. In der ersten Bedeutung, seine ist koreferentiell; In der zweiten ist es eine gebundene Variable, da seine Referenz über den Satz aller Schüler variiert.
Die Coindex -Notation wird üblicherweise für beide Fall verwendet. Das heißt, wenn zwei oder mehr Ausdrücke koindexiert sind, signalisiert es nicht, ob man sich mit einer Kernferenz oder einer gebundenen Variablen befasst (oder wie im letzten Beispiel, ob es von der Interpretation abhängt).
Korreferenzauflösung
Im Computerlinguistik, Corecence-Auflösung ist ein gut untersuchtes Problem in Diskurs. Die korrekte Interpretation eines Textes abzuleiten oder sogar die relative Bedeutung verschiedener erwähnter Probanden, Pronomen und andere abzuschätzen Ausdrücke überweisen muss mit den richtigen Personen verbunden sein. Algorithmen, mit denen die Kernvorräte auflösen sollen, suchen häufig zuerst nach dem nächsten vorhergehenden Individuum, das mit dem überweisenden Ausdruck kompatibel ist. Zum Beispiel, sie könnte sich an einen vorhergehenden Ausdruck hängen, z. die Frau oder Anne, aber nicht so wahrscheinlich zu Rechnung. Pronomen wie selbst haben viel strengere Einschränkungen. Wie bei vielen sprachlichen Aufgaben gibt es einen Kompromiss zwischen Präzision und Rückruf. Cluster-Qualitätsmetriken, die üblicherweise zur Bewertung von Algorithmen zur Coreferenzauflösung verwendet werden Rand Index, das Eingepasster Rand -Indexund anders gegenseitige Information-basierte Methoden.
Ein besonderes Problem für die Koreferenzauflösung in Englisch ist das Pronomen es, was viele Verwendungszwecke hat. Es kann sich ähnlich beziehen er und sie, außer dass es sich im Allgemeinen auf leblose Objekte bezieht (die Regeln sind tatsächlich komplexer: Tiere können eine von einer von sein es, er, oder sie; Schiffe sind traditionell sie; Hurrikane sind es normalerweise es trotz geschlechtsspezifischer Namen). Es kann sich auch eher auf Abstraktionen als auf Wesen beziehen, z. Er erhielt einen Mindestlohn, schien es jedoch nicht zu stören. Endlich, es hat auch pleonastisch Verwendungszwecke, die sich auf nichts Bestimmtes beziehen:
- a. Es'S regnet.
- b. Es'S wirklich eine Schande.
- c. Es braucht viel Arbeit, um erfolgreich zu sein.
- d. Manchmal es'S die lautesten, die den größten Einfluss haben.
Pleonastische Verwendungen werden nicht als referentiell angesehen und sind daher nicht Teil der Koreferenz.[5]
Ansätze zur Koreferenzauflösung können im Großen und Ganzen in Erwähnung von Pair, Erwähnung von Algorithmen oder Entitätsbasis getrennt werden. Erwähnungspaaralgorithmen beinhalten binäre Entscheidungen, wenn ein Paar von zwei gegebenen Erwähnungen zur gleichen Entität gehört. Entitätsweite Einschränkungen wie Geschlecht werden nicht berücksichtigt, was zu Fehlerausbreitung. Zum Beispiel die Pronomen er oder sie kann beide eine hohe Wahrscheinlichkeit von Kernfertigkeiten haben mit der Lehrer, kann aber nicht coreferent miteinander sein. Erwähnungsranking-Algorithmen erweitern diese Idee, aber stattdessen kann man nur eine Erwähnung mit einer (vorherigen) Erwähnung kernfertig sein. Infolgedessen muss jede vorherige Erwähnung eine Punktzahl erhalten und die höchste Bewertung (oder keine Erwähnung) verknüpft ist. Schließlich werden in entitätsbasierten Methoden erwähnt, basierend auf Informationen der gesamten Koreferenzkette anstelle von individuellen Erwähnungen. Die Darstellung einer variablen Breitenkette ist komplexer und rechenintensiv als erwähnte Methoden, was dazu führt neurales Netzwerk Architekturen.
Siehe auch
- Anaphora (Linguistik)- Verwendung eines Ausdrucks, dessen Interpretation vom Kontext abhängt
- Vorgezogen-Ausdruck, der einer Pro-Form in der Grammatik seine Bedeutung verleiht
- Bindung- Verteilung anaphorischer Elemente
- Kataphora-Verwendung eines Ausdrucks oder Wort
- Nächster Referenz
- Schalterreferenz- Konzept in der Linguistik
- Wortvernetzung- Identifizierung, welches Sinn eines Wortes verwendet wird
Anmerkungen
- ^ Für Definitionen von Coreference siehe zum Beispiel Crystal (1997: 94) und Radford (2004: 332).
- ^ Diese Unterscheidungen (Anaphora, Kataphora, geteilte Voraussetzungen, Coreferring -Substantive usw.) werden in Jurafsky und Martin (2000: 669ff) diskutiert.
- ^ Für Diskussionen von gebundenen Variablen siehe zum Beispiel Portner (2005: 102ff.).
- ^ Siehe Jurafsky und Martin (2000: 701) für ein Beispiel für eine gebundene Variable wie die hier angegebenen.
- ^ Li et al. (2009) haben eine hohe Genauigkeit bei der Aussortierung von Pleonastik gezeigt esund dieser Erfolg verspricht, die Genauigkeit der Korreferenzauflösung insgesamt zu verbessern.
Verweise
- Crystal, D. 1997. Ein Wörterbuch für Linguistik und Phonetik. 4. Auflage. Cambridge, MA: Blackwell Publishing.
- Jurafsky, D. und H. Martin 2000. Sprach- und Sprachverarbeitung: Eine Einführung in die Verarbeitung natürlicher Sprache, die Berechnung der Linguistik und die Spracherkennung. Neu -Delhi, Indien: Pearson Education.
- Portner, P. 2005. Was ist Semantik?: Grundlagen der formalen Semantik. Malden, MA: Blackwell Publishing.
- Radford, A. 2004. Englische Syntax: Eine Einführung. Cambridge, Großbritannien: Cambridge University Press.
- Li, Y., P. Musilek, M. Reformat und L. Wyard-Scott 2009. Identifizierung von Pleonastik es Verwenden des Web. Journal of Artificial Intelligence Research 34, 339–389.