Cross-Language Information Abruf

Cross-Language Information Abruf (Clir) ist ein Unterfeld von Informationsrückgewinnung Umgang mit dem Abrufen von Informationen in einer Sprache, die sich von der Sprache der Abfrage des Benutzers unterscheidet.[1] Der Begriff "Cross-Language Information Retrieval" enthält viele Synonyme, von denen die folgenden möglicherweise am häufigsten sind: bringlicher Informationsabruf, translinguales Informationsabruf, Mehrsprachiger Informationsabruf. Der Begriff "Mehrsprachiger Informationsabruf"Bezieht sich im Allgemeinen sowohl auf Technologie zum Abrufen mehrsprachiger Sammlungen als auch auf die Technologie, die in eine Sprache in eine Sprache umgehen wurde Rückgabeobjekte (Text und andere Medien) verschiedener Sprachen, übersetzt in die Sprache des Benutzers. Cross-Sprach-Informationen Abrufen beziehen sich genauer auf den Anwendungsfall, in dem Benutzer ihre Informationen in einer Sprache formulieren und das System relevante Dokumente in einer anderen abruft. Wenn Sie dies tun, verwenden die meisten CLIR -Systeme verschiedene Übersetzungstechniken. CLIR -Techniken können in verschiedenen Kategorien auf der Grundlage verschiedener Übersetzungsressourcen eingeteilt werden:[2]

  • Wörterbuch-basierte CLIR-Techniken
  • Parallele korpora basierte CLIR -Techniken
  • Vergleichbare körperbasierte CLIR -Techniken
  • CLIR -Techniken auf maschinellem Übersetzer basieren

Die CLIR-Systeme haben sich so stark verbessert, dass die genauesten multisprachigen und bringlichen Adhoc-Informations-Abrufsysteme heute fast genauso effektiv sind wie einsprachige Systeme.[3] Andere verwandte Informationszugriffsaufgaben wie z. Medienüberwachung, Informationsfilterung und Routing, Stimmungsanalyse, und Informationsextraktion Erfordern Sie ausgefeiltere Modelle und typischerweise mehr Verarbeitung und Analyse der interessierenden Informationen. Ein Großteil dieser Verarbeitung muss sich der Einzelheiten der Zielsprachen bewusst sein, in denen sie bereitgestellt werden.

Meistens die verschiedenen Mechanismen von Variation der menschlichen Sprache POSE -Deckungsherausforderungen für Informationsabrufsysteme: Texte in einer Sammlung können ein von Interesse behandeltes Thema behandeln, aber Begriffe oder Ausdrücke verwenden, die nicht mit dem Ausdruck von Informationen übereinstimmen, die der Benutzer benötigt. Dies kann auch in einem mono-lingualen Fall zutrifft, aber dies gilt insbesondere für das reduzierende Informationsabruf, bei dem Benutzer die Zielsprache möglicherweise nur in gewissem Maße kennen. Die Vorteile der CLIR -Technologie für Benutzer mit schlechten bis moderaten Kompetenz in der Zielsprache sind größer als für diejenigen, die fließend sind.[4] Zu den spezifischen Technologien für CLIR -Dienste gehören Morphologische Analyse zu handhaben Flexion, zerlegt oder zusammengesetzte Aufteilung zum Handeln zusammengesetzte Begriffeund Übersetzungsmechanismen, um eine Abfrage von einer Sprache in eine andere zu übersetzen.

Der erste Workshop über Clir fand während der Sigir-96-Konferenz in Zürich statt.[5] Workshops werden seit 2000 bei den Treffen der Cross Language Evaluation Forum (NOTENSCHLÜSSEL). Forscher treffen sich auch im Jahr ein Textabnahmekonferenz (TREC) Um ihre Ergebnisse in Bezug auf verschiedene Systeme und Methoden des Informationsabrufs zu erörtern, und die Konferenz hat als Referenzpunkt für das CLIR -Unterfeld gedient.[6]

Google-Suche Hatte eine Cross-Language-Suchfunktion, die 2013 entfernt wurde.[7]

Siehe auch

  • AUSRUFEN (Extensible Cross-Linguistic Automatic Information Machine)
  • NOTENSCHLÜSSEL (Konferenz und Labors des Bewertungsforums, früher bekannt als Cross-Language Evaluation Forum)
  • Mlir (Multi-Lingual Information Abruf)

Verweise

  1. ^ Wang, Jianqiang und Douglas W. Oard. "Übereinstimmende Bedeutung für das Abrufen von Informationsverfahren." Informationsverarbeitung und -verwaltung48.4 (2012): 631-53.
  2. ^ Thai, Perishan. "Eine Einführung in die Ansätze für die Abrufung von Verschmelzungen des Verschiebens". Netz. Web.simmons.edu
  3. ^ Oard, Douglas. "Mehrsprachiger Informationszugriff." Verständnis von Informationsabrufsystemen(2011): 373-80. Netz.
  4. ^ Airio, Eija (2008). "Wer profitiert von CLIR im Web -Abruf?". Journal of Dokumentation. 64 (5): 760–778. doi:10.1108/00220410810899754.
  5. ^ Das Verfahren dieses Workshops befindet sich im Buch Cross-Language Information Abruf (Grefenstette, Ed; Kluwer, 1998) ISBN0-7923-8122-x.
  6. ^ Olvera-lobo, María-Dolores. "Cross-Language-Informationen Abrufen im Web." Handbuch der Forschung zu sozialen Dimensionen semantischer Technologien und Webdienste(n.d.): 704-19. Netz.
  7. ^ "Google Drops" Übersetzte Fremdseiten "Suchoption aufgrund mangelnder Verwendung". 20. Mai 2013.

Externe Links