WordNet
Ein Schnappschuss von WordNets Definition von sich. | |
Entwickler (en) | Princeton Universität |
---|---|
Erstveröffentlichung | Mitte der 1980er Jahre |
Stabile Version | 3.1 / Juni 2011[1] |
Geschrieben in | Prolog |
Betriebssystem | Unix, Linux, Solaris, Windows |
Größe | 16 MB (einschließlich 155.327 Wörter, die in 175.979 Synsets für insgesamt 207.016 Word-Sense-Paare organisiert sind) |
Verfügbar in | Mehr als 200 Sprachen |
Typ | Lexikalische Datenbank |
Lizenz | BSD-ähnlich |
Webseite | Wordnet |
Wordnet ist ein lexikalische Datenbank von Semantische Beziehungen zwischen Wörter In mehr als 200 Sprachen.[2] WordNet -Links Wörter hinein Semantische Beziehungen einschließlich Synonyme, Hyponyme, und Meronyme. Die Synonyme sind in gruppiert Synsets mit kurzen Definitionen und Verwendungsbeispielen. Wordnet kann daher als Kombination und Erweiterung von a gesehen werden Wörterbuch und Thesaurus. Während es für menschliche Benutzer über a zugänglich ist Webbrowser,[3] Die Hauptverwendung ist automatisch Textanalyse und künstliche Intelligenz Anwendungen. Wordnet wurde zuerst in der erstellt Englische Sprache[4] und das englische Wordnet Datenbank und Software Tools wurden unter einem veröffentlicht Lizenz im BSD -Stil und sind frei zum Download von dieser WordNet -Website zur Verfügung.
Geschichte und Teammitglieder
Wordnet wurde zuerst nur in Englisch erstellt Kognitionswissenschaft Labor von Princeton Universität Unter der Leitung von Psychologie Professor George Armitage Miller ab 1985 und wurde später von inszeniert von Christiane Fellbaum. Das Projekt wurde ursprünglich vom US -amerikanischen Büro für Marineforschung und später auch von anderen US -Regierungsbehörden, einschließlich der DARPA, das Nationale Wissenschaftsstiftung, das Disruptive Technology Office (Früher die fortschrittliche Forschungs- und Entwicklungsaktivität) und Reflex. George Miller und Christiane Fellbaum wurden 2006 ausgezeichnet Antonio Zampolli -Preis für ihre Arbeit mit WordNet.
Die Global WordNet Association ist eine nichtkommerzielle Organisation, die eine Plattform zum Erörterung, Teilen und Verbinden von Wörtern für alle Sprachen der Welt bietet. Christiane Fellbaum und Piek Th.J.M. Vossen dienen als Ko-Präsidenten.[5]
Datenbankinhalt

Die Datenbank enthält 155 327 Wörter, die in 175 979 organisiert sind Synsets für insgesamt 207 016 Word-Sense-Paare; in komprimiert Form, es ist ungefähr 12 Megabyte in Größe.[6]
Wordnet enthält die lexikalischen Kategorien Substantive, Verben, Adjektive und Adverbien aber ignoriert Präpositionen, Bestimmungen und andere Funktionswörter.
Wörter aus derselben lexikalischen Kategorie, die ungefähr synonym sind Synsets. Synsets enthalten sowohl Simplexwörter als auch Kollokationen Wie "Out" und "Autopool". Die verschiedenen Sinne von a polysem Die Wortform wird verschiedenen Synsets zugeordnet. Die Bedeutung eines Synset wird mit einer kurzen Definition weiter geklärt Glanz und ein oder mehrere Verwendungsbeispiele. Ein Beispiel für Adjektivsynset ist:
- Gut, richtig, reif - (am besten geeignet oder rechts für einen bestimmten Zweck; "Eine gute Zeit, um Tomaten zu pflanzen"; "Der richtige Zeitpunkt zum Handeln"; "Die Zeit ist reif für große soziologische Veränderungen")
Alle Synsets sind mittels semantischer Beziehungen mit anderen Synsets verbunden. Zu diesen Beziehungen gehören nicht alle von allen lexikalischen Kategorien, gehören:
- Substantive
- Hypernyme: Y ist ein Hypernym von X Wenn alles X ist eine Art von) Y (Eckzahn ist ein Hypernym von Hund)
- Hyponyme: Y ist ein Hyponym von X Wenn alles Y ist eine Art von) X (Hund ist ein Hyponym von Eckzahn)
- Begriffe koordinieren: Y ist ein Koordinatenbegriff von X wenn X und Y Teilen Sie ein Hypernym (Wolf ist ein Koordinatenbegriff von Hund, und Hund ist ein Koordinatenbegriff von Wolf)
- Meronym: Y ist ein Meronym von X wenn Y ist ein Teil von X (Fenster ist ein Meronym von Gebäude)
- Holonym: Y ist ein Holonym von X wenn X ist ein Teil von Y (Gebäude ist ein Holonym von Fenster)
- Verben
- Hypernym: das Verb Y ist ein Hypernym des Verbs X Wenn die Aktivität X ist eine Art von) Y (wahrnehmen ist ein Hypernym von zuhören)
- Troponym: das Verb Y ist ein Troponym des Verbs X Wenn die Aktivität Y macht gerade X in irgendeiner Weise (zu lispeln ist ein Troponym von sprechen)
- mit sich bringen: das Verb Y wird von X Wenn durch X Sie müssen tun Y (schlafen wird von Schnarchen)
- Begriffe koordinieren: Diese Verben teilen sich ein gemeinsames Hypernym (zu lispeln und schreien)
Diese semantischen Beziehungen halten unter allen Mitgliedern der verknüpften Synsets. Einzelne Synset -Mitglieder (Wörter) können auch mit lexikalischen Beziehungen verbunden werden. Zum Beispiel ist (ein Gefühl von) der Substantiv "Regisseur" mit (einem Gefühl von) dem Verb "direkt" verbunden, von dem es über einen "morphosemantischen" Link abgeleitet wird.
Die Morphologiefunktionen der mit der Datenbank verteilten Software versuchen, das abzuleiten Lemma oder Stengel Form von a Wort Aus der Eingabe des Benutzers. Unregelmäßige Formen werden in einer Liste gespeichert, und das Schauen von "Ate" wird beispielsweise "Eat" zurückkehren.
Wissensstruktur
Sowohl Substantive als auch Verben sind in Hierarchien organisiert, definiert von Hypernym oder IST EIN Beziehungen. Zum Beispiel ein Gefühl des Wortes Hund wird nach der Hypernym -Hierarchie gefunden; Die Wörter auf derselben Ebene repräsentieren Synset -Mitglieder. Jeder Satz von Synonymen hat einen eindeutigen Index.
- Hund, häuslicher Hund, Canis vertrautheit
- Eckzahn, Canid
- Fleischfresser
- Plazenta, Plazenta -Säugetier, Eutherianer, Eutherianische Säugetier
- Säugetier
- Wirbeltier, Kraniate
- Akkordat
- Tier, animiertes Wesen, Biest, Brüte, Kreatur, Fauna
- ...
- Tier, animiertes Wesen, Biest, Brüte, Kreatur, Fauna
- Akkordat
- Wirbeltier, Kraniate
- Säugetier
- Plazenta, Plazenta -Säugetier, Eutherianer, Eutherianische Säugetier
- Fleischfresser
- Eckzahn, Canid
Auf der oberen Ebene sind diese Hierarchien in 25 Anfänger "Bäume" für Substantive und 15 für Verben organisiert (genannt Lexikografische Dateien auf Wartungsstufe). Alle sind mit einer einzigartigen Anfängersynset "Entity" verknüpft. Substantivhierarchien sind weitaus tiefer als Verbhierarchien
Adjektive werden nicht in hierarchische Bäume organisiert. Stattdessen bilden zwei "zentrale" Antonyme wie "heiße" und "kalte" Binärstangen, während 'Satelliten' -Synonyme wie "Dampf" und "kaltes" Synonyme über eine "Ähnlichkeit" Beziehungen zu ihren jeweiligen Polen verbinden. Die Adjektive können auf diese Weise eher als "Hanteln" als als "Bäume" visualisiert werden.
Psycholinguistische Aspekte
Das ursprüngliche Ziel des WordNet -Projekts war es, eine lexikalische Datenbank zu erstellen, die mit Theorien des menschlichen semantischen Gedächtnisses übereinstimmt, das Ende der 1960er Jahre entwickelt wurde. Psychologische Experimente zeigten, dass Sprecher ihr Wissen über Konzepte in wirtschaftlicher und hierarchischer Weise organisierten. Abrufzeit, die für den Zugriff auf konzeptionelle Kenntnisse erforderlich sind, schien direkt mit der Anzahl der Hierarchien zusammenhängen, die der Sprecher zum "Durchlaufen" zum Wissen benötigte. Daher könnten die Sprecher das schneller überprüfen Kanaren können singen Weil ein Kanarien ein Singvogel ist, aber etwas mehr Zeit benötigte, um dies zu überprüfen Kanaren können fliegen (Wo sie auf der übergeordneten Ebene auf das Konzept "Vogel" zugreifen mussten) und noch mehr Zeit, um dies zu überprüfen Kanaren haben Haut (Erfordern Sie über mehrere Hyponymieebenen hinweg bis zu "Tier").[7] Während so psycholinguistisch Experimente und die zugrunde liegenden Theorien wurden kritisiert. Einige der Organisationen von WordNet sind mit experimentellen Beweisen überein. Zum Beispiel, anomische Aphasie Selektiv wirkt sich die Fähigkeit der Sprecher aus, Wörter aus einer bestimmten semantischen Kategorie, einer WordNet -Hierarchie, zu produzieren. Antonymous Adjective (WordNets zentrale Adjektive in der Hantelstruktur) ist weitaus häufiger als Zufall, eine Tatsache, die für viele Sprachen festgestellt wurde.
Als lexikalische Ontologie
Wordnet wird manchmal als Ontologie bezeichnet, eine anhaltende Behauptung, die seine Schöpfer nicht verdienen. Die Hypernym/Hyponym -Beziehungen zwischen den Substantivsynsets können als Spezialisierungsbeziehungen zwischen konzeptionellen Kategorien interpretiert werden. Mit anderen Worten kann WordNet als lexikalisch interpretiert und verwendet werden Ontologie in dem Informatik Sinn. Eine solche Ontologie sollte jedoch vor der Verwendung korrigiert werden, da sie Hunderte von grundlegenden semantischen Inkonsistenzen enthält. Zum Beispiel gibt es (i) gemeinsame Spezialisierungen für exklusive Kategorien und (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) (ii) in der Spezialisierungshierarchie. Darüber hinaus sollte die Umwandlung von Wordnet in eine für die Wissensdarstellung verwendbare lexikalische Ontologie auch (i) die Unterscheidung der Spezialisierungsbeziehungen in die Unterscheidung in die Subtyp und Instanz Beziehungen und (ii) intuitive eindeutige Kennungen mit jeder Kategorie. Obwohl solche Korrekturen und Transformationen im Rahmen der Integration von WordNet 1.7 in die kooperativ aktualisierbare Wissensbasis von WebKB-2 durchgeführt und dokumentiert wurden, wurden[8] Die meisten Projekte, die behaupten, WordNet für wissensbasierte Anwendungen wiederzuverwenden (typischerweise, wissensorientiertes Informationsabruf), verwenden Sie es einfach direkt wieder.
WordNet wurde auch in eine formale Spezifikation mithilfe einer hybriden Bottom-Up-Top-Down-Methodik umgewandelt, um Assoziationsbeziehungen aus WordNet automatisch zu extrahieren und diese Assoziationen in Bezug auf eine Reihe von konzeptionellen Beziehungen zu interpretieren, die in der formell definiert sind Dolce Fundamentation Ontology.[9]
In den meisten Arbeiten, die behaupten, WordNet in Ontologien integriert zu haben, wurde der Inhalt von WordNet nicht einfach korrigiert, wenn dies notwendig erschien. Stattdessen wurde WordNet stark neu interpretiert und aktualisiert, wenn er geeignet ist. Dies war der Fall, wenn beispielsweise die Ontologie von WordNet auf der obersten Ebene neu strukturiert wurde[10] laut dem Ontoclean basierter Ansatz oder wenn WordNet als primäre Quelle für die Konstruktion der unteren Klassen der Sensus -Ontologie verwendet wurde.
Einschränkungen
Die am häufigsten diskutierte Einschränkung von WordNet (und verwandte Ressourcen wie Bildnische) ist das, dass einige der Semantische Beziehungen sind eher für konkrete Konzepte als für abstrakte Konzepte geeignet.[11] Zum Beispiel ist es einfach, Hyponyme/Hypernymbeziehungen zu erstellen, um das zu erfassen, dass ein "Nadelbaum"Ist eine Art von"Baum", ein" Baum "ist eine Art von" Art von "Pflanze", und eine" Pflanze "ist eine Art von" Art von "Organismus", aber es ist schwierig, Emotionen wie" Angst "oder" Glück "in ebenso tiefe und genau definierte Hyponyme/Hypernymbeziehungen zu klassifizieren.
Viele der Konzepte in WordNet sind spezifisch für bestimmte Sprachen und die genaueste gemeldete Zuordnung zwischen Sprachen beträgt 94%.[12] Synonyme, Hyponyme, Meronyme und Antonyme treten bisher in allen Sprachen mit einem WordNet auf, aber andere semantische Beziehungen sind sprachspezifisch.[13] Dies begrenzt die Interoperabilität über Sprachen hinweg. Es macht WordNet jedoch auch zu einer Ressource, um die Unterschiede zwischen Sprachen hervorzuheben und zu untersuchen. Daher ist es nicht unbedingt eine Einschränkung für alle Anwendungsfälle.
WordNet enthält keine Informationen über die Etymologie oder die Aussprache von Wörtern und es enthält nur begrenzte Informationen über die Verwendung. WordNet zielt darauf ab, die meisten alltäglichen Wörter abzudecken, und enthalten nicht viel domänenspezifische Terminologie.
Wordnet ist das am häufigsten verwendete Computerlexikon von Englisch für Wortvernetzung (WSD), eine Aufgabe, die darauf abzielt, die kontextgerechten Bedeutungen (d. H. Synset-Mitglieder) in einem Text zuzuweisen.[14] Es wurde jedoch argumentiert, dass WordNet sinnliche Unterscheidungen codiert, die zu feinkörnig sind. Dieses Problem verhindert, dass WSD -Systeme ein mit dem Menschen vergleichbarer Leistungsniveau erzielen, der nicht immer zustimmt, wenn sie mit der Aufgabe konfrontiert werden, ein Gefühl aus einem Wörterbuch auszuwählen, das einem Wort in einem Kontext entspricht. Das Problem der Granularität wurde durch Vorschlag angegriffen Clustering Methoden, die automatisch ähnliche Sinne des gleichen Wortes zusammenarbeiten.[15][16][17]
Offensiver Inhalt
Wordnet enthält Wörter, die als wahrgenommen werden können abwertend oder beleidigend.[18] Die Interpretation eines Wortes kann im Laufe der Zeit ändern und zwischen sozialen GruppenEs ist also nicht immer möglich, dass WordNet ein Wort als "als" definiert "abwertend"oder" beleidigend "isoliert. Daher müssen Menschen, die WordNet verwenden, ihre eigenen Methoden anwenden, um beleidigende oder abwertende Wörter zu identifizieren.
Diese Einschränkung gilt jedoch für andere lexikalische Ressourcen wie Wörterbücher und Thesaurus, was auch enthalten abwertend und beleidigende Worte. Einige Wörterbücher geben Wörter an, die sind Abwertungsmittelenthalten aber nicht alle Kontexte, in denen Wörter für verschiedene soziale Gruppen akzeptabel oder beleidigend sein könnten. Daher müssen Personen, die Wörterbücher verwenden, ihre eigenen Methoden anwenden, um alle offensiven Wörter zu identifizieren.
Lizenzierte gegen offene Wortnetze
Anschließend wurden einige Wortnetze für andere Sprachen erstellt. Eine Umfrage 2012 listet die Wortnetze und ihre Verfügbarkeit auf.[19] Um die Verwendung von WordNets zu verbreiten ontologisch und lexikalisch Wissen in Verarbeitung natürlicher Sprache (NLP) Aufgaben.
Das offene mehrsprachige Wordnet[20] Bietet Zugang zu offen lizenziert Wordnets in einer Vielzahl von Sprachen, die alle mit dem Princeton WordNet of English (PWN) verknüpft sind. Ziel ist es, die Verwendung von Wordnets in mehreren Sprachen einfach zu verwenden.
Anwendungen
WordNet wurde für eine Reihe von Zwecken in Informationssystemen verwendet, einschließlich Wortvernetzung, Informationsrückgewinnung, Automatische Textklassifizierung, Automatische Textübersicht, Maschinenübersetzung und sogar automatische Kreuzworträtselerzeugung.
Eine häufige Verwendung von WordNet besteht darin, die zu bestimmen Ähnlichkeit zwischen Wörtern. Es wurden verschiedene Algorithmen vorgeschlagen, einschließlich der Messung der Entfernung zwischen Wörtern und Synsets in der Graph -Struktur von WordNet, z. B. durch Zählen der Anzahl der Kanten zwischen Synsets. Die Intuition ist, dass die engeren zwei Wörter oder Synsets ihre Bedeutung näher sind. Eine Reihe von WordNet-basierten Wort Ähnlichkeitsalgorithmen werden in a implementiert Perl Paket namens WordNet :: Ähnlichkeit,[21] und in a Python Paket aufgerufen NLTK.[22] Weitere komplexere wordnet-basierte Ähnlichkeitstechniken sind ADW,[23] deren Umsetzung ist in verfügbar Java. WordNet kann auch verwendet werden, um andere Vokabeln zwischeneinander zu bringen.[24]
Schnittstellen
Princeton unterhält eine Liste verwandter Projekte[25] Dies beinhaltet Links zu einigen der weit verbreiteten Anwendungsprogrammierschnittstellen Verfügbar für den Zugriff auf WordNet mit verschiedenen Programmiersprachen und Umgebungen. Es gibt auch Weboberflächen wie lengusa.com oder Lookwayup.com Sie verwenden WordNet-Daten und bieten benutzerfreundliche Schnittstellen.
Verwandte Projekte und Erweiterungen
WordNet ist mit mehreren Datenbanken der verbunden Semantisches Web. WordNet wird auch üblicherweise über Zuordnungen zwischen den WordNet-Synsets und den Kategorien von Ontologien wiederverwendet. Meistens werden nur die Top-Kategorien von WordNet zugeordnet.
Global WordNet Association
Die Global WordNet Association (GWA)[26] ist eine öffentliche und nichtkommerzielle Organisation, die eine Plattform zum Erörterung, Teilen und Verbinden von Wörtern für alle Sprachen der Welt bietet. Die GWA fördert auch die Standardisierung von Wortnetzen über Sprachen hinweg, um ihre Einheitlichkeit bei der Aufzählung der Synsets in menschlichen Sprachen zu gewährleisten. Die GWA hält eine Liste von Wordnets, die weltweit entwickelt wurden.[27]
Andere Sprachen
- Arabisches Wortnetz:[28][29] Wordnet für arabische Sprache.
- Arabische Ontologie, eine sprachliche Ontologie, die die gleiche Struktur wie Wordnet hat und dem sie zugeordnet ist.
- Das Balkanet -Projekt[30] hat Wortnetze für sechs europäische Sprachen (Bulgarisch, Tschechisch, Griechisch, Rumänisch, Türkisch und Serbisch) produziert. Für dieses Projekt wurde ein frei verfügbares XML-basierter WordNet-Editor entwickelt. Dieser Editor - visdisch - ist nicht mehr in aktiver Entwicklung, sondern wird immer noch für die Erstellung verschiedener Wordnetze verwendet. Der Nachfolger Debvisdic ist die Kunden-Server-Anwendung und wird derzeit für die Bearbeitung mehrerer Wordnets (niederländisch in Cornetto-Projekt, polnisch, ungarisch, mehrere afrikanische Sprachen, Chinesisch) verwendet.
- Bulnet ist eine bulgarische Version des WordNet, das am Department of Computational Linguistics der Entwicklung entwickelt wurde Institut für bulgarische Sprache, Bulgarische Akademie der Wissenschaften.[31]
- CWN (chinesisches Wordnet oder 中文 詞彙 網路) unterstützt von nationale taiwanesische Universität.[32]
- Das Eurowordnet Projekt[33] hat Wortnetze für mehrere europäische Sprachen produziert und sie miteinander verknüpft; Diese sind jedoch nicht frei verfügbar. Das Global WordNet -Projekt versucht, die Produktion und Verknüpfung von "Wordnets" für alle Sprachen zu koordinieren.[34] Oxford University Press, der Verlag der Oxford Englisch Wörterbuchhat Pläne geäußert, ihren eigenen Online -Konkurrenten zu WordNet zu produzieren.
- FinnwordNet ist eine finnische Version des WordNet, in der alle Einträge des ursprünglichen englischen WordNet übersetzt wurden.[35]
- Deutsch ist eine deutsche Version des Wortnetzes, die von der Universität Tübingen entwickelt wurde.[36]
- Das Indowordnet[37] ist eine verknüpfte lexikalische Wissensbasis von Wortnetzen von 18 geplanten Sprachen Indiens, nämlich, nämlich, Assamesen, Bangla, Bodo, Gujarati, Hindi, Kannada, Kaschmiri, Konkani, Malayalam, Meitei (Manipuri), Marathi, Nepali, Odia, Punjabi, Sanskrit, Tamilisch, Telugu und Urdu.
- Jaws (nur eine andere WordNet -Teilmenge), eine andere französische Version von WordNet[38] gebaut mit den wiktionären und semantischen Räumen
- Wordnet Bahasa: Wordnet für Malay- und Indonesiensprache, entwickelt von Nanyang Universität für Technologie.
- Malayalam Wordnet, entwickelt von Cochin Universität für Wissenschaft und Technologie.[39]
- Mehrsprachiger Central Repository (MCR) integriert die gleichen Wordnetze des EurowordNet -Frameworks aus Spanisch, Katalanisch, Basken, Galizier und Portugiesisch gingen dem Englisch.[40]
- Das MultiWordnet -Projekt,[41] Ein mehrsprachiges Wordnet, das darauf abzielt, ein italienisches Wordnet zu erstellen, das stark mit dem Princeton WordNet ausgerichtet ist.
- Opendutchwordnet,[42] ist eine niederländische lexikalische semantische Datenbank.
- OpenWN-PT ist eine brasilianische portugiesische Version des Original-Wordnets, das unter CC-by-SA-Lizenz frei zum Download zur Verfügung steht.[43]
- PlWordNet[44] ist eine polnischsprachige Version von WordNet, die von entwickelt wurde von Wrocław University of Technology.
- Polnet[45] ist eine polnischsprachige Version von WordNet, die von entwickelt wurde von Adam Mickiewicz Universität in Posen (Verteilt unter CC BY-NC-ND 3.0-Lizenz).
Projekte wie Balkanet und Eurowordnet machten es machbar, eigenständige Wordnets zu erstellen, die mit dem Original verbunden sind. Eines dieser Projekte war russisches Wordnet von bevormundet durch Petersburg State University of Communication[46] angeführt von S.A. Yablonsky[47] oder Russnet[48] durch Saint Petersburg State University
- UWN ist eine automatisch konstruierte mehrsprachige lexikalische Wissensbasis, die WordNet erweitert, um über eine Million Wörter in vielen verschiedenen Sprachen abzudecken.[49]
- Wolf (Wordnet Libre du Français), eine französische Version von WordNet.[50]
Verknüpfte Daten
- Babelnet,[51] eine sehr große mehrsprachige Semantisches Netzwerk Mit Millionen von Konzepten, die durch Integration von WordNet und Wikipedia mit einem automatischen Mapping -Algorithmus erhalten wurden.
- Das Sumo Ontologie[52] hat eine Zuordnung zwischen allen WordNet -Synsets (einschließlich Substantiven, Verben, Adjektiven und Adverbien) und erstellt. Sumo -Klassen. Die jüngste Hinzufügung der Zuordnungen liefert Links zu allen spezifischeren Begriffen in der mittleren Ontologie (MILO), die SUMO erweitert.
- Opencyc,[53] ein offenes Ontologie und Wissensbasis Von alltäglichem Wissen des gesunden Menschenverstandes hat 12.000 Begriffe mit WordNet -Synonym -Sätzen verknüpft.
- Dolce,[54] ist das erste Modul der Wonderweb Foundational Ontologies Library (WFOL). Diese obere Ontologie wurde im Lichte strenger ontologischer Prinzipien entwickelt, die von der philosophischen Tradition inspiriert wurden und eine klare Ausrichtung auf Sprache und Erkenntnis haben. OnTowordnet[55] ist das Ergebnis einer experimentellen Ausrichtung von Wordnets obere Ebene mit Dolce. Es wird vermutet, dass eine solche Ausrichtung zu einem "ontologisch gesüßten" Wordnet führen könnte, das konzeptionell strenger, kognitiv transparent und in mehreren Anwendungen effizient ausbeuchten kann.
- Dbpedia,[56] Eine Datenbank mit strukturierten Informationen ist mit WordNet verknüpft.
- Das erweiterte Wordnet[57] ist ein Projekt am Universität von Texas in Dallas Dies zielt darauf ab, WordNet zu verbessern, indem die Glanze semantisch analysiert werden, wodurch die in diesen Definitionen enthaltenen Informationen für automatische Wissensverarbeitungssysteme verfügbar sind. Es ist unter einer Lizenz, die wie WordNets ähnelt, frei verfügbar.
- Das Gcide Projekt produzierte ein Wörterbuch durch Kombination a öffentlich zugänglich Websters Wörterbuch Ab 1913 mit einigen WordNet -Definitionen und Materialien von Freiwilligen. Es wurde unter dem freigelassen Copyleft Lizenz Gpl.
- Bildnische ist eine Bilddatenbank, die nach der WordNet -Hierarchie (derzeit nur der Substantive) organisiert ist, in der jeder Knoten der Hierarchie von Hunderten und Tausenden von Bildern dargestellt wird.[58] Derzeit hat es im Durchschnitt über 500 Bilder pro Knoten.
- BioWordnet, eine biomedizinische Erweiterung von WordNet, wurde aufgrund von Problemen der Stabilität über Versionen aufgegeben.[59]
- Wikitax2Wordnet, eine Zuordnung zwischen WordNet -Synsets und Wikipedia -Kategorien.[60]
- WordNet ++, eine Ressource mit über Millionen semantischer Kanten, die aus Wikipedia geerntet wurden, und das Verbinden von Paaren von WordNet -Synsets.[61]
- SentiWordNet, eine Ressource zur Unterstützung von Meinungsminenanwendungen, die durch das Markieren aller WordNet 3.0 -Synsets gemäß ihren geschätzten Positivität, Negativität und Neutralität erhalten wurden.[62]
- Colordict ist eine Android -Anwendung für Handys mit der WordNet -Datenbank und anderen wie Wikipedia.
- UBY-lmf Eine Datenbank mit 10 Ressourcen, einschließlich WordNet.
Ähnliche Projekte
- Framenet ist eine lexikalische Datenbank, die einige Ähnlichkeiten mit WordNet teilt und sich darauf bezieht.
- Lexikaler Markup -Framework (LMF) ist ein ISO -Standard, der darin angegeben ist ISO/TC37 Um einen gemeinsamen standardisierten Rahmen für die Konstruktion von Lexikonen einschließlich WordNet zu definieren. Die Teilmenge von LMF für WordNet wird WordNet-LMF genannt. Im Rahmen des Kyoto -Projekts wurde eine Instanziierung durchgeführt.[63]
- UNL -Programm ist ein Projekt unter der Schirmherrschaft von Uno Ziel, lexikosemantische Daten vieler Sprachen zu konsolidieren, die für die maschinelle Übersetzung verwendet werden sollen und Informationsextraktion Systeme.
- Bedeutet Affe ist ein kostenloses Online -Wörterbuch basierend auf der WordNet -Datenbank.
Verteilungen
Die WordNet -Datenbank wird als Wörterbuchpaket (normalerweise als einzelne Datei) für die folgende Software verteilt:
Siehe auch
Verweise
- ^ "Wordnet News".
- ^ "Wortnetze in der Welt". Global WordNet Association. Abgerufen 19. Januar 2020.
- ^ "WordNet -Suche - 3.1".
- ^ G. A. Miller, R. Beckwith, C. D. Fellbaum, D. Gross, K. Miller. 1990. WordNet: Eine lexikalische Online -Datenbank. Int. J. Lexikograph. 3, 4, S. 235–244.
- ^ "Über Global WordNet Association". Global WordNet. Abgerufen 19. Januar 2020.
- ^ "WordNet Statistics". Wordnet.princeton.edu. Abgerufen 2018-06-22.
- ^ Collins A., Quillian M. R. 1972. Experimente zum semantischen Gedächtnis und zum Sprachverständnis. Im Kognition in Lernen und Gedächtnis. Wiley, New York.
- ^ "Integration von WordNet 1.7 in WebKB-2". Webkb.org. Abgerufen 2014-03-11.
- ^ Gangemi, A.; Navigli, R.; Velardi, P. (2003). Das OnTowordNet -Projekt: Erweiterung und Axiomatisierung der konzeptionellen Beziehungen in WordNet (PDF). Proc. der Internationalen Konferenz für Ontologien, Datenbanken und Anwendungen der Semantik (Odbase 2003). Catania, Sizilien (Italien). S. 820–838.
- ^ Oltramari, A.; Gangemi, A.; Guarino, N.; Masolo, C. (2002). Umstrukturierungswordnets oberster Ebene: Der Ontoclean-Ansatz. Ontolex'2 Workshop, Ontologies und lexikalische Wissensbasis (LREC 2002). Las Palmas, Spanien. S. 17–26. Citeseerx 10.1.1.19.6574.
- ^ Rudnicka, Ewa; Bond, Franziskus; Grabowski, łukasz; Piacki, Maciej; Piotrowski, Tadeusz (2018). "Lexikalische Perspektive auf WordNet to WordNet Mapping". Proceedings der 9. Global WordNet Conference (GWC 2018): 210.
- ^ Bond, Franziskus; Foster, Ryan (2013). "Verknüpfung und Erweiterung eines offenen mehrsprachigen Wordnets" (PDF). Verfahren der 51. Jahrestagung des Vereins für Computer -Linguistik: 1352–1362. Abgerufen 20. Januar 2020.
- ^ Fellbaum, Christiane; Vossen, Piek (2012). "Herausforderungen für ein mehrsprachiges Wordnet". Sprachressourcen und Bewertung. 46 (2): 313–326. doi:10.1007/S10579-012-9186-Z. S2CID 10117946.
- ^ R. Navigli. Disambiguation von Wort Sinn: Eine Umfrage, ACM Computing -Umfragen, 41 (2), 2009, S. 1–69
- ^ E. Agirre, O. Lopez. 2003. Clustering WordNet Word -Sinne. Im Proc. der Konferenz über die jüngsten Fortschritte in der natürlichen Sprache (RANLP'03)Borovetz, Bulgarien, S. 121–130.
- ^ R. Navigli. Eine sinnvolle Clusterbildung von Sinnen hilft dabei, Im Proc. der 44. Jahrestagung des Vereins für Computer-Linguistik gemeinsam mit der 21. Internationalen Konferenz für Computer-Linguistik (Coling-ACL 2006), Sydney, Australien, 17. Juli 2006, S. 105–112.
- ^ R. Snow, S. Prakash, D. Jurafsky, A. Y. Ng. 2007. Lernen, Word -Sinne zusammenzuführen, In Proc. der gemeinsamen Konferenz von 2007 über empirische Methoden in der Verarbeitung natürlicher Sprache und des Lernens der natürlichen Sprache (EMNLP-Conll), Prag, Tschechische Republik, S. 1005–1014.
- ^ Julia Carrie Wong. 2019. Die virale Selfie -App ImageNet Roulette schien Spaß zu machen, bis es mich einen rassistischen Slur nannte. Der Wächter
- ^ Francis Bond und Kyonghee Paik 2012a. Eine Übersicht über Wordnets und deren Lizenzen. In Proceedings of the 6. Global WordNet Conference (GWC 2012). Matsue. 64–71
- ^ "Öffnen Sie mehrsprachiger Wordnet". concling.hss.ntu.edu.sg. Abgerufen 10. April 2018.
- ^ "Ted Pedersen - Wordnet :: Ähnlichkeit". D.umn.edu. 2008-06-16. Abgerufen 2014-03-11.
- ^ NLP mit Python NLTK/
- ^ M. T. Pilehvar, D. Jürgens und R. Navigli. Ausrichtung, Disams und Gehen: Ein einheitlicher Ansatz zur Messung der semantischen Ähnlichkeit.. Proc. der 51. Jahrestagung des Vereins für Computer-Linguistik (ACL 2013), Sofia, Bulgarien, 4. bis 9. August 2013, S. 1341-1351.
- ^ Ballatore A, et al. (2014). "Geografische Vokabulare durch Wordnet verbinden". Annalen von Gis. 20 (2): 73–84. Arxiv:1404.5372. Bibcode:2014ArXIV1404.5372B. doi:10.1080/19475683.2014.904440. S2CID 9246582.
- ^ "Verwandte Projekte - Wordnet - Verwandte Projekte". Wordnet.princeton.edu. 2014-01-06. Abgerufen 2018-06-22.
- ^ The Global WordNet Association (2010-02-04). "globalwordnet.org". globalwordnet.org. Abgerufen 2014-03-11.
- ^ "Wortnetze in der Welt". Archiviert von das Original Am 2011-10-21.
- ^ Black W., Elkateb S., Rodriguez H., Alkhalifa M., Vossen P., Pease A., Bertran M., Fellbaum C. (2006) Das arabische Wordnet -Projekt, Proceedings of LREC 2006
- ^ Lahsen Abouenour, Karim Bouzoubaa, Paolo Rosso (2013) über die Bewertung und Verbesserung der arabischen Wordnet -Berichterstattung und -Dutzbarkeit, Sprachressourcen und Bewertung 47 (3) S. 891–917
- ^ D. Tufis, D. Cristea, S. Stamou. 2004. Balkanet: Ziele, Methoden, Ergebnisse und Perspektiven. Ein allgemeiner Überblick. Rumänisch J. Sci. Technik. Informieren. (Sonderausgabe auf Balkanet), 7 (1-2), S. 9–43.
- ^ "Bulnet". dcl.bas.bg. Abgerufen 2015-05-07.
- ^ Chinesische Wordnet (中文 詞彙 網路) offizielle Seite an der National Taiwan University
- ^ P. Vossen, hrsg. 1998. Eurowordnet: Eine mehrsprachige Datenbank mit lexikalischen semantischen Netzwerken. Kluwer, Dordrecht, Niederlande.
- ^ "The Global WordNet Association". Globalwordnet.org. 2010-02-04. Abgerufen 2014-01-05.
- ^ "Finnwordnet - Das finnische Wordnet - Abteilung für allgemeine Linguistik". Ling.helsinki.fi. Abgerufen 2014-01-05.
- ^ "Germanet". Sfs.uni-tueBingen.de. Abgerufen 2014-03-11.
- ^ Pushpak Bhattacharyya, Indowordnet, Lexical Resources Engineering Conference 2010 (LREC 2010), Malta, Mai 2010.
- ^ C. Mouton, G. de Chalendar. 2010.Jaws: Nur eine andere Wordnet -Untergruppe. Im Proc. von Taln 2010.
- ^ Webseite
- ^ "MCR 3.0 | Adimen". Adimen.si.ehu.es. Abgerufen 2022-03-21.
- ^ E. Pianta, L. Bentivogli, C. Girardi. 2002. MultiWordNet: Entwicklung einer ausgerichteten mehrsprachigen Datenbank. Im Proc. der 1. Internationalen Konferenz über globales Wordnet, Mysore, Indien, S. 21–25.
- ^ "Öffnen Sie niederländisches Wordnet". WordPress.let.vupr.nl. 2015-10-28. Abgerufen 2022-03-21.
- ^ "Arademaker/OpenWordNet-PT-GitHub". Github.com. Abgerufen 2014-01-05.
- ^ Offizielle Webseite
- ^ Offizielle Webseite
- ^ ". Pgups.ru. Abgerufen 2014-01-05.
- ^ Balkova, Valentina; Sukhonogov, Andrey; Yablonsky, Sergey (2003). "Russisches Wordnet von UML-NOTATION zur Implementierung zwischen Netz-/Intranet-Datenbank" (PDF). GWC 2004 Proceedings: 31–38. Abgerufen 12. März 2017.
- ^ "Russnet:. Project.phil.spbu.ru. Abgerufen 2014-03-11.
- ^ "UWN: Auf dem Weg zu einem universellen mehrsprachigen Wordnet-D5: Datenbanken und Informationssysteme (Max-Planckinstitut für Informatik)". Mpi-inf.mpg.de. 2011-08-14. Abgerufen 2014-01-05.
- ^ S. Benoît, F. Darja. 2008. Aufbau eines kostenlosen französischen Wortnetzes aus mehrsprachigen Ressourcen. Im Proc. von Ontolex 2008, Marrakesch, Maroc.
- ^ R. Navigli, S. P. Ponzetto. Babelnet: Aufbau eines sehr großen mehrsprachigen semantischen Netzwerks. Proc. der 48. Jahrestagung des Vereins für Computer -Linguistik (ACL 2010), Uppsala, Schweden, 11. bis 16. Juli 2010, S. 216–225.
- ^ A. Pease, I. Niles, J. Li. 2002. Die vorgeschlagene obere fusionierte Ontologie: Eine große Ontologie für das semantische Web und seine Anwendungen. Im Proc. des AAAI-2002 Workshops on Ontologies und des semantischen Webs, Edmonton, Kanada.
- ^ S. Reed und D. Lenat. 2002. Zuordnung von Ontologien in CYC. Im Proc. der AAAI 2002 Konferenz Workshop über Ontologien für das semantische Web, Edmonton, Kanada, 2002
- ^ Masolo, C., Borgo, S., Gangemi, A., Guarino, N., Oltramari, A., Schneider, L.S. 2002. Wonderweb lieferbar D17. Die Wonderweb -Bibliothek der Grundlagen und die Dolce Ontology. Bericht (Ver. 2.0, 15-08-2002)
- ^ Gangemi, A., Guarino, N., Masolo, C., Oltramari, A. 2003 Süßwordnetz mit Dolce. Im AI Magazine 24 (3): Herbst 2003, S. 13–24
- ^ C. Bizer, J. Lehmann, G. Kobilarov, S. Auer, C. Becker, R. Cyganiak, S. Hellmann. Dbpedia - Ein Kristallisationspunkt für das Datennetz. Web Semantics, 7 (3), 2009, S. 154–165
- ^ S. M. Harabagiu, G. A. Miller, D. I. Moldawovan. 1999. Wordnet 2 - Eine morphologische und semantisch verbesserte Ressource. Im Proc. des ACL -Siglex -Workshops: Standardisierung der lexikalischen Ressourcen, S. 1–8.
- ^ J. Deng, W. Dong, R. Socker, L. Li, K. Li, L. Fei-Fei. ImageNet: Eine großflächige hierarchische Bilddatenbank. Im Proc. von 2009 IEEE -Konferenz zur Computer Vision und Mustererkennung
- ^ M. Poprat, E. BEISSWANGER, U. Hahn. 2008. Erstellen eines BioWordNet, indem Sie die Datenformate von WordNet und die Softwareinfrastruktur von WordNet verwenden - eine Fehlergeschichte. Im Proc. des Software -Engineering, Tests und Qualitätssicherung für den Workshop für natürliche Sprachverarbeitung, S. 31–39.
- ^ S. Ponzetto, R. Navigli. Große Taxonomie-Kartierung zur Umstrukturierung und Integration von Wikipedia, Im Proc. der 21. Internationalen gemeinsamen Konferenz über künstliche Intelligenz (IJCAI 2009), Pasadena, Kalifornien, 14.-17. Juli 2009, S. 2083–2088.
- ^ S. P. Ponzetto, R. Navigli. Wissens Sinn für Wort Sinn Disambiguation mit beobachteten Systemen konkurrieren. In Proc. der 48. Jahrestagung des Vereins für Computer -Linguistik (ACL), 2010, S. 1522–1531.
- ^ S. Baccianella, A. Esuli und F. Sebastiani. SentiWordnet 3.0: Eine verbesserte lexikalische Ressource für die Stimmungsanalyse und Meinungsabbau. In Proceedings der 7. Konferenz über Sprachressourcen und Bewertung (LREC'10), Valletta, MT, 2010, S. 2200–2204.
- ^ Piek Vossen, Claudia Soria, Monica Monachini: Wordnet-LMF: Eine Standarddarstellung für mehrsprachige Wörter, in LMF Lexikaler Markup -Framework, herausgegeben von Gil Francopoulo Iste / Wiley 2013 ( ISBN978-1-84821-430-9)
- ^ "Babylon Wordnet". Babylon.com. Abgerufen 2014-03-11.
- ^ "Goldendict - Durchsuchen /Wörterbücher bei SourceForge.net". SourceForge.net. 2010-12-01. Abgerufen 2014-01-05.
- ^ "Lingoes Wordnet". Lingoes.net. 2007-11-16. Abgerufen 2014-03-11.
Externe Links
- Offizielle Website
- "Malayalam Wordnet". Informatik. Cochin University of Science & Technology.
- Pilato, Maria. "Adjektive, Verstärker, Negationen (Ain) Thesaurus". Italienisches Gefühl.