Wiktionär

Wiktionär
WiktionaryEn - DP Derivative.svg
Englisches Wiktionär -Logo
Bildschirmfoto
English Wiktionary Main Page.png
Hauptseite des englischen Wiktionary am 14. Januar 2019
Art der Site
Online Wörterbuch
Verfügbar in Mehrsprachig (159 aktiv)[1]
Eigentümer Wikimedia Foundation
Erstellt von Jimmy Wales und die Wikimedia Gemeinschaft
URL wiktionär.org
Kommerziell Nein
Anmeldung Optional
Gestartet 12. Dezember 2002; Vor 19 Jahren
Aktueller Status Aktiv

Wiktionär ist eine mehrsprachige, Netz-basiertes Projekt zum Erstellen von a Kostenloser Inhalt Wörterbuch von Begriffen (einschließlich Wörter, Phrasen, Sprichwörter, Sprachrekonstruktionenusw.) in allen natürliche Sprachen und in einer Reihe von künstliche Sprachen. Diese Einträge können enthalten Definitionen, Bilder für Illustrationen, Aussprachen, Etymologien, Beugungen, Nutzungsbeispiele, Zitate, verwandte Begriffe und Übersetzungen von Wörtern in andere Sprachen, unter anderem. es ist gemeinsam bearbeitet über ein Wiki. Sein Name ist a Handkoffer der Worte Wiki und Wörterbuch. Es ist in 183 Sprachen erhältlich und in Einfaches Englisch. Wie sein Schwesterprojekt Wikipedia, Wiktionary wird von der betrieben Wikimedia Foundationund wird gemeinsam von geschrieben von Freiwillige, genannt "Wiktionarianer". Es ist Wiki -Software, MediawikiErmöglicht fast jedem, der auf die Website zugreifen kann, um Einträge zu erstellen und zu bearbeiten.

Da WiKtionary nicht durch Druckraumüberlegungen begrenzt ist, bieten die meisten Sprachausgaben von WiKtionary Definitionen und Übersetzungen von Wörtern aus vielen Sprachen, und einige Ausgaben bieten zusätzliche Informationen, die normalerweise in gefunden wurden Thesauri.

Die Daten von WiKtionary werden häufig in verschiedenen verwendet Verarbeitungsaufgaben für natürliche Sprache.

Geschichte und Entwicklung

Wiktionary wurde am 12. Dezember 2002 online gebracht.[2] Nach einem Vorschlag von Daniel Alston und einer Idee von Larry SangerMitbegründer von Wikipedia.[3] Am 28. März 2004 der erste Nicht-NichtsEnglisch Wiktionäre wurden initiiert in Französisch und Polieren. Wikionäre in zahlreichen anderen Sprachen wurden seitdem begonnen. Wiktionary wurde vorübergehend veranstaltet Domainname (wikttionary.wikipedia.org) Bis zum 1. Mai 2004, als es auf den aktuellen Domänennamen wechselte.[a] Ab Juli 2021, Wiktionary über 30 Millionen Artikel (und noch mehr Einträge) in seinen Ausgaben.[4] Das größte der Sprachausgaben ist der englische Wiktionary mit über 7,1 Millionen Einträgen, gefolgt von der Französisch Wiktionär mit über 4,4 Millionen und die Madagasy Wiktionär mit über 1,6 Millionen Einträgen. Dreiundvierzig wiktionäre Sprachausgaben enthalten jeweils über 100.000 Einträge.[b]

Die Verwendung von Bots Um eine große Anzahl von Artikeln zu erzeugen, ist in diesem Diagramm der Artikel bei den größten acht Wiktionary -Editionen als "Wachstumsschübe" sichtbar. (Daten zum Dezember 2009)

Viele der Definitionen der größten Sprachausgaben des Projekts wurden von Bots erstellt, die kreative Möglichkeiten zum Generieren von Einträgen oder (selten) automatisch Tausende von Einträgen aus zuvor veröffentlichten Wörterbüchern gefunden haben. Sieben der 18 Bots, die 2007 im englischen Wiktionary registriert sind[c] Erstellt 163.000 der Einträge dort.[5]

Ein weiterer dieser Bots, "ThirdPersbot", war für die Hinzufügung einer Reihe von verantwortlich dritte Person Konjugationen Das hätte ihre eigenen Einträge in Standardwörterbüchern nicht erhalten; Zum Beispiel definierte es "Smoulders" als "einzigartige, einfache Form von Schwierigkeiten" drittpersonen. Von den 1.269.938 Definitionen, die der englische Wiktionary für 996.450 englische Wörter bereitstellt, sind 478.068 "Form der" Definitionen dieser Art.[6] Dies bedeutet, dass auch ohne solche Einträge die Berichterstattung über Englisch erheblich größer ist als die der wichtigsten einsprachigen Druckwörterbücher. Merriam-Websters drittes neues internationales Wörterbuch der englischen Sprache, ungekürztZum Beispiel hat 475.000 Einträge (mit vielen zusätzlichen eingebetteten Headwörtern); das Oxford Englisch Wörterbuch hat 615.000 Headwords, beinhaltet aber Mittleres Englisch Auch für die der englische Wiktionary weitere 34.234 Gloss Definitionen hat. Es gibt detaillierte Statistiken, um zu zeigen, wie viele Einträge verschiedener Arten existieren.

Der englische Wiktionary stützt sich nicht auf Bots, sofern einige andere Ausgaben. Das Französisch und Vietnamesisch Wikionäre zum Beispiel importierten große Abschnitte der freien Vietnamesisch Dictionary Project (FVDP), das zweisprachige inhaltliche Wörterbücher für und von Vietnamesen bietet.[d] Diese importierten Einträge machen praktisch den gesamten Inhalt der vietnamesischen Ausgabe aus. Wie die englische Ausgabe hat der französische Wiktionary ungefähr 20.000 Einträge aus dem importiert Unihan Datenbank von Chinesische, japanische und koreanische Charaktere. Der französische Wikionary wuchs 2006 rasant, dank Bots, die viele Einträge aus alten, frei lizenzierten Wörterbüchern wie der achten Ausgabe der kopierten Dictionnaire de l'Académie Française (1935, rund 35.000 Wörter), und verwenden Bots, um Wörter aus anderen wiktionären Ausgaben mit französischen Übersetzungen hinzuzufügen. Das Russisch Die Ausgabe wuchs um fast 80.000 Einträge, da "LXBOT" Kesselplatteneinträge (mit Überschriften, jedoch ohne Definitionen) für Wörter in Englisch und hinzugefügt hat Deutsch.[7]

Ab Juli 2021 hat En. wiktionary über 791.870 Glanz Definitionen und über 1.269.938 Gesamtdefinitionen (einschließlich verschiedener Formen) allein für englische Einträge mit insgesamt über 9.928.056 Definitionen in allen Sprachen.[8]

Logos

Wiktionary hat in den zahlreichen Sprachausgaben historisch gesehen ein einheitliches Logo gefehlt. Einige Ausgaben verwenden Logos, die einen Wörterbucheintrag über den Begriff "wiktionarisch" darstellen, der auf dem vorherigen englischen Wiktionary -Logo basiert, das von Brion Viib, a Mediawiki Entwickler.[9] Da ein reines Textlogo von Sprache zu Sprache erheblich variieren muss, fand von September bis Oktober 2006 ein vierphasiger Wettbewerb zur Annahme eines einheitlichen Logos im Wikimedia Meta-Wiki statt.[e] Einige Gemeinden übernahmen den Siegereintrag von "Smurrayinchester", einem 3 × 3 -Gitter aus Holzfliesen, der jeweils einen Charakter aus einem anderen Schreibsystem trägt. In der Umfrage wurde jedoch nicht so viel Teilnahme der Wiktionary -Community festgestellt, wie einige Gemeindemitglieder gehofft hatten, und einige der größeren Wikis behielten letztendlich ihre Textlogos.[e]

Im April 2009 wurde das Problem mit einem neuen Wettbewerb wieder auferstanden. Diesmal gewann eine Darstellung von "Aaengelman" eines offenen Hardbound-Wörterbuchs eine Kopf-an-Kopf-Abstimmung gegen das Logo von 2006, aber der Prozess, um das neue Logo zu verfeinern und zu übernehmen, stand auf.[10] In den folgenden Jahren ersetzten einige Wikis ihre Textlogos durch einen der beiden neueren Logos. Im Jahr 2012 erhielten 55 Wikis, die das englische Wiktionary -Logo verwendeten, lokalisierte Versionen des Designs 2006 von "SMurrayinchester".[f] Im Juli 2016 nahm der englische Wiktionary eine Variante dieses Logos an.[11] Ab dem 4. Juli 2016, 135 Wikis, die 61%der Einträge von WiKtionary repräsentieren, verwenden ein Logo, das auf dem Entwurf von 2006 von "Smurrayinchester" basiert, 33 Wikis (36%) verwenden ein Textlogo, und drei Wikis (3%) verwenden das Design 2009 von "Aaengelman". .[12]

Kriterien für die Gewährleistung der Genauigkeit

Um die Genauigkeit zu gewährleisten, hat der englische Wiker eine Richtlinie, nach der die Bedingungen erforderlich sind bestätigt.[13] Begriffe in wichtigen Sprachen wie Englisch und Chinesisch müssen überprüft werden durch:

  1. eindeutig weit verbreitete Verwendung oder
  2. Verwendung in dauerhaft aufgezeichneten Medien, die Bedeutung in mindestens drei unabhängigen Fällen über mindestens ein Jahr vermitteln.

Für weniger dokumentierte Sprachen wie z. Bach und ausgestorbene Sprachen wie z. LateinEine Verwendung in einem dauerhaft aufgezeichneten Medium oder einer Erwähnung in einer Referenzarbeit ist eine ausreichende Überprüfung.

Mehrsprachig

Ab Juli 2022 gibt es Wikionsstandorte für 183 Sprachen, von denen 159 aktiv sind und 24 geschlossen sind.[1] Die aktiven Stellen haben 31.856.628 Artikel und die geschlossenen Stellen 339 Artikel.[14] Es gibt 6.658.016 registrierte Benutzer, von denen in letzter Zeit 5.559 aktiv sind.[14]

Die zehn Top -Projekte für wiktionäre Sprache von Mainspace -Artikel zählen:[14]

Sprache Wiki Gut Gesamt Änderungen Admins Benutzer Aktive Benutzer Dateien
1 Englisch en 7,128,863 8,235.898 68.451.250 107 3.956.834 1.893 24
2 Französisch fr 4,465.316 4,809.259 30.646.076 36 330.981 456 6
3 Madagasy mg 1.753.945 1,811.344 29,250,109 2 10.062 17 3
4 Chinesisch zh 1,204.940 1.808.778 7.262.305 9 105.878 90 1
5 Russisch Ru 1.201.426 2.491.591 12.409.029 14 281.595 227 144
6 Deutsch de 1.051.446 1,223.095 9.239.577 16 215.436 181 103
7 Spanisch es 913,320 968,421 5.066.044 8 142.579 96 14
8 Serbo-Kroatischer Sch 911,601 916,460 1.469.729 2 7,293 12 3
9 Schwedisch SV 844,610 885,903 3.694.649 14 52.012 62 1
10 Niederländisch nl 820.569 1,102.537 4,545.806 11 51.654 64 7

Für eine vollständige Liste mit Gesamtsummen siehe Wikimedia -Statistik: [15]

kritischer Empfang

Der kritische Empfang von Wiktionary wurde gemischt. In 2006, Jill Lepore schrieb in dem Artikel "Noahs Arche" für Der New Yorker,[g]

Es gibt keine Händeausstellung bei Wiktionär. Es gibt nicht einmal ein Redaktionspersonal. "Sei dein eigener Lexikograph!" Wiktionary's Motto. Wer braucht Experten? Warum gut Geld für ein Wörterbuch bezahlen, das von Lexikographen geschrieben wurde, wenn wir selbst zusammenschustern?

Wiktionär ist nicht so sehr Republikaner oder demokratisch wie Maoist. Und es ist nur so gut wie das urheberrechtlich geschützt Bücher, von denen es stimmt.

Keir Graff's Rezension für Bücherliste war weniger kritisch:

Gibt es einen Platz für wiktionäre? Zweifellos. Die Branche und die Begeisterung ihrer vielen Schöpfer sind ein Beweis dafür, dass es einen Markt gibt. Und es ist wunderbar, eine weitere starke Quelle zu haben, die bei der Suche nach den seltsamen Begriffen in der heutigen sich schnell verändernden Welt und der Online-Umgebung auftritt. Wie bei so vielen Webquellen (einschließlich dieser Spalte) wird es jedoch am besten von anspruchsvollen Benutzern in Verbindung mit seriöseren Quellen verwendet.

Referenzen in anderen Veröffentlichungen sind flüchtig und Teil größerer Diskussionen über Wikipedia, nicht über eine Definition hinaus, obwohl David Brooks in Der Nashua Telegraph beschrieb es als "wild und wollig".[17] Eines der Hindernisse für die unabhängige Berichterstattung über Wikionary ist die anhaltende Verwirrung, dass es sich lediglich um eine Erweiterung der Wikipedia handelt.[h]

Das Maß für die Korrektheit der Beugungen für eine Untergruppe der polnischen Wörter im englischen Wikionary zeigte, dass diese grammatikalischen Daten sehr stabil sind. In nur 131 von 4.748 polnischen Wörtern wurden ihre Flexionsdaten korrigiert.[18]

Ab 2016, Wixtionary hat in einem wachsenden Einsatz in gesehen Akademie.[19]

Wiktionäre Daten in der Verarbeitung natürlicher Sprache

Wiktionary hat Halbstrukturierte Daten.[20] Wiktionär Lexikographie Daten können auf konvertiert werden auf maschinenlesbares Format Um in verwendet zu werden in Verarbeitung natürlicher Sprache Aufgaben.[21][22][23]

Wiktionary's Data Mining ist eine komplexe Aufgabe. Es gibt die folgenden Schwierigkeiten:[24]

    • (1) Die konstanten und häufigen Änderungen an Daten und Schemata
    • (2) Die Heterogenität in der wiktionären Sprachausgabe Schemata[ich] und
    • (3) die von Menschen zentrierte Natur von a Wiki.

Es gibt einige Parser Für verschiedene wiktionäre Sprachausgaben:[25]

Beispiele von Verarbeitung natürlicher Sprache Zu den Aufgaben, die mit Hilfe wiktionärer Daten gelöst wurden, gehören:

"Wikidata: Lexikografische Daten "wurde 2018 gestartet, um Wikitonaries strukturierter Daten zu unterstützen. Es speichert Wortdaten aller Sprachen in einem maschinenlesbaren Datenmodell unter einem Dedizierten."Lexeme"Namespace in Wikidata. Ab Oktober 2021 hat das Projekt über 600.000 Lexeme -Einträge verschiedener Sprachen angehäuft.[48]

Siehe auch

Anmerkungen

  1. ^ Die aktuelle URL von Wiktionary ist www.wiktionary.org
  2. ^ Es gibt hier wixtionary Total -Artikel. Hier finden Sie detaillierte Statistiken nach Wordtyp [1].
  3. ^ Die Benutzerliste in der englischen Wiktionary identifiziert Konten, die "Bot -Status" angegeben wurden.
  4. ^ Hồ ngọc ức, Freier vietnamesischer Wörterbuchprojekt. Details im vietnamesischen Wiktionary.
  5. ^ a b "Wiktionary/Logo", Meta-Wiki, Wikimedia Foundation.
  6. ^ [Übersetzer-L] 56 Wikionen haben ein lokalisiertes Logo erhalten
  7. ^ Der vollständige Artikel ist nicht online verfügbar.[16]
  8. ^ In diesem Zitat bezieht sich der Autor auf Wiktionary als Teil des Wikipedia -Standorts: Adaptiert aus einem Artikel von Naomi Detullio (2006). "Wikis für Bibliothekare" (PDF). Netls News #142. Northeast Texas Library System. p. 15. archiviert von das Original (PDF -Newsletter) am 5. Juni 2007. Abgerufen 21. April, 2007.
  9. ^ Z.B. Vergleichen Sie die Einstiegsstruktur und die Formatierungsregeln in englischer wiktionärer und russischer Wiktionärin.
  10. ^ Zitate werden nur aus russischer Wikionen extrahiert.[34]
  11. ^ Wenn es mehrere IPA -Notationen auf einer wiktionären Seite gibt - entweder für verschiedene Sprachen oder für Aussprachevarianten, wurde die erste Aussprache extrahiert.[40]
  12. ^ Der Quellcode und die Ergebnisse von POS-Tagging sind bei verfügbar https://code.google.com/p/wikily-supervised-pos-tagger

Verweise

Zitate

  1. ^ a b Wikimedia's Mediawiki API: Sitematrix. Abgerufen im Juli 2022 aus Daten: Wikipedia Statistics/Meta.Tab
  2. ^ "Wikipedia Mailing List Archive Diskussion, in der die Eröffnung des Wiktionary -Projekts angekündigt wird". Abgerufen 3. Mai, 2011.
  3. ^ Wikipedia Mailing List Archiv Diskussion von Larry Sanger, die die Idee zu Wiktionary - abgerufen am 3. Mai 2011
  4. ^ https://www.wiktionary.org/[nackte URL]
  5. ^ Thedavebot Archiviert 11. Oktober 2007 bei der Wayback -Maschine, Thecheatbot Archiviert 11. Oktober 2007 bei der Wayback -Maschine, Websterbot Archiviert 11. Oktober 2007 bei der Wayback -Maschine, PastBot Archiviert 11. Oktober 2007 bei der Wayback -Maschine, Nanshubot Archiviert 11. Oktober 2007 bei der Wayback -Maschine
  6. ^ Detaillierte Statistiken zum 21. Juli 2021
  7. ^ Lxbot Archiviert 24. Mai 2008 bei der Wayback -Maschine
  8. ^ Wiktionäre Statistik
  9. ^ "Wiktionary Talk: Wiktionary Logo", englische Wiktionary, Wikimedia Foundation.
  10. ^ "Wiktionary/Logo/Aktualisierung/Abstimmung", Meta-Wiki, Wikimedia Foundation.
  11. ^ PHAB: T139255
  12. ^ M: Wiktionary/Logo#Logo Verwenden Sie Statistiken.
  13. ^ "Wiktionary: Kriterien für die Aufnahme". Wiktionär. Abgerufen 13. März, 2015.
  14. ^ a b c Wikimedia's Mediawiki API: SiteInfo. Abgerufen im Juli 2022 aus Daten: Wikipedia Statistics/Daten.Tab
  15. ^ "Wikionary Statistics". Meta.wikimedia.org. Abgerufen 11. September, 2020.
  16. ^ Lepore 2006.
  17. ^ David Brooks, "Online, interaktive Enzyklopädie nicht mehr nur für Geeks, weil jeder es jetzt mehr denn je zu brauchen scheint!" Der Nashua Telegraph (4. August 2004)
  18. ^ Kurmas 2010.
  19. ^ Sascha & Müller-Spitzer 2016, p. 348
  20. ^ Meyer & Gurevych 2012, p. 140.
  21. ^ Zesch, Müller & Gurevych 2008, p. 4, Abbildung 1.
  22. ^ Meyer & Gurevych 2010, p. 40.
  23. ^ Krizhanovsky, Transformation 2010, p. 1.
  24. ^ Hellmann & Auer 2013, p. 302, p. 16 in PDF.
  25. ^ Hellmann, Brekle & Auer 2012, p. 3, Tabelle 1.
  26. ^ Dbpedia wiktionary Archiviert 4. Mai 2013 bei der Wayback -Maschine
  27. ^ Hellmann, Brekle & Auer 2012, S. 8–9.
  28. ^ Hellmann, Brekle & Auer 2012, p. 10.
  29. ^ Hellmann, Brekle & Auer 2012, p. 11.
  30. ^ Jwktl
  31. ^ Zesch, Müller & Gurevych 2008.
  32. ^ Wikokit
  33. ^ Krizhanovsky, Transformation 2010.
  34. ^ a b Smirnov et al. 2012.
  35. ^ Krizhanovsky, Vergleich 2010.
  36. ^ Etymologisches Wortnetz
  37. ^ Otte & Tyers 2011.
  38. ^ McFate & Forbus 2011.
  39. ^ Schlibne, Ochs & Schultz 2012.
  40. ^ Schlibne, Ochs & Schultz 2012, p. 4802.
  41. ^ Schlibne, Ochs & Schultz 2012, p. 4804.
  42. ^ Meyer & Gurevych 2012.
  43. ^ http://conceptnet5.media.mit.edu[nackte URL]
  44. ^ Lin & Krizhanovsky 2011.
  45. ^ Metero & Ostendorf 2009.
  46. ^ Li, Graça & Taskar 2012.
  47. ^ Chesley et al. 2006.
  48. ^ "Wikidata: Wiktionary". Abgerufen 12. Oktober, 2012.

Quellen

  • Krizhanovsky, Andrew (2010). "Umwandlung der wiktionären Eingabestruktur in Tabellen und Beziehungen in einem relationalen Datenbankschema". Arxiv:1011.1368 [CS].
  • Krizhanovsky, Andrew (2010). "Der Vergleich von wiktionärem Thesauri verwandelte sich in das maschinenlesbare Format". Arxiv:1006.5040 [CS].
  • Li, Shen; Graça, Joao V.; Taskar, Ben (2012). "Wiki-ly beaufsichtigte Teil des Speech-Taggings" (PDF). Proceedings der gemeinsamen Konferenz über empirische Methoden 2012 in der Verarbeitung natürlicher Sprache und des Lernens natürlicher Sprache. Jeju Island, Korea: Verein für Computer -Linguistik. S. 1389–1398. Archiviert von das Original (PDF) am 22. Mai 2013. Abgerufen 10. Mai, 2013.
  • Lin, Feiyu; Krizhanovsky, Andrew (2011). "Mehrsprachige Ontologie -Matching basierend auf wiktionären Daten, die über Sparql -Endpunkt zugänglich sind". Proc. der 13. russischen Konferenz über digitale Bibliotheken RCDL'2011. Voronezh, Russland. S. 19–26. Arxiv:1109.0732. Bibcode:2011ArXIV1109.0732L.
  • McFate, Clifton J.; Forbus, Kenneth D. (2011). "Nulex: Ein offenes Lexikon mit offener Lizenz" (PDF). Die 49. Jahrestagung des Vereins für Computer -Linguistik: Human Language Technologies, Proceedings of the Conference. Portland, Oregon, USA: Der Verein für Computer -Linguistik. S. 363–367. ISBN 978-1-932432-88-6.
  • "Wiktionär". Top 101 Websites. PC Magazine. Ziff Davis. 6. April 2005. Archiviert von das Original am 21. Dezember 2005. Abgerufen 16. Dezember, 2005.

Externe Links

  • Offizielle Website Edit this at Wikidata
  • Liste aller wiktionären Ausgaben
  • Wiktionär Android -Paket am F-droid Repository
  • Wiktionär an Google Play
  • Wiktionarische mehrsprachige Statistiken
  • Wikimedias Seite über Wiktionary (einschließlich Liste aller vorhandenen Wikionen)
  • Seiten über wiktionär in meta.