Rechtschreibprüfung

Im Software, a Rechtschreibprüfung (oder Rechtschreibprüfung oder Rechtschreibprüfung) ist ein Softwarefunktion das überprüft nach Rechtschreibfehlern in a Text. Fachprüfungsmerkmale sind häufig eingebettet in Software oder Dienstleistungen wie a Textverarbeitungssystem, E -Mail -Client, elektronisch Wörterbuch, oder Suchmaschine.

Auge hat einen Rechtschreibprüfung,
Es kam mit meinem Erbsenmeer.
It Flugzeug Lee markiert vier meine Revue
Fräulein Steaks Ich kann Meer knoten.

Auge schlägt die Kais und tippen
Und Gewicht vier es zwei sagen
Wetter Auge ich schreibe oar falsch
Es sagt mir gerade einen Gewicht.

Auge rannte dieses Gedicht, warf es,
Dein Ufer wirklich froh zwei nein.
Es variiert in seinem Gewicht.
Mein Checker melderte mich nähen.

Ein Checker ist eine Segen, Sache,
Es friere Eibenklopfen aus Thymian ein.
Es hilft mir, alle Stiles des Rechts zu richtig,
Und unterstützt mich, wenn ich Rime Rime.

Jede Befrauungen werden auf meinem Bildschirm aufgestellt
Auge tätig zu Biene eine Joule.
Der Checker gießt über jedes Wort ein
Zwei Überprüfungs -Summe Rechtschreibregel.

Die Originalversion dieses Gedichts wurde 1992 von Jerrold H. Zar geschrieben. Ein ungekünstelter Zauberprüfer findet dieses Gedicht nur wenig oder gar keine Fehler, da er isoliert die Wörter überprüft. Eine anspruchsvollere Zauberprüfung nutzt a Sprachmodell den Kontext zu berücksichtigen, in dem ein Wort auftritt.
Google Chrome Zauberprüfung in Aktion für das obige Gedicht, das Wort "Checker", das als nicht anerkanntes Wort gekennzeichnet ist

Entwurf

Ein grundlegender Zauberprüfung führt die folgenden Prozesse durch:

  • Es scannt den Text und extrahiert die darin enthaltenen Wörter.
  • Anschließend vergleicht es jedes Wort mit einer bekannten Liste korrekt geschriebener Wörter (d. H. Ein Wörterbuch). Dies kann nur eine Liste von Wörtern enthalten, oder es kann auch zusätzliche Informationen enthalten, z.
  • Ein zusätzlicher Schritt ist ein sprachabhängiger Algorithmus für die Handhabung Morphologie. Sogar für eine leicht gebogene Sprache wie EnglischDie Zauberprüfung muss unterschiedliche Formen desselben Wortes berücksichtigen, wie z. B. Pluralen, verbale Formen, Kontraktionen, und Possessive. Für viele andere Sprachen, wie diejenigen, die Agglutination und komplexere Deklination und Konjugation aufweisen, ist dieser Teil des Prozesses komplizierter.

Es ist unklar, ob die morphologische Analyse - die für viele Formen eines Wortes abhängt, abhängig von seiner grammatikalischen Rolle - einen bedeutenden Vorteil für Englisch bietet, obwohl seine Vorteile für hohe Vorteile synthetische Sprachen Deutsch, ungarisch oder türkisch sind klar.

Als Ergänzung zu diesen Komponenten des Programms des Programms Benutzeroberfläche Ermöglicht Benutzern die Genehmigung oder Ablehnung des Austauschs und ändern den Vorgang des Programms.

Zauberprüfern können verwenden ungefähre Zeichenfolge Matching Algorithmen wie Levenshtein -Entfernung Um korrekte Schreibweisen von falsch geschriebenen Wörtern zu finden.[1] Eine alternative Art von Zauberprüfung verwendet ausschließlich statistische Informationen, wie z. N-Gramm, um Fehler anstelle von korrekt ausgegebenen Wörtern zu erkennen. Dieser Ansatz erfordert normalerweise große Anstrengungen, um ausreichende statistische Informationen zu erhalten. Zu den wichtigsten Vorteilen gehört, dass weniger Laufzeitspeicher benötigt wird, und die Möglichkeit, Fehler in Wörtern zu korrigieren, die nicht in einem Wörterbuch enthalten sind.[2]

In einigen Fällen verwenden Rechtschreibprüfer eine feste Liste von Rechtschreibfüller und Anregungen für diese falsch fehlerhaften; Dieser weniger flexible Ansatz wird häufig in papierbasierten Korrekturmethoden verwendet, wie sie siehe auch Einträge von Enzyklopädien.

Clustering -Algorithmen wurden auch für die Zauberprüfung verwendet[3] kombiniert mit phonetischen Informationen.[4]

Geschichte

Pre-PC

1961,, Les ernst, der die Forschung zu dieser aufkeimenden Technologie leitete, sah es für notwendig, den ersten Zauberprüfer aufzunehmen, der auf eine Liste von 10.000 akzeptablen Wörtern zugegriffen hatte.[5] Ralph Gorin, ein zu diesem Zeitpunkt ernsthafter Doktorand, erstellte das erste echte Rechtschreibprüfungsprogramm, das als Anwendungsprogramm (anstelle von Forschung) für den allgemeinen Englischtext geschrieben wurde: Spell für die DEC-PDP-10 im Februar der künstlichen Intelligenz der Stanford University der Universität der Stanford University 1971.[6] Gorin schrieb Zauber Montagesprache, für schnellere Aktion; Er machte den ersten Rechtschreibkorrektor, indem er nach der Wortliste nach plausiblen korrekten Schreibweisen suchte, die sich durch einen einzelnen Buchstaben oder benachbarten Buchstabentranspositionen unterscheiden und sie dem Benutzer präsentierten. Gorin machte den Zauber öffentlich zugänglich, wie es bei den meisten Segelprogrammen (Stanford Artificial Intelligence Laboratory) vorhanden war, und verbreitete sich bald über das neue Arpanet auf die Welt, etwa zehn Jahre bevor PCs allgemein verwendet wurden.[7] Zauber, seine Algorithmen und Datenstrukturen inspirierten die Unix Ich buchstabiere Programm.

Die ersten Zauberprüfern waren Ende der 1970er Jahre auf Mainframe -Computern weit verbreitet. Eine Gruppe von sechs Linguisten von Georgetown Universität entwickelte das erste Zauberprüfsystem für die IBM Corporation.[8]

Henry Kučera Erfunden Sie 1981 für die VAX -Maschinen der Digital Equipment Corp.[9]

Stck

Die ersten Zauberprüfungen für PCs -Computer erschienen 1980, wie "Wordcheck" für Commodore Systems, das Ende 1980 rechtzeitig veröffentlicht wurde, damit Werbung im Januar 1981 zum Druck gedruckt wurde.[10] Entwickler wie Maria Mariani[8] und Beliebiges Haus[11] gehetzt OEM Pakete oder Endbenutzerprodukte in den schnell wachsenden Softwaremarkt. Auf den PCs der Pre-Windows waren diese Zauberprüfers eigenständige Programme, von denen viele in der Leitung geführt werden konnten TSR Modus aus Word-Prozessing-Paketen auf PCs mit ausreichendem Speicher.

Der Markt für eigenständige Pakete war jedoch kurzlebig, wie Mitte der 1980er Jahre Entwickler der beliebten Wortverarbeitungspakete wie WordStar und WordPerfect hatte Zaubersprüche in ihre Pakete aufgenommen, hauptsächlich aus den oben genannten Unternehmen, die die Unterstützung von Just Just schnell erweiterten Englisch zu vielen europäisch und schließlich sogar Asiatische Sprachen. Dies erforderte jedoch eine zunehmende Raffinesse in den Morphologie-Routinen der Software, insbesondere in Bezug auf starkeagglutinativ Sprachen mögen ungarisch und finnisch. Obwohl die Größe des Wortverarbeitungsmarktes in einem Land wie Island Möglicherweise hat die Investition in die Implementierung eines Zauberprüfers nicht gerechtfertigt. Unternehmen wie WordPerfect haben sich dennoch bemüht, ihre Software für möglichst viele nationale Märkte wie möglich zu lokalisieren Marketing Strategie.

Als Apple "eine systemweite Rechtschreibprüfung" für Mac OS X entwickelte, so dass "das Betriebssystem Rechtschreibfixes übernahm", wurde die Korrekturen von Rechtschreibungen übernommen "[12] Es war eine Premiere: Einer "musste nicht für jedes Programm einen separaten Schreibprüfer unterhalten.[13] Mac OS XDie Berichterstattung über die Berichterstattung über die Berichterstattung über alle gebündelten und Drittanbieter verfügt über.

Visuelle Werkzeuge ' VT Speller1994 eingeführt wurde "für Entwickler von Anwendungen konzipiert, die Windows unterstützen".[14][15] Es kam mit einem Wörterbuch, hatte aber die Fähigkeit, sekundäre Wörterbücher zu bauen und zu integrieren.[16]

Browser

Feuerfuchs 2.0, a Webbrowser, hat Rechtschreibprüfungsunterstützung für benutzerschriebene Inhalte,[17] wie beim Bearbeiten von Wikitext, über viele schreiben Webmail Standorte, Blogs, und soziales Netzwerk Websites. Die Webbrowser Google Chrome, Konqueror, und Oper, der E -Mail -Client Kmail und die Instant Messaging Klient Pidgin Bieten Sie auch die Unterstützung bei der Prüfung des Zaubersprüchens an, transparent bis zuvor transparent verwendet Gnu Aspell und derzeit Hunspell als ihr Motor.

Spezialitäten

Einige Zauberspurprüfer unterstützen medizinische Wörterbücher separat, um medizinische Fehler zu vermeiden.[18][19][20]

Funktionalität

Die ersten Zauberprüfern waren "Verifungsanlagen" anstelle von "Korrektoren". Sie gaben keine Vorschläge für falsch geschriebene Wörter an. Dies war hilfreich für Tippfehler Aber es war nicht so hilfreich für logische oder phonetische Fehler. Die Herausforderung der Entwickler war die Schwierigkeit, nützliche Vorschläge für falsch geschriebene Wörter zu machen. Dies erfordert das Reduzieren von Wörtern auf eine Skelettform und das Anwenden von Musteranpassungsalgorithmen.

Es mag logisch erscheint, dass es sich bei der Bedenken von Wörterbüchern "umso besser", sodass die korrekten Wörter nicht als falsch gekennzeichnet sind. In der Praxis scheint eine optimale Größe für Englisch jedoch rund 90.000 Einträge zu beträgt. Wenn es mehr als dieses gibt, können fälschlicherweise geschriebene Wörter übersprungen werden, weil sie mit anderen gehalten werden. Zum Beispiel könnte ein Sprachwissenschaftler auf der Grundlage der Grundlage bestimmen Korpuslinguistik das das Wort Baht ist häufiger ein Missschreibing von Bad oder Schläger als ein Hinweis auf die thailändische Währung. Daher wäre es normalerweise nützlicher, wenn einige Leute, die über die thailändische Währung schreiben, leicht belästigt wären, als wenn die Rechtschreibfehler der vielen weiteren Menschen, die über Bäder sprechen, übersehen würden.

Ein Screenshot von Verzaubern, das ABIWORD Rechtschreibprüfung.

Die ersten MS-DOS-Zaubersprüche wurden hauptsächlich im Proof-Modus aus Textverarbeitungspaketen verwendet. Nach der Vorbereitung eines Dokuments scannte ein Benutzer den Text, der nach Rechtschreibfehler suchte. Später wurde jedoch in Paketen wie die Batch -Verarbeitung angeboten OrakelDer kurzlebige Co-Autor und erlaubte einem Benutzer, die Ergebnisse nach dem Verarbeiten eines Dokuments anzuzeigen und nur die Wörter zu korrigieren, von denen bekannt war, dass sie falsch waren. Als Speicher- und Verarbeitungsleistung reichlich vorhanden war, wurde die Zauberprüfung auf interaktive Weise im Hintergrund durchgeführt, wie es bei der Sektorsoftware, die 1987 veröffentlicht wurde Microsoft Word Seit Word 95.

In den letzten Jahren sind Zauberprüfern zunehmend anspruchsvoller geworden. Einige sind jetzt in der Lage, einfach zu erkennen grammatikalisch Fehler. Aber selbst in Bestform fangen sie selten alle Fehler in einem Text auf (wie z. Homophon Fehler) und wird markieren neologisms und fremde Worte als Rechtschreibfehler. Trotzdem können Zauberprüfern als eine Art von Art von betrachtet werden Fremdsprachenschreibhilfe dass sich nicht einheimische Sprachlernende darauf verlassen können, um ihre Missschüttungen in der Zielsprache zu erkennen und zu korrigieren.[21]

Zauberprüfung für andere Sprachen als Englisch

Englisch ist insofern ungewöhnlich, dass die meisten Wörter, die in formalen Schreiben verwendet werden, eine einzige Schreibweise haben, die in einem typischen Wörterbuch mit Ausnahme einiger Jargon und modifiziertem Wörtern zu finden ist. In vielen Sprachen sind Worte oft verkettet in neue Kombinationen von Wörtern. Auf Deutsch werden zusammengesetzte Substantive häufig aus anderen vorhandenen Substantiven geprägt. Einige Skripte trennen ein Wort nicht eindeutig von einem anderen und erfordern Wortspaltalgorithmen. Jedes dieser Bereiche stellt nicht englischsprachige Zaubersprüche einzigartige Herausforderungen.

Kontextsensitive Zaubersprüche

Es wurden Forschungen zur Entwicklung von Algorithmen durchgeführt, die in der Lage sind, ein falsch geschriebenes Wort zu erkennen, auch wenn sich das Wort selbst im Wortschatz basierend auf dem befindet Kontext der umgebenden Worte. Dies erlaubt nicht nur, dass Wörter wie die im obigen Gedicht gefangen werden, sondern auch die nachteilige Wirkung von Vergrößerungswörterbüchern mildert, wodurch mehr Wörter erkannt werden können. Zum Beispiel, Baht im gleichen Absatz wie Thai oder Thailand würde nicht als Rechtschreibfehler anerkannt werden Bad. Das häufigste Beispiel für Fehler, die von einem solchen System erfasst werden, sind Homophon Fehler, wie die mutigen Wörter im folgenden Satz:

Ihr Kommen zu Meer wenn es ist Spule.

Der erfolgreichste Algorithmus bisher ist Andrew Golding und Dan Roths "Worfeln-basierten Rechtschreibkorrekturalgorithmus ",",[22] Veröffentlicht 1999, das zusätzlich zu normalen Rechtschreibfehlern ohne Wörter etwa 96% der kontextsensitiven Rechtschreibfehler erkennen kann. Ein kontextsensitiver Zaubersprüche erscheint in Microsoft Office 2007,[23] und erschien auch in der inzwischen aufgelösten Google Wave.[24]

Grammatikauscheckers Versuchen Sie, Probleme mit Grammatik zu beheben, die über Rechtschreibfehler hinausgehen, einschließlich der falschen Wörterwahl.

Siehe auch

Verweise

  1. ^ PERNER, PETRA (2010-07-05). Fortschritte im Data Mining: Anwendungen und theoretische Aspekte: 10. Industriekonferenz, ICDM 2010, Berlin, Deutschland, 12. bis 14. Juli 2010. Proceedings. Springer Science & Business Media. ISBN 978-3-642-14399-1.
  2. ^ US -Patent 6618697, Methode zur regelbasierten Korrektur von Rechtschreib- und Grammatikfehlern
  3. ^ de Amorim, R.C.; Zampieri, M. (2013) Effektive Zauberprüfmethoden unter Verwendung von Clustering -Algorithmen. Archiviert 2017-08-17 bei der Wayback -Maschine Verfahren der jüngsten Fortschritte in der Verarbeitung natürlicher Sprache (RANLP2013). Hissar, Bulgarien. p. 172-178.
  4. ^ Zampieri, M.; de Amorim, R.C. (2014) Zwischen Ton und Rechtschreibung: Kombination von Phonetik- und Clustering -Algorithmen zur Verbesserung der Erholung der Zielwort. Proceedings der 9. Internationalen Konferenz zur Verarbeitung natürlicher Sprache (Poltal). Vorlesungen in Informatik (LNCs). Springer. p. 438-449.
  5. ^ Ernsthaft, Les. "Die ersten drei Rechtschreibprüfer" (PDF). Universität in Stanford. Archiviert von das Original (PDF) am 22. Oktober 2012. Abgerufen 10. Oktober 2011.
  6. ^ Peterson, James (Dezember 1980). Computerprogramme zum Erkennen und Korrigieren von Rechtschreibfehlern (PDF). Abgerufen 2011-02-18.
  7. ^ Ernsthaft, Les. Sichtbare Vermächtnisse für Y3K (PDF). Archiviert von das Original (PDF) Am 2011-07-20. Abgerufen 2011-02-18.
  8. ^ a b "Georgetown U Fakultät & Staff: Das Zentrum für Sprache, Bildung und Entwicklung". Archiviert von das Original am 2009-02-05. Abgerufen 2008-12-18., Zitat: "Maria Mariani ... gehörte zu einer Gruppe von sechs Linguisten der Georgetown University, die das erste Zauberprüfsystem für die IBM Corporation entwickelten."
  9. ^ Harvey, Charlotte Bruce (Mai - Juni 2010). "Computer lehren, zu buchstabieren (Nachruf für Henry Kučera)". Brown Alumni Magazine. p. 79.
  10. ^ Werbung (Januar 1981). "Micro Computer Industries, Ltd" (PDF). Berechnen! Magazin, Ausgabe 8, Vol. 3, Nr. 1. p. 119.
  11. ^ Werbung (November 1982). "Die Rechtschreibbiene ist vorbei". PC Magazine. p. 165. Abgerufen 21. Oktober 2013.
  12. ^ David Pogue (2009). Mac OS X Snow Leopard: Das fehlende Handbuch.
  13. ^ David Pogue (2015). Wechsel zum Mac: Das fehlende Handbuch.
  14. ^ "Visualtools vt-speller". Computerwelt. 21. Februar 1994. p. 68.
  15. ^ "Durchsuchen 27. September 1993". VT-Speller
  16. ^ Peter G. Aitken (8. November 1994). "Schreibprüfung für Ihre Apps". PC Magazine. p. 299.
  17. ^ "Überprüfen Sie meine E -Mails auf Rechtschreibfehler | Arbeitsbereich E -Mail - Godaddy helfen uns". www.godaddy.com.
  18. ^ "Medizinischer Zauberprüfung für Firefox und Thunderbird". E-Medtools. 2017. archiviert von das Original Am 2019-05-04. Abgerufen 2018-08-29.
  19. ^ Quathamer, Dr. Tobias (2016). "Deutsche medizinische Wörterbuchwörter". Dr. Tobias Quathamer. Abgerufen 2018-08-29.
  20. ^ Friedman, Richard A.; D, M (2003). "Fälle; Rechtschreibung und Penmanship? In der Medizin wetten Sie". Die New York Times. Abgerufen 2018-08-29.
  21. ^ Banks, T. (2008). Lernschwierigkeiten und Unterrichtsstrategien für Fremdsprachen. (S. 29). Masterarbeit, Dominikanische Universität von Kalifornien. Abgerufen am 19. März 2012.
  22. ^ Golding, Andrew R.; Roth, Dan (1999). "Zeitschriftenartikel". Maschinelles Lernen. Springerlink. 34: 107–130. doi:10.1023/a: 1007545901558.
  23. ^ Walt Mossberg (4. Januar 2007). "Rezension". Wallstreet Journal. Abgerufen 24. September 2010.
  24. ^ "Google -Betriebssystem". googleSystem.blogspot.com. 29. Mai 2009. Abgerufen 25. September 2010. "Googles kontextempfindlicher Zaubersprüche von Google". 29. Mai 2009. Abgerufen 25. September 2010.

Externe Links