Mojikyō

Mojikyō
Konjaku Mojikyō
今昔文字鏡
今昔文字鏡.gif
文字鏡:台湾語仮名.png
Das Mojikyō Charakterkarte, die die hervorhebt Taiwanese Kana [Anmerkung 1]
Entwickler (en) Tadahisa Ishikawa
(石川忠久)
Tokio Furuya
(古家時雄)
Mojikyō Institute
(文字鏡研究会)
Erstveröffentlichung 1.0 / Juli 1997; vor 25 Jahren
Endgültige Veröffentlichung
4.0 / 15. Dezember 2018; Vor 3 Jahren
Betriebssystem Microsoft Windows
Größe 51 MB
Verfügbar in japanisch
Typ Zeichensatz gebündelt mit Schriftarten und ein Charakterkarte
Lizenz Proprietär
Webseite Mojikyo.org

Mojikyō (japanisch: 文字鏡), auch unter seinem vollständigen Namen bekannt Konjaku Mojikyō (今昔文字鏡, zündete.'(die) Vergangenheit und gegenwärtiger Charakterspiegel'), ist ein Zeichenkodierung planen. Das Mojikyō -Institut (文字鏡研究会, Mojikyō Kenkyūkai), das das Charakter -Set veröffentlichte, das ebenfalls veröffentlicht wurde Computer Software und TrueType Schriftarten zu begleiten. Das Mojikyō -Institut unter dem Vorsitz von Tadahisa Ishikawa (石川忠久),[1] Ursprünglich hatte seine Charakter -Set und die damit verbundenen Software und Daten umverteilt CD-ROMs verkauft in Kinokuniya Shops.[2]

1996 konzipiert,[3] Die erste Version der CD-ROM wurde im Juli 1997 veröffentlicht.[4] Eine Zeit lang bot das Mojikyō -Institut auch ein Web -Abonnement an, der als bezeichnet wird.Mojikyō NETZ" (文字鏡WEB), die aktuellere Charaktere hatten.[5]

Ab September 2006, Mojikyō 174.975 Zeichen codiert.[6] Unter diesen 150.366 Zeichen (Zeichen (86%) gehörte dann zum erweiterten Chinesisch -Japaner -Korean -Vietnamesisch (CJKV)[Anmerkung 2] Familie.[5] Viele von MojikyōDie Charaktere gelten als veraltet oder dunkel und werden von keinem anderen Zeichensatz codiert, einschließlich des am häufigsten verwendeten internationalen Textcodierungsstandards. Unicode.

Das Mojikyō -Institut war ursprünglich ein bezahltes proprietäres Softwareprodukt ab 2015, um seine neuesten Veröffentlichungen hochzuladen Internetarchiv wie Freeware,[7] Als ein Denkmal Tokio Furuya zu ehren, um einen seiner Entwickler zu ehren (古家時雄), der in diesem Jahr gestorben ist.[3] Am 15. Dezember 2018 wurde Version 4.0 veröffentlicht. Am nächsten Tag gab Ishikawa bekannt, dass dies ohne Furuya die endgültige Veröffentlichung von sein würde Mojikyō.[3]

Prämisse

Das Mojikyō Codierung wurde erstellt, um einen vollständigen Index für chinesische, koreanische und japanische Charaktere zu bieten. Es codiert auch eine große Anzahl von Zeichen in alten Skripten wie die Oracle Bone Script, das Siegelskript, und Sanskrit (Siddhaṃ). Für viele Charaktere ist es das einzige Zeichenkodierung um sie zu codieren, und ihre Daten werden häufig als Ausgangspunkt für verwendet Unicode Vorschläge.[8][9] Jedoch, Mojikyō Hat viel lockerere Standards als Unicode für die Codierung, was führt Mojikyō viele kodierte Glyphen von zweifelhaften oder sogar ungewollt fiktiven Herkunft zu haben.[10][11] Als solche, während viele nicht Unicode Mojikyō Zeichen sind für die Ergänzung zu Unicode geeignet, nicht alle können zu Unicode -Zeichen werden, da es unterschiedlich ist Beweisstandards für jeweils erforderlich.

Komposition

Das Mojikyō Schriftarten (文字鏡フォント) sind TrueType -Schriftarten das kommt in a zip-Datei und sind jeweils um 2–5 Megabyte; Die verschiedenen Schriftarten enthalten unterschiedliche Zahlen von Zeichen.[Notiz 3] Auch eingeschlossen ist a Windows ausführbar das implementiert a grafisch Charakterkarte, das "Mojikyō Charakterkarte "(文字鏡MAP), Mochrmap.Exe.[Anmerkung 4][Anmerkung 5] Mochrmap.exe ermöglicht es Benutzern, die durchzusuchen Mojikyō Schriftarten und kopieren und fügen Sie Zeichen anstelle der Eingabe auf der Tastatur kopieren und einfügen. Im Gegensatz zur regulären Windows -Zeichenkarte oder für diese Angelegenheit Kcharselect, die beide TrueType -Schriftarten unterstützen, Mochrmap.exe Zeigt die nummerierten an Mojikyō Codierung Slot des angeforderten Charakters.[12][Anmerkung 6] Damit Mochrmap.exe zu arbeiten, alle Mojikyō Schriftarten müssen installiert werden.[Anmerkung 7]

Codierung

Bei Bezug auf ein Zeichen, das in codiert ist MojikyōDas Format MJXXXXXX wird häufig verwendet, ähnlich wie das für Unicode verwendete U+xxxx -Format. Zum Beispiel, Hentaigana U+1B008 hat Mojikyō Codierung von MJ090007 und Unicode Codierung U+1B008.[13] Ein Unterschied ist jedoch das Mojikyō Auf diese Weise angezeigte Kodierungen sind Dezimal, während die U+ -Kodierung von Unicode ist hexadezimal.

Von den frühesten Tagen von Unicode, Mojikyō hat sowohl den Standard beeinflusst - und wurde beeinflusst -. Glyphen aus Mojikyō Erscheint zuerst in einem Vorschlag an die Ideografische Berichterstattergruppe (IRG),[Anmerkung 8] das ist verantwortlich für die Aufrechterhaltung aller CJK -Blöcke in Unicode,[14][15] am 18. April 2002.[16] Im Mai 2007, Mojikyō spielte eine untergeordnete Rolle in einer schließlich erfolgreichen Reihe von Vorschlägen, um die zu codieren Tangutskript in Unicode;[17][Anmerkung 9] Mojikyō Hatte bis Oktober 2002 bereits 6.000 Tangut -Charaktere.[6]

Die Unihan -Datenbank des Unicode Standard bezieht sich auf Mojikyō als "Japanisch" Kokuji Sammlung" (日本国字集), abgekürzte "jk".[18][nicht in zitierter Quelle] Zum Beispiel, U+2B679 ,[Anmerkung 10] ein Ideograph Lesen auf Japanisch als burizādo (ブリザード, zündete.'Schneesturm')), hat eine j-source[Anmerkung 11] gleich JK-66038. Alle Unicode-Charaktere mit einem JK-vorgefertigten J-Source stammen aus Mojikyō.[19][Anmerkung 12] Entsprechend Ken Lunde, ein Fachexperte für Charaktercodierungen und Ostasiatische Sprachenab dem Unicode 13.0, 782 Ideografien in Unicode stammen aus Mojikyō, etwas gleichmäßig zwischen zwei aufgeteilt Blöcke: CJK Unified Ideographs Extension C.mit 367 und CJK Unified Ideographs Extension emit 415.[20][21] Nicht alle Unicode -Zeichen mit Mojikyō Ursprünge (JK-vorgefertigte J-Sources) haben den gleichen repräsentativen Glyphen in der Codediagramm wie in der Mojikyō Schriftart;[Anmerkung 13] Einige Charaktere hatten ihre Formen vor der endgültigen Codierung geändert, da die Untersuchung zeigte, dass die vom Mojikyō -Institut zugewiesenen Formen falsch waren.[11][Anmerkung 14]

Blöcke

Ab September 2006 Es kodierte 174.975 Zeichen.[6] Unter diesen gehörten 150.366 Zeichen dann dem erweiterten CJKV[Anmerkung 2] Familie.[5] Viele der codierten Zeichen gelten als veraltet oder auf andere Weise dunkel und werden von keinem anderen Charakter -Satz, einschließlich des internationalen Standards Unicode, codiert. Jeder Mojikyō Der Charakter hat eine eindeutige Zahl und die Zeichen sind in Blöcke organisiert.

Mojikyō stellt CJKV -Zeichen in verschiedenen Blöcken nach ihrem traditionellen Kangxi Radikale. Gemeinsame Radikale, die eine besonders hohe Anzahl von Zeichen enthalten, wie z. Radikale 9 () und 162 (), werden durch Schlaganfallauftrag weiter aufgeteilt.[Anmerkung 15]

Keine Vereinigung

Im Gegensatz zu Unicode, Mojikyō absichtlich vermeidet Han -Vereinigung; Es wird kein Versuch der Kompaktheit der Codierung unternommen, noch gibt es einen Versuch, alle gemeinsamen Zeichen unter u+ffff wie in unicode zu halten.

Unicode hingegen sortiert seinen CJK in Blöcken, basierend darauf, wie häufig sie sind: Die häufigsten werden im Allgemeinen in die Grundlegende mehrsprachige Ebene,[Anmerkung 14] Während diejenigen, die selten oder dunkel sind Astralebenen.

Zum Beispiel, Radikal 9 hat zwei Zeichen, bei denen Unicode einen hat: MJ054435 () und MJ059031 (), beide in Unicode als U+4ee4 .

Lizenz

Mojikyō ist proprietäre Software unter einer restriktiven Lizenz. Ursprünglich versuchte das Mojikyō -Institut, zu verhindern, dass seine Charakterdaten verwendet wurden, und bedrohte diejenigen, die Conversion -Tabellen zu und von seinem Charakter -Set veröffentlichten. Im Juli 2010 hat das Mojikyō -Institut seine rechtlichen Anstrengungen aufgegeben, um mindestens einen japanischen Benutzer davon abzuhalten, Conversion -Tabellen zu veröffentlichen oder Zeichen zu konvertieren Mojikyō zu Unicode oder anderen Zeichensätzen.[22] Bloße Daten, die manchmal auch die Formen der Buchstaben enthalten, werden in vielen Gerichtsbarkeiten berücksichtigt. Allgemeingut da sie die nicht treffen Schwelle der Originalität.[Anmerkung 16]

Aufgrund dieses Erbes Glyphwiki jedoch[Ja] nicht zugelassen Mojikyō Daten ab 2020.[23]

Gesammelte Schreibsysteme

Leben

Tot oder veraltet

Siehe auch

Verweise

  1. ^ "今昔 文字 鏡 について" [Über Mojikyō]. Mojikyō Institute (auf Japanisch). Archiviert von das Original am 3. Februar 2001. Abgerufen 6. Juli 2020.
  2. ^ よう こそ 、 今昔 文字 鏡 の 世界 へ!! [Willkommen in der Welt von Mojikyō!] (auf Japanisch). Kinokuniya Kk. Archiviert von das Original am 4. März 2005. Abgerufen 5. Juli 2020.
  3. ^ a b c Ishikawa, Tadahisa (August 2015). "古 家 時 雄君 を 悼む" [Tokio Furuya, wir trauern um Ihren Tod]. Mojikyō Institute (auf Japanisch). Abgerufen 8. Juli 2020.
  4. ^ Konjaku Mojikyō 今昔 文字鏡 (Japanisch), Juli 1997, ISBN 9784314900034
  5. ^ a b c 今昔 文字 鏡 とは とは [Über Mojikyo] (auf Japanisch). Kinokuniya Kk. Archiviert von das Original am 27. April 2010. Abgerufen 5. Juli 2020.
  6. ^ a b c 今昔 文字 鏡 とは とは [Was ist Mojikyō?] (auf Japanisch). Kinokuniya Kk. Archiviert von das Original am 5. Februar 2005. Abgerufen 5. Juli 2020.
  7. ^ "Suche: Schöpfer:" Mojikyo Institute "". Internetarchiv. Abgerufen 6. Juli 2020.
  8. ^ Takada, Tomokazu; Yada, Tsutomu; Saito, Tatsuya (18. September 2015). Vorschlag für Hentaigana (PDF). Übersetzt von Kobayashi, Tatsuo; Kobayashi, Daniel. Informationsverarbeitungsgesellschaft Japans. L2/15-239. Abgerufen 5. Juli 2020 - via Unicode -Konsortium.
  9. ^ Hiura, Hideki; Kobayashi, Tatsuo; et al. (31. Oktober 2003). IDEOGH VARATIONSULTORTORTORTORTION UND Variationssammlungserkennung. Offene Internationalisierungsinitiative. L2/03-413. Abgerufen 5. Juli 2020 - via Unicode -Konsortium.
  10. ^ Takada, Tomokazu [高田智和]; ODA, Tetsuji [織田哲治]; et al. (26. August 2013). 平成 25 年度 第 3 回 文字 情報 検 討 サブ ワーキング グループ 議事録 議事録 [Besprechungsprotokoll der dritten Charakterinformationsprüfung Sub-Working Group von 2013 (Heisei 25)]] (PDF). Informationstechnologie Promotion Agentur, Japanische Regierung (auf Japanisch). p. 2. Abgerufen 6. Juli 2020. "と の こと であっ た。 [laut einem Interview mit einem Vertreter des Mojikyō -Instituts a Mojikyō Schriftart wird in WG2 N36981 verwendet, die von den Niederlanden vorgeschlagen wurden, aber das Mojikyō -Institut selbst ist nicht an dem Vorschlag beteiligt. Es hat außerdem Zweifel an einigen Inhalten dieses Vorschlags.]
  11. ^ a b Suzuki, Toshiya [鈴木俊哉] (30. Juli 2009). 統合 漢字 に 申請 さ た 「殷 周 金文 集成 引 得」 図形 文字 の 調査 調査 調査 [Untersuchung zu Glyphen, die vom "Index zur Sammlung von Inschriften der Yin-Zhou-Zeitraum erfasst" gesammelt wurden, um CJK Unified Ideographs zu unterwerfen]. IPSJ Sig Technischer Bericht (auf Japanisch). Informationsverarbeitungsgesellschaft Japans. 2009-DD-72 (7): 2-via Internetarchiv. " "変更 さ れ た もの も 多い。 [als Standardisierungsaufwand für CJK Unified Ideographs Extension C. Nach acht Jahren in der Herstellung und Beispielen von Kanji wurden nach ihrer Codierung beantragt. Der offiziell verkündete Verlängerung C kanji -Standard unterscheidet sich sehr vom ursprünglichen Standard. Zum Beispiel beantragte wir, die japanische Regierung, zunächst etwa 1.000 Kanji, die vom Mojikyō -Institut ausgewählt wurden [.] [...] Seit der Überprüfung des Kanji unabhängig vom Mojikyō Mojikyōs Version desselben CodePoint.]
  12. ^ Ishikawa, Tadahisa (25. Mai 1999). "パソコン 悠悠 漢字術 今昔 文字 鏡 徹底 活用" [Kanji auf Ihrem PC, leicht gemacht - das komplette Mojikyō -Handbuch]. Mojikyō Institute. Abgerufen 6. Juli 2020.
  13. ^ MJ 文字 情報 一覧 表 表 [Tabelle der MJ -Charaktercodierungen] (auf Japanisch). Agentur für Informationstechnologie Promotion. Abgerufen 5. Juli 2020.
  14. ^ "Unicode Standard Anhang #45: U-Source-Ideografien". Der Unicode -Standard. Unicode -Konsortium.
  15. ^ "Anhang E: Han -Vereinigung Geschichte" (PDF). Der Unicode -Standard. Unicode -Konsortium. März 2020.
  16. ^ "CJK -Erweiterung C1 aus Japan". Ideografische Berichterstattergruppe. IRG#19 N895 - via Die chinesische Universität von Hongkong's Abteilung für Informatik und Ingenieurwesen. N895-Japan_C1
  17. ^ Cook, Richard (9. Mai 2007). Vorschlag, Tangut -Zeichen in der UCS -Ebene 1 zu codieren 1 (PDF). UC Berkeley Skript -Codierungsinitiative. p. 4. L2/07-143-via Unicode -Konsortium.
  18. ^ Jenkins, John H.; Koch, Richard; Lunde, Ken, Hrsg. (5. März 2020), "Kirg jSource", Unicode Standard Anhang #38, Unicode -Konsortium
  19. ^ Ken Lunde [@ken_lunde] (6. Juli 2020). "JK-vorgefertigte J-Source-Ideogramme stammen aus 今昔 文字鏡 文字鏡, die in Erweiterungen C und E stammen (die Erwähnung von Erweiterung D war einfach, dass das, was Extension E wurde, ursprünglich als Erweiterung d) gezielt wurde." (Tweet). Abgerufen 6. Juli 2020 - via Twitter.{{}}: CS1 Wartung: URL-Status (Link)
  20. ^ Ken Lunde [@ken_lunde] (6. Juli 2020). "Insbesondere alle 782 JK-vorgefertigten Ideografien stammen tatsächlich aus 今昔 文字鏡 文字鏡 文字鏡 文字鏡 pro IRG N862. (Tweet). Abgerufen 6. Juli 2020 - via Twitter.
  21. ^ Ken Lunde [@ken_lunde] (6. Juli 2020). "367 JK-vorgefertigte Ideografien befinden sich in Erweiterung C, und die verbleibenden 415 befinden sich in Erweiterung E." (Tweet). Abgerufen 6. Juli 2020 - via Twitter.
  22. ^ "終戦 宣言" [Ankündigung: Der Krieg ist vorbei]. 青蛙亭 漢語 塾 [Seiwateis Kanji Cram School] (auf Japanisch) (28. Januar 2016 ed.). 21. Juli 2010. Abgerufen 7. Juli 2020.
  23. ^ "データ ・ 記事 の ライセンス" [Lizenz unserer Daten und Artikel]. Glyphwwiki (9. Juni 2010 ed.). Abgerufen 6. Juli 2020. "て 作成 し て いる 判断 できる 情報 情報 は 、 に 登録 する 際 の 典拠 と する こと は でき ん ので 、 協力 協力 を お願いいたし ます。 [[Konjaku Mojikyō und verwandte Produkte und zugehörige Daten sind so lizenziert, dass sie mit unserer obigen Glyphwiki -Lizenz unvereinbar sind. Weder die Anzahl der Anzahl der Mojikyō Codierung von Slot oder das Aussehen des Glyphs selbst in Mojikyō'S -Schriftarten oder irgendwelche Informationen, die beurteilt werden können, dass sie sich auf a beziehen können Mojikyō Produkt kann bei der Eingabe von Daten in Glyphwiki verwendet werden. Wir können absolut nicht akzeptieren Mojikyō Daten. Bitte kooperieren Sie mit uns.]

Anmerkungen

  1. ^ Bisher fehlt a Unicode codieren, so wird hier mit approximiert CSS und U+30BB Katakana Brief SE.
  2. ^ a b Für Koreanisch, Hanja sind bezeichnet als. Für Vietnamesen, Chữ nôm.
  3. ^ Laden Sie die Datei herunter Mojikyocmap400All49TTF.7Z aus Die offizielle Website
  4. ^ Englischer Name aus dem Titel des Fensters, das durch Ausführen der ausführbaren Datei erstellt wurde; Japanischer Name aus dem Symbol der ausführbaren Datei.
  5. ^ Auch als "Mojikyō cmap" bezeichnet.
  6. ^ Sehen Sie die Screenshots auf Die offizielle Website
  7. ^ In das System -Schriftartenverzeichnis C: \ Windows \ Schriftarten.
  8. ^ Ab 2019 wurde die IRG als ideografische Forschungsgruppe umbenannt.
  9. ^ Die Geschichte der Codierung des Tangut -Skripts ist ziemlich kompliziert, siehe Tangut (Unicode Block) § Historie Für eine vollständige Auflistung aller zugehörigen Vorschläge und einer Zeitleiste.
  10. ^ Ideografische Beschreibungsequenz: ⿰魚嵐
  11. ^ Das ist ein Spaltenname in dem Unihan -Datenbank; ⟨J⟩ hier ist kurz für "japanische Glyphenquelle". Der vollständige Name der Spalte ist kIRG_JSource. Unter Han -VereinigungEs gibt neun solcher Quellen. Siehe §3.1 von UAX#38 Für eine vollständige Liste und weitere Informationen.
  12. ^ Andere J-Source-Präfixe existieren, wie z. B. J4, was bedeutet, dass der Charakter stammt JIS X 0213: 2004.
  13. ^ Das heißt, eine Glyphe, die aus demselben besteht Radikale in den gleichen Positionen.
  14. ^ a b Fehler in großen Sammlungen von Ideografien sind natürlich nicht ungewöhnlich. Solche Fehler treten sogar versehentlich in gut finanzierten staatlich hergestellten Sammlungen auf, wie die berühmten Kanji aus unbekannten Quellen in dem Japanische Industriestandardskomitee's Jis x 0208 Doppel-Byte-Charakter-Codierungsstandard. All diese jis x 0208 Fehler Kanji (幽霊漢字; z.B., ) haben ihren Weg in Unicode gelaufen, obwohl sie nicht "echt" Kanji sind.
  15. ^ Für Beweise finden Sie in der Liste in der MOJIKYō -Charakterkarte, Mochrmap.exe.
  16. ^ Siehe auch: fiktiver Eintrag; Trap Street.

Externe Links