Internationalisierte Ressourcenkennung

Internationalisierte Ressourcenkennung
Internationalisierte Ressourcenkennung
Abkürzung Iri
Status Vorgeschlagener Standard
Jahr begann 22. April 2002
Erstmals veröffentlicht 22. April 2002
Letzte Version 21. Januar 2020
Organisation Ietf
Autoren
  • Martin Dürst
  • Michel Suignard
Grundstandards
Domain Zeichenkodierung
Webseite RFC 3987

Das Internationalisierte Ressourcenkennung (Iri) ist ein Internet -Protokollstandard das baut auf dem auf Einheitliche Ressourcenkennung (URI) Protokoll durch erhebliche Erweiterung der zulässigen Charaktere.[1][2][3] Es wurde durch die definiert Internettechnik-Arbeitsgruppe (IETF) im Jahr 2005 in RFC 3987. Während URI US-Ascii Zeichensatz (Zeichen außerhalb dieses Satz prozentualcodiert) Iris kann zusätzlich die meisten Zeichen aus dem enthalten Universeller Charakter -Set (Unicode/ISO 10646),[4][5] einschließlich Chinesisch, japanisch, Koreanisch, und kyrillisch Figuren.

Syntax

Iris erweitert URIs mit der Verwendung der Universeller Charakter -Set, wo URIs beschränkt waren ASCII, mit weit weniger Charakteren. Iris kann durch eine Abfolge von Oktetten dargestellt werden, aber per Definition werden als eine Abfolge von Zeichen definiert, da Iris von Hand gesprochen oder geschrieben werden kann.[6]

Kompatibilität

Iris wird URIs zugeordnet, um mit Systemen, die das neue Format nicht unterstützen, rückwärtskompatibilität zu behalten.[6]

Für Anwendungen und Protokolle, die keinen direkten Verbrauch von Iris zulassen Normalisierung der kanonischen Zusammensetzung (NFC), wenn nicht bereits im Unicode -Format.

Alle Nicht-ASCII-Codepunkte im IRI sollten als nächstes als codiert werden als UTF-8und die resultierenden Bytes prozentualcodiert, um einen gültigen URI zu erstellen.

Beispiel: Die IRI https://en.wiktionary.org/wiki/ῥῥ & Dgr; δ & ° C wird zum URI https://en.wiktionary.org/wiki/%E1%bf%AC%CF%8C%CE%CE%CEBF %Cf%82

ASCII -Codepunkte, die ungültige URI -Zeichen sind kann auf die gleiche Weise codiert werden, je nach Implementierung.[6]

Diese Umwandlung ist leicht reversibel; Per Definition wird die Umwandlung eines IRI in ein URI und wieder wieder ein IRI liefern, das semantisch dem ursprünglichen IRI entspricht, obwohl es sich in der exakten Darstellung unterscheiden kann.[7]

Einige Protokolle können weitere Transformationen auferlegen; z.B. Punycode zum DNS Etiketten.

Vorteile

Es gibt Gründe, Uris in verschiedenen Sprachen anzeigen zu sehen. Meistens erleichtert es Benutzern, die mit dem lateinischen Alphabet (A - Z) nicht vertraut sind. Angenommen, es ist für niemanden nicht schwierig, willkürliche Unicode auf ihren Tastaturen zu replizieren, kann dies das machen Uri System besser zugänglich.[8]

Nachteile

Iris mischen und ASCII URIS kann es viel einfacher ausführen Phishing Angriffe, die jemanden dazu bringen, zu glauben, dass er sich auf einer anderen Seite befindet, die sie wirklich sind. Zum Beispiel kann man ein ASCII "a" in ersetzen www.myfictionalbank.com Mit dem Unicode sieht es aus. "α" geben www.myfictionαlbank.com und weisen Sie diesen IRI auf eine böswillige Seite hin. Dies ist als ein bekannt IDN -Homographenangriff.

Während ein URI den Menschen keine Möglichkeit bietet, Webressourcen mithilfe ihrer eigenen Alphabete zu spezifizieren, macht ein IRI nicht klar, wie auf Webressourcen mit Tastaturen zugegriffen werden können, auf die nicht die erforderlichen internationalen Charaktere generieren können. Dies bedeutet, dass Iris jetzt auf eine Weise gehandhabt wird, die vielen anderen Software sehr ähnlich ist, die möglicherweise die Verwendung eines Nicht-Tyboards erfordert Eingabe Methode Im Umgang mit Texten in verschiedenen Sprachen.

Siehe auch

Verweise

  1. ^ Gangemi, Aldo; Presutti, Valentina (2006). "Die Bourne -Identität einer Webressource" (PDF). Proceedings of Identity Reference und Web Workshop (IRW). Labor für angewandte Ontologie: 3. Beachten Sie, dass Iris (internationalisierte Ressourcenkennung) [11] in der nächsten Zukunft URIs ersetzen sollen.
  2. ^ Suignard, Michel. "Internationalisierte Ressourcenidentifikatoren (Iris)". Tools.ietf.org. Abgerufen 2018-06-09. Dieses Dokument definiert ein neues Protokollelement, den internationalisierten Ressourcenkennung (IRI), als Ergänzung zum Uniform Resource Identifier (URI). Ein IRI ist eine Abfolge von Zeichen aus dem universellen Zeichensatz (Unicode/ISO 10646). Eine Zuordnung von Iris zu URIs ist definiert, was bedeutet, dass Iris gegebenenfalls anstelle von URIs verwendet werden kann, um Ressourcen zu identifizieren. Der Ansatz zur Definition eines neuen Protokollelements wurde ausgewählt, anstatt die Definition von URIs zu erweitern oder zu ändern.
  3. ^ Suignard, Michel. "Internationalisierte Ressourcenidentifikatoren (Iris)". Tools.ietf.org. Abgerufen 2018-06-09. Dieses Dokument definiert ein neues Protokollelement namens Internationalized Resource Identifier (IRI), indem die Syntax von URIs auf ein viel breiteres Repertoire an Zeichen erweitert wird. Es definiert auch "internationalisierte" Versionen, die anderen Konstrukten aus [RFC3986] entsprechen, wie z. B. URI -Referenzen. Die Syntax von Iris ist in Abschnitt 2 und die Beziehung zwischen Iris und URIs in Abschnitt 3 definiert.
  4. ^ Suignard, Michel. "Internationalisierte Ressourcenidentifikatoren (Iris)". Tools.ietf.org. Abgerufen 2018-06-09.
  5. ^ Suignard, Michel. "Internationalisierte Ressourcenidentifikatoren (Iris)". Tools.ietf.org. Abgerufen 2018-06-09.
  6. ^ a b c Duerst, M. (2005). "RFC 3987". Netzwerkarbeitsgruppe. Standardspur. Abgerufen 12. Oktober 2014.
  7. ^ Hendler, Hrsg. Dieter -Fenster; HRSG. John Domingue; HRSG. James A. (2010). Handbuch der semantischen Webtechnologien (1. Auffl. Ed.). Berlin: Springer-Verlag GmbH. ISBN 978-3-540-92912-3. Abgerufen 12. Oktober 2014.
  8. ^ Clark, Kendall (2003-05-07). "Internationalisierung des URI". O’Reilly Media, Inc.. Abgerufen 12. Oktober 2014.

Externe Links