Komma-getrennte Werte
![]() | |
Dateiname Erweiterung | .csv |
---|---|
Internet -Medientyp | Text/CSV [1] |
Art des Formats | Multi-Plattform-, serielle Datenströme |
Container für | Datenbank Informationen als Feld getrennte Listen organisiert |
Standard | RFC 4180 |
A Komma-getrennte Werte (CSV) Die Datei ist abgrenzt Textdatei das verwendet a Komma Werte trennen. Jede Zeile der Datei ist ein Daten Aufzeichnung. Jeder Datensatz besteht aus einem oder mehreren Felder, durch Kommata abgetrennt. Die Verwendung des Kommas als Feldabscheider ist die Quelle des Namens dafür Datei Format. In einer CSV -Datei speichert normalerweise tabellarisch Daten (Zahlen und Text) in einfacher TextIn diesem Fall hat jede Zeile die gleiche Anzahl von Feldern.
Das CSV -Dateiformat ist nicht vollständig standardisiert. Das Trennen von Feldern mit Kommas ist die Grundlage, aber Kommas in den Daten oder eingebettet Zeilenumbrüche müssen speziell behandelt werden. Einige Implementierungen lehnen diese Inhalte ab, während andere das Feld umgeben Anführungszeichen, was noch einmal die Notwendigkeit des Flucht erzeugt, wenn in den Daten Anführungszeichen vorhanden sind.
Der Begriff "CSV" bezeichnet auch mehrere eng verwandte Trennzeichen getrennte Formate Dadurch werden andere Feldgrenzwerte wie Semikolons verwendet.[2] Diese beinhalten tabend getrennte Werte und räumlich getrennte Werte. Ein Trennzeichen, der garantiert nicht Teil der Daten ist, vereinfacht stark Parsing.
Alternative trennungsgetrennte Dateien erhalten häufig ein ".csv". Verlängerung Trotz der Verwendung eines nicht-komma-Feldabscheiders. Diese lose Terminologie kann zu Problemen führen Datenaustausch. Viele Anwendungen, die CSV -Dateien akzeptieren, haben Optionen zur Auswahl des Grenzwertzeichens und des Anführungszeichens. Semikolons werden in vielen Europäern oft anstelle von Kommas verwendet Orte Um das Komma als Dezimaltrennzeichen und möglicherweise als Dezimalgruppierungscharakter zu verwenden.
Datenaustausch
CSV ist üblich Datenaustausch Format, das von Verbrauchern, Unternehmen und wissenschaftlichen Anwendungen häufig unterstützt wird. Zu den häufigsten Verwendungen gehört die Verschiebung tabellarischer Daten[3][4] zwischen Programmen, die nativ inkompatibel arbeiten (oft proprietär oder undokumentierte) Formate.[1] Dies funktioniert trotz der mangelnden Einhaltung von RFC 4180 (oder einem anderen Standard), da so viele Programme Variationen des CSV -Formats für den Datenimport unterstützen.
Beispielsweise muss ein Benutzer möglicherweise Informationen aus einem Datenbankprogramm übertragen, das Daten in einem proprietären Format auf a speichert Kalkulationstabelle Das verwendet ein völlig anderes Format. Die meisten Datenbankprogramme Kann Daten als CSV exportieren und die exportierte CSV -Datei kann dann vom Tabellenkalkulationsprogramm importiert werden.
Spezifikation
RFC 4180 schlägt a Spezifikation für das CSV -Format; Die tatsächliche Praxis folgt jedoch häufig nicht dem RFC, und der Begriff "CSV" kann sich auf eine Datei beziehen, die:[1][5]
- ist einfacher Text Verwenden einer Zeichencodierung wie z. ASCII, verschiedene Unicode Zeichenkodierungen (z. UTF-8), Ebcdic, oder Schicht jis,
- besteht aus Datensätzen (normalerweise einen Datensatz pro Zeile),
- mit den Aufzeichnungen in Aufteilte in Felder getrennt durch Grenzwerte (Typischerweise ein einzelnes reserviertes Zeichen wie Komma, Semikolon oder Tab; manchmal kann der Trennzeichen optionale Räume enthalten).
- wo jeder Datensatz die gleiche Abfolge von Feldern hat.
Innerhalb dieser allgemeinen Einschränkungen werden viele Variationen verwendet. Daher ist ohne zusätzliche Informationen (z. B. ob RFC 4180 geehrt wird) eine Datei, in der einfach nicht im "CSV" -Format angegeben ist. In einigen Anwendungen, die CSV -Dateien unterstützen, ermöglichen es Benutzern, die ersten Zeilen der Datei anzunehmen und anschließend die Trennzeichenzeichen (n) zu geben, Regeln zu zitieren usw.; zum Beispiel, Microsoft ExcelDer Text -Import -Assistent.
Geschichte
Komma-getrennte Werte sind ein Datenformat, das voraussetzt persönliche Computer Um mehr als ein Jahrzehnt: die IBM Forran (Stufe H erweitert) Compiler unter OS/360 Unterstützung von CSV im Jahr 1972.[6] Eingabe/Ausgabe von listengesteuerter ("freier Form") wurde in definiert Forran 771978 genehmigt. Listengerichtete Eingaben verwendeten verwendeten Kommas oder Räume für Grenzwerte, sodass nicht geeignete Zeichenketten keine Kommas oder Räume enthalten konnten.[7]
Der Begriff "Komma-getrennter Wert" und die Abkürzung "CSV" wurden bis 1983 verwendet.[8] Das Handbuch für die Osborne Executive Computer, der die bündelte Supercalc Tabelle, dokumentiert die CSV -Zitatkonvention, mit der Zeichenfolgen eingebettete Kommas enthalten. Das Handbuch gibt jedoch keine Übereinkommen zum Einbetten von Anführungszeichen in zitierten Zeichenfolgen an.[9]
Komma-getrennte Wertlisten sind einfacher zu tippen (zum Beispiel in geschlagene Karten) als mit festen Säulen ausgerichteten Daten, und sie waren weniger anfällig für falsche Ergebnisse, wenn ein Wert von einer Spalte von seinem beabsichtigten Ort abgeleitet wurde.
Comma -getrennte Dateien werden für den Austausch von Datenbankinformationen zwischen Maschinen zweier verschiedener Architekturen verwendet. Das einfache Textcharakter von CSV-Dateien vermeidet weitgehend Inkompatibilitäten wie z. Byte-Ordnung und Wortgröße. Die Dateien sind größtenteils menschlich lesbar, sodass es einfacher ist, mit ihnen ohne perfekte Dokumentation oder Kommunikation umzugehen.[10]
Die wichtigste Standardisierungsinitiative - Übertragung "de facto Fuzzy Definition "in einen genaueren und genaueren und de jure einer - war im Jahr 2005 mit RFC 4180CSV definieren MIME -Inhaltstyp.[11] Später, im Jahr 2013, wurden einige der Mängel der RFC 4180 durch eine W3C -Empfehlung angepackt.[12]
Im Jahr 2014 Ietf veröffentlicht RFC7111 Beschreibung der Anwendung von URI -Fragmente zu CSV -Dokumenten. RFC 7111 Gibt an, wie Zeilen-, Spalten- und Zellbereiche aus einem CSV -Dokument unter Verwendung von Positionsindizes ausgewählt werden können.[13]
2015 W3cin einem Versuch, CSV mit zu verbessern formelle Semantik, veröffentlichte den ersten Entwürfe von Empfehlungen Für CSV -Metadatenstandards, die als begann als Empfehlungen Im Dezember desselben Jahres.[14]
Allgemeine Funktionalität
CSV -Formate werden am besten verwendet, um Sets oder Sequenzen von Datensätzen darzustellen, in denen jeder Datensatz eine identische Liste von Feldern hat. Dies entspricht einer einzigen Beziehung in einem relationale Datenbank, oder zu Daten (wenn auch nicht Berechnungen) in einer typischen Tabelle.
Das Format stammt aus den frühen Tagen des Business Computing und wird häufig verwendet, um Daten zwischen Computern mit unterschiedlichen internen Wortgrößen, Datenformatierungsanforderungen usw. zu übergeben. Aus diesem Grund sind CSV -Dateien auf allen Computerplattformen üblich.
CSV ist a abgrenzt Textdatei, die a verwendet Komma Um Werte zu trennen (viele Implementierungen von CSV -Import-/Export -Tools ermöglichen es anderen Separatoren; beispielsweise die Verwendung einer "sep =^" -Zeile als erste Zeile in der Datei *.csv verursacht Excel Die erwartete Datei öffnen Pflege "^", um das Trennzeichen anstelle von Komma zu sein ","). Einfache CSV -Implementierungen können Feldwerte verbieten, die ein Komma oder andere Sonderzeichen wie Neulinien enthalten. Ausgefugtere CSV -Implementierungen ermöglichen es ihnen, häufig durch das Bedürfnis "(" ((Doppelzitat) Zeichen um Werte, die reservierte Zeichen enthalten (z. B. Kommas, doppelte Zitate oder weniger häufig, Newlines). Eingebettete Doppel -Zitat -Zeichen können dann durch zwei aufeinanderfolgende Doppelzitate dargestellt werden.[15] oder durch Präfix eines doppelten Zitats mit einem Escape-Zeichen so wie ein Backslash (Zum Beispiel in Sybase Zentral).
CSV -Formate sind nicht auf einen bestimmten beschränkt Zeichensatz.[1] Sie arbeiten genauso gut mit Unicode Zeichensätze (wie z. UTF-8 oder UTF-16) wie bei ASCII (obwohl bestimmte Programme, die CSV unterstützen, ihre eigenen Einschränkungen haben können). CSV -Dateien überleben normalerweise sogar die naive Übersetzung von einem Charakter auf einen anderen (im Gegensatz zu fast allen proprietären Datenformaten). CSV bietet jedoch keine Möglichkeit, anzutieren, welches Zeichensatz verwendet wird, sodass dies separat kommuniziert oder am Empfangsende bestimmt werden muss (wenn möglich).
Datenbanken, die mehrere enthalten Beziehungen kann nicht als einzelne CSV -Datei exportiert werden. In ähnlicher Weise kann CSV natürlich nicht darstellen Hierarchisch oder objektorientierter Daten. Dies liegt daran, dass jeder CSV -Rekord die gleiche Struktur aufweist. CSV ist daher selten angemessen für Unterlagen hergestellt mit Html, Xmloder andere Markup- oder Wortverarbeitungstechnologien.
Statistische Datenbanken in verschiedenen Bereichen haben häufig eine allgemein relationsähnliche Struktur, jedoch mit einigen wiederholbaren Gruppen von Feldern. Zum Beispiel Gesundheitsdatenbanken wie die Demografische und Gesundheitsumfrage Wiederholen Sie in der Regel einige Fragen für jedes Kind eines bestimmten Elternteils (möglicherweise bis zu einer festen maximalen Anzahl von Kindern). statistische Analyse Systeme enthalten häufig Dienstprogramme, die solche Daten "drehen" können. Beispielsweise können ein "übergeordneter" Datensatz, der Informationen zu fünf Kindern enthält, in fünf separate Datensätze aufgeteilt werden, die jeweils (a) die Informationen zu einem Kind enthalten, und (b) eine Kopie aller nicht-kind-spezifischen Informationen. CSV kann entweder die "vertikale" oder "horizontale" Form solcher Daten darstellen.
In einer relationalen Datenbank werden ähnliche Probleme leicht behandelt, indem eine separate Beziehung für jede solche Gruppe erstellt und "untergeordnete" Datensätze mit den zugehörigen "übergeordneten" Datensätzen verbunden werden. Unbekannter Schlüssel (wie eine ID -Nummer oder einen Namen für den übergeordneten). In Markup -Sprachen wie XML werden solche Gruppen normalerweise in ein übergeordnetes Element eingeschlossen und nach Bedarf wiederholt (z. B. mehrere
Knoten innerhalb einer einzigen
Knoten). Bei CSV gibt es keine weit verbreitete Ein-File-Lösung.
Standardisierung
Der Name "CSV" gibt die Verwendung des Kommas zur Trennung von Datenfeldern an. Dennoch wird der Begriff "CSV" häufig verwendet, um sich auf eine große Familie von Formaten zu beziehen, die sich in vielerlei Hinsicht unterscheiden. Einige Implementierungen erlauben oder erfordern einzelne oder doppelte Anführungszeichen in einigen oder allen Feldern. und einige reservieren den ersten Rekord als Header mit einer Liste von Feldnamen. Der verwendete Zeichensatz ist undefiniert: Einige Anwendungen erfordern einen Unicode Byte -Bestellmarke (BOM) zur Durchsetzung der Unicode-Interpretation (manchmal sogar einer UTF-8-BOM).[1] Dateien, die das Registerkartenzeichen anstelle von Comma verwenden, können genauer als "TSV" für tabend getrennte Werte als "TSV" bezeichnet werden.
Andere Implementierungsunterschiede umfassen den Umgang mit alltäglichen Feldabscheidern (wie Raum oder Semikolon) und neue Zeichen in Textfeldern. Eine weitere Subtilität ist die Interpretation einer leeren Zeile: Sie kann gleichermaßen das Ergebnis des Schreibens eines Datensatzes von Nullfeldern oder einem Datensatz eines Feldes mit Nulllänge sein; Somit ist das Dekodieren mehrdeutig.
RFC 4180- und MIME -Standards
Der technische Standard RFC 4180 2005 formalisiert das CSV -Dateiformat und definiert die Mime Typ "Text/CSV" für den Umgang mit textbasierten Feldern. Die Interpretation des Textes jedes Feldes ist jedoch immer noch anwendungsspezifisch. Dateien, die dem RFC 4180 -Standard folgen, können den CSV -Austausch vereinfachen und sollten weit verbreitet sein. Unter seinen Anforderungen:
- Leitungen im MS-DOS-Stil, die mit (CR/LF) -Sports enden (optional für die letzte Zeile).
- Ein optionaler Header -Datensatz (es gibt keinen sicheren Weg, um festzustellen, ob es vorhanden ist. Daher ist beim Importierung Vorsorge erforderlich).
- Jeder Datensatz sollte enthalten die gleiche Anzahl von von Kommas getrennten Feldern.
- Irgendein Feld kann zitiert werden (mit doppelten Zitaten).
- Felder, die einen Zeilenumschlag, ein Doppelzitat oder eine Kommas enthalten sollte zitiert werden. (Wenn dies nicht der Fall ist, kann die Datei wahrscheinlich unmöglich korrekt zu verarbeiten sein.)
- Wenn Doppelquote werden verwendet, um Felder beizulegen, und dann eine Doppelquote in einem Feld muss von zwei Doppelquote-Zeichen dargestellt werden.
Das Format kann von den meisten Programmen verarbeitet werden, die behaupten, CSV -Dateien zu lesen. Die Ausnahmen sind (a) Programme unterstützen möglicherweise keine Linienausfälle in angegebenen Feldern, (b) Programme können den optionalen Header mit Daten verwirren oder die erste Datenzeile als optionaler Header interpretieren, und (c) Doppelquote in einem Feld wird möglicherweise nicht automatisch korrekt analysiert.
OKF reibungsloser tabellarischer Datenpaket
In 2011 Open Knowledge Foundation (OKF) und verschiedene Partner erstellten eine Arbeitsgruppe für Datenprotokolle, die sich später zu der reibungslosen Dateninitiative entwickelte. Eines der wichtigsten Formate, die sie veröffentlicht haben, war das tabellarische Datenpaket. Das tabellarische Datenpaket basierte stark auf CSV und verwendete es als Hauptdatentransportformat und das Hinzufügen von Basistyp- und Schema -Metadaten (CSV fehlt alle Typinformationen, um die Zeichenfolge "1" von der Nummer 1 zu unterscheiden).[16]
Die reibungslose Dateninitiative hat auch ein Standard -CSV -Dialekt -Beschreibung Format zur Beschreibung verschiedener CSV -Dialekte bereitgestellt, z. B. den Feldabscheider oder die Angabe von Regeln.[17]
W3C Tabular Data Standard
2013 die W3c Die Arbeitsgruppe "CSV on the Web" begann, Technologien zu spezifizieren, die mit CSV oder ähnlichen Formaten eine höhere Interoperabilität für Webanwendungen lieferten.[18] Die Arbeitsgruppe hat ihre Arbeiten im Februar 2016 abgeschlossen und im März 2016 offiziell mit der Veröffentlichung einer Reihe von Dokumenten und W3C -Empfehlungen geschlossen[19] zum Modellieren "tabellarische Daten",[20] und Verbesserung des CSV mit Metadaten und Semantik.
Grundregeln
Es gibt viele informelle Dokumente, die "CSV" -Formate beschreiben.Ietf RFC 4180 (oben zusammengefasst) definiert das Format für "Text/CSV" Mime Typ registriert mit dem Iana.
Regeln, die für diese und andere "CSV" -Pezifikationen und -implementierungen typisch sind, sind wie folgt:
- CSV ist a abgrenzt Datenformat, das hat Felder/Spalten getrennt durch die Komma Charakter und Datensätze/Zeilen von Newlines gekündigt.
- Eine CSV -Datei erfordert keine spezifische Zeichenkodierung, Bytebestellungoder Line-Terminator-Format (einige Software unterstützen nicht alle Zeilen-End-Variationen).
- Ein Datensatz endet an einem Zeilenterminator. Leitungsanschlüsse können jedoch als Daten in Feldern eingebettet werden. Daher muss die Software die zitierten Zeilensetzgeber (siehe unten) erkennen, um einen gesamten Datensatz aus möglicherweise mehreren Zeilen korrekt zusammenzustellen.
- Alle Datensätze sollten die gleiche Anzahl von Feldern in derselben Reihenfolge haben.
- Daten in Feldern werden als Folge von interpretiert Figuren, nicht als Abfolge von Bits oder Bytes (siehe RFC 2046, Abschnitt 4.1). Beispielsweise kann die numerische Menge 65535 als 5 ASCII -Zeichen "65535" dargestellt werden (oder vielleicht andere Formen wie "0xffff", "000065535.000e+00" usw.); aber nicht als eine Sequenz von 2 Bytes, die als eine einzelne binäre Ganzzahl und nicht als zwei Zeichen behandelt werden sollen (z. B. die Zahlen 11264–11519 haben ein Komma als ihr hoher Ordnung:
ord(',')*256..ord(',')*256+255
). Wenn diese "Klartext" -Konvention nicht befolgt wird, enthält die CSV -Datei nicht mehr ausreichende Informationen, um sie korrekt zu interpretieren Text/CSV Mime Typ. - Angrenzende Felder müssen durch ein einziges Komma getrennt werden. "CSV" -Formate variieren jedoch stark in dieser Wahl des Separatorcharakters. Insbesondere in Orte Wenn das Komma als Dezimalseparator verwendet wird, wird stattdessen ein Semikolon, eine Registerkarte oder ein anderes Zeichen verwendet.
1997, Ford, E350
- Irgendein Feld kann sein zitiert (Das heißt, in zwei Quadrikzeichen eingeschlossen), während einige Felder muss zitiert werden, wie in den folgenden Regeln und Beispielen angegeben:
"1997", "Ford", "E350"
- Felder mit eingebetteten Kommas oder Doppelquote müssen zitiert werden.
1997, Ford, E350, "Super, luxuriöser Lkw"
- Jedes der eingebetteten Doppel-Zapfen-Zeichen muss durch ein Paar Doppelquote-Zeichen dargestellt werden.
1997, Ford, E350, "Super", "luxuriöser" "Truck"
- Felder mit eingebetteten Linienbrüchen müssen zitiert werden (viele CSV -Implementierungen unterstützen jedoch keine eingebetteten Linienbrüche).
1997, Ford, E350, "Holen Sie sich einen, jetzt gehen sie schnell"
- In einigen CSV -Implementierungen[die?], führende und nachverfolgende Räume und Laschen sind beschnitten (ignoriert). Ein solches Trimmen ist von RFC 4180 verboten, in dem festgestellt wird, dass "Räume als Teil eines Feldes gelten und nicht ignoriert werden sollten."
1997, Ford, E350 nicht gleich wie 1997, Ford, E350
- Laut RFC 4180 sind keine Leerzeichen außerhalb von Zitaten in einem Feld zulässig; Der RFC sagt jedoch auch, dass "Räume als Teil eines Feldes angesehen werden und nicht ignoriert werden sollten". und "Implementierer sollten in dem, was Sie tun, konservativ sein, in dem, was Sie von anderen akzeptieren, liberal sein" (RFC 793, Abschnitt 2.10) bei der Verarbeitung von CSV -Dateien. "
1997, "Ford", E350
- In CSV -Implementierungen, die führende oder nachverfolgende Räume durchführen, müssen Felder mit so aussagekräftigen Daten zitiert werden.
1997, Ford, E350, "Super luxuriöser Truck"
- Die doppelte Angebotsverarbeitung muss nur dann gelten, wenn das Feld mit einem doppelten Angebot beginnt. Beachten Sie jedoch, dass doppelte Zitate in nicht geeigneten Feldern gemäß RFC 4180 nicht zulässig sind.
Los Angeles, 34 ° 03'N, 118 ° 15'W New York City, 40 ° 42'46 ″ N, 74 ° 00'21 '' W Paris, 48 ° 51'24 '' N, 2 ° 21'03 ″ E
- Der erste Datensatz kann ein "Header" sein, der Spaltennamen in jedem der Felder enthält (es gibt keine zuverlässige Möglichkeit zu sagen, ob eine Datei dies tut oder nicht. Es ist jedoch ungewöhnlich, andere Zeichen als Buchstaben, Ziffern und Ziffern zu verwenden. unterstreicht in solchen Spaltennamen).
Jahr, Make, Model 1997, Ford, E350 2000, Mercury, Cougar
Beispiel
Jahr | Machen | Modell | Beschreibung | Preis |
---|---|---|---|---|
1997 | Ford | E350 | AC, ABS, Mond | 3000.00 |
1999 | Chevy | Venture "Extended Edition" | 4900.00 | |
1999 | Chevy | Venture "Extended Edition, sehr groß" | 5000.00 | |
1996 | Jeep | Grand Cherokee | Muss verkaufen! Luft, Monddach, geladen | 4799.00 |
Die obige Datenentelle kann wie folgt im CSV -Format dargestellt werden:
Jahr, Make, Modell, Beschreibung, Preis 1997, Ford, E350, "AC, ABS, Moon", 3000.00 1999, Chevy, "Venture" "erweiterte Ausgabe" ",", ", 4900.00 1999, Chevy," Venture "" "" Erweiterte Ausgabe, sehr groß "", ",", 5000.00 1996, Jeep, Grand Cherokee, "muss verkaufen! Luft, Monddach, beladen", 4799.00
Beispiel für eine CSV -Datei USA/UK (wobei der Dezimalabschlüsseler ein Perioden/Vollstalt und das Wertseparator ein Komma ist):
Jahr, Make, Modell, Länge 1997, Ford, E350,2,35 2000, Mercury, Cougar, 2,38
Beispiel eines analogen europäischen CSV/DSV Datei (wobei das Dezimalentrennzeichen ein Komma ist und das Wertseparator ein Semikolon ist):
Jahr; Make; Modell; Länge 1997; Ford; E350; 2,35 2000; Mercury; Cougar; 2,38
Das letztere Format ist nicht RFC 4180 -konform.[21] Compliance könnte durch die Verwendung eines Kommas anstelle eines Semikolons als Trennzeichen und entweder der internationalen Notation für die Darstellung des Dezimalzeichen oder die Praxis, alle Zahlen zu zitieren, die eine Dezimalzeichen haben.
Anwendungsunterstützung
Einige Anwendungen verwenden CSV als a Datenaustauschformat Um seine zu verbessern Interoperabilität, exportieren und importieren CSV. Andere verwenden CSV als internes Format.
Als Datenaustauschformat: Das CSV -Dateiformat wird von fast allen Tabellen- und Datenbankverwaltungssystemen unterstützt.
- Tabellenkalkulationen einschließlich Apfel Zahlen, Libreoffice calc, und Apache OpenOffice Berechnen. Microsoft Excel Unterstützt auch CSV, jedoch mit Einschränkungen im Vergleich zu anderen Tabellenkalkulationssoftware (z. B. ab 2019[aktualisieren] Excel kann CSV-Dateien immer noch nicht in die häufig verwendete UTF-8-Zeichenkodierung exportieren.
- Relationale Datenbanken, beim Benutzen Standard SQL, kann CSV von der exportieren/importieren
KOPIEREN
Befehl. Zum Beispiel auf PostgreSQL ist gültigKopieren Sie in t 'Datei.csv' CSV
undKopieren Sie von T 'File.csv' CSV
.[22] - Viele Dienstprogramme auf Unix-Stilsysteme (wie z. schneiden, Einfügen, beitreten, Sortieren, Uniq, awk) kann Dateien auf einem Komma -Trennzeichen teilen und daher einfache CSV -Dateien verarbeiten. Diese Methode verarbeitet jedoch nicht korrekte Kommas innerhalb der angegebenen Zeichenfolgen.
Als (Haupt- oder optionale) interne Darstellung. Kann sein einheimisch oder fremd, aber unterscheiden sich vom Interchange -Format ("nur" exportieren/import "), da es nicht erforderlich ist, eine Kopie in einem anderen Format zu erstellen:
- Etwas Tabellenkalkulationen einschließlich Libreoffice calc Bietet diese Option an, ohne den Benutzer zur Einführung eines anderen Formats durchzusetzen.
- Einige relationale Datenbanken, die bei Verwendung von Standard -SQL anbieten Fremddaten-Verpackung (FDW). Zum Beispiel bietet PostgreSQL das "Fremdtisch erstellen" an.[23] und "Erweiterungsdatei erstellen_fdw erstellen[24] So konfigurieren Sie jede Variante von CSV.
- Datenbanken mögen Apache Bienenstock Bieten Sie die Option, CSV auszudrücken oder .csv.gz Als internes Tabellenformat.
- Das EMACs Der Editor kann im CSV-NAV-Modus mit CSV-Dateien arbeiten.[25]
Das CSV -Format wird von Bibliotheken unterstützt, die für viele verfügbar sind Programmiersprachen. Die meisten bieten eine Möglichkeit, den Feld Grenzwerte anzugeben. Dezimaltrennzeichen, Charaktercodierung, Zitat von Konventionen, Datumsformat usw.
Software- und Zeilengrenzen
Jede Software, die mit CSV arbeitet, hat die maximale Anzahl von Zeilen CSV -Dateien. Im Folgenden finden Sie eine Liste der gemeinsamen Software und ihre Einschränkungen:[26]
- Microsoft Excel: 1.048.576 Reihenlimit;
- Apple -Zahlen: 1.000.000 Reihenlimit;
- Google Sheets: 5.000.000 Zellgrenze (das Produkt von Spalten und Zeilen);
- OpenOffice und LibreOffice: 1.048.576 Reihenlimit;
- Textredakteure (z. B. WordPad, textedit, vim usw.): Keine Zeile oder Zellgrenze;
- Datenbanken (Befehl kopieren und FDW): Keine Zeilen- oder Zellgrenze.
Siehe auch
- Tabend getrennte Werte
- Vergleich der Datenserialisierungsformate
- Trennzeichen getrennte Werte
- Grenzkollision
- Flat-File-Datenbank
- Simple Data Format
- Ersatzcharakter, Nullcharakter, unsichtbares Komma u+2063
Verweise
- ^ a b c d e Shafranovich, Y. (Oktober 2005). Gemeinsames Format und MIME -Typ für CSV -Dateien. Ietf. p. 1. doi:10.17487/rfc4180. RFC 4180.
- ^ IBM DB2 Administration Guide. IBM.
- ^ "CSV - Komma getrennte Werte". Abgerufen 2017-12-02.
- ^ "CSV -Dateien". Abgerufen 4. Juni, 2014.
- ^ "CSV -Standarddateiformat (Comma Separated Values (CSV)". Edoceo, Inc. Abgerufen 4. Juni, 2014.
- ^ IBM FORTRAN -Programmprodukte für Betriebssystem und die CMS -Komponente von VM/370 Allgemeinen Informationen (PDF) (First Ed.), Juli 1972, p. 17, GC28-6884-0, abgerufen 5. Februar, 2016,
Für Benutzer, die mit dem Vorgänger FORTRAN IV G- und H -Prozessoren vertraut sind, sind dies die wichtigsten neuen Sprachfunktionen
- ^ "Listengerichtete I/O", FORTRAN 77 SprachreferenzOrakel
- ^ "Supercalc², Tabellenkalkulationspaket für IBM, CP/M". Abgerufen 11. Dezember, 2017.
- ^ "Comma-Separated-Value-Format-Dateistruktur". 1983. Abgerufen 11. Dezember, 2017.
- ^ "CSV, COMMA -getrennte Werte (RFC 4180)". Abgerufen 4. Juni, 2014.
- ^ RFC 4180: CSV-Dateien (Common-Format- und MIME-Typ für von Kommas getrennte Werte). doi:10.17487/rfc4180. RFC 4180. Abgerufen 22. Dezember, 2020.
- ^ Sehen SPARQL11-RESULTS-CSV-TSVDie erste W3C -Empfehlung wurde in CSV gesammelt und einige der Mängeln von RFC 4180 gefüllt.
- ^ RFC 7111: URI -Fragment -Kennungen für den Text/CSV -Medienart. doi:10.17487/rfc7111. RFC 7111. Abgerufen 22. Dezember, 2020.
- ^ "Modell für tabellarische Daten und Metadaten im Web - W3C Empfehlung 17. Dezember 2015". Abgerufen 23. März, 2016.
- ^ * Kreativität (2010), Wie zu: Das CSV -Dateiformat (Comma Separated Value), Creativyst.com, abgerufen 24. Mai, 2010
- ^ "Tabulärdatenpaket". Reiblose Datenspezifikationen.
- ^ "CSV -Dialekt". Reiblose Datenspezifikationen.
- ^ "CSV in der Web -Arbeitsgruppe". W3c CSV WG. 2013. Abgerufen 2015-04-22.
- ^ CSV im Webrepository (auf Github)
- ^ Modell für tabellarische Daten und Metadaten im Web (W3C -Empfehlung)
- ^ Shafranovich (2005) Staaten: "Innerhalb des Headers und in jeder Aufzeichnung kann es eine oder mehrere Felder geben, die durch Kommas getrennt sind."
- ^ "Dokumentation: 14: Kopie". PostgreSQL. 2022-02-10. Abgerufen 2022-03-04.
- ^ "Dokumentation: 14: F.35. Postgres_fdw". PostgreSQL. 2022-02-10. Abgerufen 2022-03-04.
- ^ "Dokumentation: 14: F.14. Datei_fdw". PostgreSQL. 2022-02-10. Abgerufen 2022-03-04.
- ^ "Emacswiki: CSV NAV". www.emacswiki.org.
- ^ "CSV und Reihengrenzen verstehen". Abgerufen 28. Februar, 2021.
Weitere Lektüre
- "IBM DB2 Administration Guide - Last-, Import- und Exportdateiformate". IBM. Archiviert vom Original am 2016-12-13. Abgerufen 2016-12-12. (Hat Dateibeschreibungen von abgrenzten ASCII (.del) (einschließlich Komma- und Semikolon-getrennter) und nicht delimitierter ASCII (.asc) -Dateien für die Datenübertragung.)