Binärdatei

A Hex -Dump des 318 Byte Wikipedia Favicon, oder Wikipedia-favicon.png. Die erste Spalte numeriert die Startadresse der Zeile, während die * Zeigt eine Wiederholung an.

A Binärdatei ist ein Computerdatei das ist nicht a Textdatei.[1] Der Begriff "Binärdatei" wird häufig als Begriff "Nicht-Text-Datei" verwendet.[2] Viele binäre Dateiformate Teile enthalten, die als Text interpretiert werden können; Zum Beispiel einige Computerdokumentdateien enthält Formatierter Text, wie zum Beispiel Älteres Microsoft Word -Dokument Dateien enthalten den Text des Dokuments, aber auch Formatierungsinformationen in Binärform.[2]

Struktur

Binärdateien werden normalerweise als Sequenz von angesehen Bytes, was die binären Ziffern bedeutet (Bits) sind in acht gruppiert. Binärdateien enthalten normalerweise Bytes, die als etwas anderes als Text interpretiert werden sollen Figuren. Zusammengestellt Computerprogramme sind typische Beispiele; In der Tat werden kompilierte Anwendungen manchmal bezeichnet, insbesondere von Programmierern, als Binärdateien. Binärdateien können aber auch bedeuten, dass sie Bilder, Sounds, komprimierte Versionen anderer Dateien usw. enthalten - kurzeraler jeder Art von Dateiinhalt.[1]

Einige Binärdateien enthalten Header,, Blöcke von Metadaten verwendet von a Computer Programm So interpretieren Sie die Daten in der Datei. Der Header enthält oft a Signatur oder Magie Nummer das kann das Format identifizieren. Zum Beispiel a GIF Die Datei kann mehrere Bilder enthalten, und Header werden verwendet, um jeden Block der Bilddaten zu identifizieren und zu beschreiben. Die führenden Bytes des Headers würden Text wie Gif87a oder Gif89a das kann das binäre als i identifizieren GIF Datei. Wenn eine Binärdatei keine Header enthält, kann sie als a genannt werden flache Binärdatei.

Eine Textdatei kann teilweise oder vollständig aus codierten binären Informationen bestehen. Beim Senden von Binärdateien über das Netzwerk können sie möglicherweise codiert werden, damit sie nur druckbare Zeichen verwenden. Dies ist häufig aufgrund der Einschränkungen von Netzwerkprotokollen erforderlich, die für Internet-Surfen und E-Mail-Kommunikation verwendet werden. Eine solche Kodierung ist Basis64. Auch Dateien, die Informationen über öffentliche und private Kleidung enthalten, um in Systemen beschäftigt zu werden Asymmetrische Kryptographie (wie zum Beispiel Website -Zertifikate) kann auch mit den in druckbaren Zeichen codierten binären Informationen gespeichert werden.

Manipulation

Binärdateien über bestimmte Systeme zu senden (z. Email), die nicht alle Datenwerte zulassen, sie werden häufig in eine einfache Textdarstellung übersetzt (zum Beispiel unter Verwendung, beispielsweise, Basis64). Die Codierung der Daten hat den Nachteil, dass die Dateigröße während der Übertragung erhöht wird (z. B. die Verwendung von Base64 erhöht die Größe der Datei um ca. 30%) und erfordert die Übersetzung nach dem Quittung wieder in Binärer. Die erhöhte Größe kann durch die Verbindungskomprimierung niedrigerer Ebene kontert werden, da die resultierenden Textdaten etwa so viel weniger haben werden Entropie Da es die Größe erhöht hat, wären die in diesem Szenario übertragenen tatsächlichen Daten wahrscheinlich sehr nahe an der Größe der ursprünglichen Binärdaten. Sehen Binär-bis-Text-Kodierung Für mehr zu diesem Thema.

Microsoft Windows und seine Standardbibliotheken für die C und C ++ Mit dem Programmiersprachen kann der Programmierer einen Parameter angeben, der angibt, ob eine Datei beim Öffnen einer Datei einen einfachen Text oder binär ist. Dies wirkt sich auf die Standardbibliotheksaufrufe aus, um aus der Datei zu lesen und zu schreiben, da das System zwischen dem C/C ++ -Enschluss "Ende der Zeile" (das ASCII-Zeilen-Zeilen-Zeichen) und das Line-Sequenzende Windows in Dateien (das ASCII Kutschenrückkehr und Linefeed -Zeichen in Sequenz). Im Unix-artig Systeme, die C- und C ++-Standardbibliotheken auf diesen Systemen ermöglichen es dem Programmierer auch, festzustellen, ob eine Datei zu text oder binär erwartet wird, die Bibliotheken können diesen Parameter jedoch ignorieren, da die Sequenz am Ende der Leitung in Unix-ähnlich ist Systeme ist nur das C/C ++ -Anline-Zeichen.

Betrachtung

A Hex -Editor oder Viewer kann verwendet werden, um Dateidaten als Abfolge von hexadezimalen (oder dezimalen, binären oder ASCII -Zeichen) -Werten für entsprechende Bytes einer Binärdatei anzuzeigen.[2]

Wenn eine binäre Datei in a geöffnet wird TexteditorJede Gruppe von acht Bits wird normalerweise als einzelnes Zeichen übersetzt, und der Benutzer wird eine (wahrscheinlich unverständliche) Anzeige von Textzeichen sehen. Wenn die Datei in einer anderen Anwendung geöffnet wird, wird diese Anwendung für jedes Byte ihre eigene Verwendung erhalten als Farben und zeigen Sie das entsprechende Bild an. Andere Arten von Zuschauern (sogenannte "Wortextraktoren") ersetzen einfach die unausdrucklichen Zeichen durch Räume, die nur den menschlich lesbaren Text enthüllen. Diese Art der Ansicht ist nützlich für eine kurze Untersuchung einer Binärdatei, um Kennwörter in Spielen zu finden, versteckten Text in Nicht-Text-Dateien zu finden und beschädigte Dokumente wiederherzustellen.[2] Es kann sogar verwendet werden, um verdächtige Dateien (Software) auf unerwünschte Effekte zu inspizieren. Beispielsweise würde der Benutzer eine URL/E -Mail sehen, zu der die vermutete Software möglicherweise eine Verbindung herstellen kann, um nicht genehmigte Daten hochzuladen (um zu stehlen). Wenn die Datei selbst als als behandelt wird ausführbar und rennen, dann versucht das Betriebssystem, die Datei als eine Reihe von Anweisungen in seinem zu interpretieren Maschinensprache.

Deutung

Standards sind für binäre Dateien sehr wichtig. Beispielsweise führt eine von dem ASCII -Zeichensatz interpretierte Binärdatei dazu, dass Text angezeigt wird. Eine benutzerdefinierte Anwendung kann die Datei anders interpretieren: Ein Byte kann ein Ton oder ein Pixel oder sogar ein ganzes Wort sein. Binär selbst ist bedeutungslos, bis ein ausgeführter Algorithmus definiert, was mit jedem Bit, Byte, Wort oder Block geschehen soll. Wenn Sie nur das Binäre untersuchen und versuchen, sie gegen bekannte Formate anzupassen, kann dies zu der falschen Schlussfolgerung darüber führen, was es tatsächlich darstellt. Diese Tatsache kann in verwendet werden Steganographie, wobei ein Algorithmus eine binäre Datendatei unterschiedlich interpretiert, um versteckte Inhalte anzuzeigen. Ohne den Algorithmus ist es unmöglich zu sagen, dass versteckte Inhalte existieren.

Binäre Kompatibilität

Zwei Binärvergleichsdateien haben die gleiche Abfolge von Nullen und im Datenabschnitt der Datei. Der Dateiheader kann jedoch unterschiedlich sein.

Der Begriff wird am häufigsten verwendet, um anzugeben, dass von einer Anwendung erstellte Datendateien genau mit den von einer anderen Anwendung erstellten Datendateien übereinstimmen. Zum Beispiel produzieren einige Softwareunternehmen Anwendungen für Fenster und die Macintosh Das sind binär kompatibel, was bedeutet, dass eine in einer Windows -Umgebung erstellte Datei mit einer auf einem Macintosh erstellten Datei austauschbar ist. Dies vermeidet viele der Konversionsprobleme, die durch den Import und Exportieren von Daten verursacht werden.

Ein mögliches Binärvergleichsproblem zwischen verschiedenen Computern ist die Endiangess des Computers. Einige Computer speichern die Bytes in einer Datei in einer anderen Reihenfolge.[3]

Siehe auch

Verweise

  1. ^ a b "Binärdateidefinition nach Linux Information Project (LINFO)" ". www.linfo.org. Abgerufen 2017-10-12.
  2. ^ a b c d "ASCII vs. Binärdateien". www.cs.umd.edu. Abgerufen 2017-10-12.
  3. ^ "NCL: Binärdaten lesen". www.ncl.ucar.edu. Archiviert von das Original Am 2017-10-12. Abgerufen 2017-10-12.

Externe Links

  • Die Wörterbuchdefinition von Binärdateien bei wiktionary