Daten (Computer)

Verschiedene Arten von Daten, die über ein Computergerät visualisiert werden können

Im Computer, Daten (als einzigartig, plural oder als Massennomen) ist jede Sequenz von einer oder mehrerer Symbole; Datum ist ein einzelnes Symbol für Daten. Daten erfordert eine Interpretation, um zu werden Information. Digitale Daten ist Daten, die mit dem dargestellt werden binäre Zahl System der ein (1) und Nullen (0) statt von Analog Darstellung. In modernen Computersystemen (Post-1960) sind alle Daten digital.

Daten existieren in drei Staaten: Daten in Ruhe, Daten im Transport und verwendete Daten. Daten innerhalb eines Computers, in den meisten Fällen, bewegt sich als parallele Daten. Daten, die in den meisten Fällen zu oder von einem Computer bewegen, bewegt sich als serielle Daten. Daten, die von einem analogen Gerät wie einem Temperatursensor bezogen werden, können mit einem in digital umgewandelt werden Analog-Digital-Wandler. Daten darstellen Mengen, Zeichen oder Symbole, auf denen Operationen von a ausgeführt werden Computer sind gelagert und verzeichnet an magnetisch, optisch, elektronische oder mechanische Aufzeichnungsmedien und übertragen in Form von digitalen elektrischen oder optischen Signalen.[1] Daten passieren Computer und aus Computern über Peripheriegeräte.

Physisch Computerspeicher Elemente bestehen aus einer Adresse und einem Byte/Wort der Datenspeicherung. Digitale Daten werden häufig in gespeichert relationale Datenbanken, wie Tische oder SQL -Datenbanken und können im Allgemeinen als abstrakte Schlüssel-/Wertpaare dargestellt werden. Daten können in vielen verschiedenen Arten von organisiert werden Datenstrukturen, einschließlich Arrays, Grafiken, und Objekte. Datenstrukturen können Daten von vielen verschiedenen speichern Typen, einschließlich Zahlen, Saiten und sogar andere Datenstrukturen.

Eigenschaften

Metadaten Hilft bei der Übersetzung von Daten in Informationen. Metadaten sind Daten zu den Daten. Metadaten können impliziert, angegeben oder angegeben werden.

Daten zu physischen Ereignissen oder Prozessen haben eine zeitliche Komponente. Diese zeitliche Komponente kann impliziert werden. Dies ist der Fall, wenn ein Gerät wie ein Temperaturlogger Daten von einer Temperatur erhält Sensor. Wenn die Temperatur empfangen wird, wird davon ausgegangen, dass die Daten eine zeitliche Referenz von haben jetzt. Das Gerät zeichnet also Datum, Uhrzeit und Temperatur zusammen. Wenn der Datenlogger die Temperaturen kommuniziert, muss er auch das Datum und die Uhrzeit als Metadaten für jeden Temperaturwert melden.

Grundsätzlich folgen Computer einer Abfolge von Anweisungen, die sie in Form von Daten angegeben haben. Eine Reihe von Anweisungen zur Ausführung einer bestimmten Aufgabe (oder Aufgaben) wird a genannt Programm. Ein Programm ist Daten in Form von codierten Anweisungen zur Steuerung des Betriebs eines Computers oder einer anderen Maschine.[2] Im nominalen Fall das Programm als hingerichtet durch den Computer besteht aus Maschinensprache. Die Elemente von Lagerung Manipuliert durch das Programm, aber nicht tatsächlich von der ausgeführt Zentrale Verarbeitungseinheit (CPU) sind auch Daten. Ein einzelnes Datum ist im Wesentlichen a Wert an einem bestimmten Ort gespeichert. Daher können Computerprogramme auf anderen Computerprogrammen arbeiten, indem sie ihre programmatischen Daten manipulieren.

Daten speichern Bytes In einer Datei müssen sie es sein serialisiert in einem Datei Format. In der Regel werden Programme in speziellen Dateitypen gespeichert, die sich von denen unterscheiden, die für andere Daten verwendet werden. Ausführbare Dateien Programme enthalten; Alle anderen Dateien sind auch Datei. Ausführbare Dateien können jedoch auch Daten enthalten, die vom Programm verwendet werden, das in das Programm integriert ist. Insbesondere einige ausführbare Dateien haben a Datensegment, die nominell Konstanten und Anfangswerte für Variablen enthält, die beide als Daten betrachtet werden können.

Die Grenze zwischen Programm und Daten kann verschwommen werden. Ein DolmetscherZum Beispiel ist ein Programm. Die Eingabedaten zu einem Dolmetscher sind selbst ein Programm, das nicht in nativem ausgedrückt wird Maschinensprache. In vielen Fällen wird das interpretierte Programm ein menschlich lesbarer Mensch sein Textdatei, was mit a manipuliert wird Texteditor Programm. Metaprogrammierung In ähnlicher Weise manipulieren Programme andere Programme als Daten. Programme wie Compiler, Linker, Debugger, Programm Updaters, Virenscanner und so verwenden andere Programme als Daten.

Zum Beispiel a Benutzer Könnte zuerst das anweisen Betriebssystem zu laden a Textverarbeitungssystem Programm aus einer Datei und dann mit dem laufenden Programm zum Öffnen und Bearbeiten von a dokumentieren in einer anderen Datei gespeichert. In diesem Beispiel wird das Dokument als Daten betrachtet. Wenn der Textverarbeitungsprogramm auch a enthält RechtschreibprüfungDann wird auch das Wörterbuch (Wortliste) für den Zaubersprüche als Daten betrachtet. Das Algorithmen vom Zauberprüfen verwendet, um Korrekturen vorzuschlagen, wäre entweder Maschinensprache Daten oder Text in einigen interpretierbaren Programmiersprache.

In einer alternativen Verwendung, Binärdateien (Welche nicht sind für Menschen lesbar) werden manchmal genannt Daten im Vergleich zu menschlichem Lesbar Text.[3]

Die Gesamtmenge der digitalen Daten im Jahr 2007 wurde auf 281 Milliarden geschätzt Gigabyte (281 Exabyte).[4][5]

Datenschlüssel und Werte, Strukturen und Persistenz

Tasten in Daten liefern den Kontext für Werte. Unabhängig von der Datenstruktur gibt es immer eine Schlüsselkomponente. Tasten in Daten und Datenstrukturen sind für die Bedeutung von Datenwerten von wesentlicher Bedeutung. Ohne einen Schlüssel, der direkt oder indirekt mit einem Wert oder einer Sammlung von Werten in einer Struktur verbunden ist, werden die Werte bedeutungslos und es hören zu, Daten zu sein. Das heißt, es muss eine Schlüsselkomponente geben, die mit einer Wertkomponente verknüpft ist, damit sie als Daten berücksichtigt werden.

Daten können auf verschiedene Weise in Computern gemäß den folgenden Beispielen dargestellt werden:

RAM

  • Arbeitsspeicher (RAM) enthält Daten, auf die die CPU direkten Zugriff hat. Eine CPU kann nur Daten innerhalb ihrer manipulieren Prozessorregister oder Speicher. Dies ist im Gegensatz zur Datenspeicherung, wobei die CPU die Datenübertragung zwischen dem Speichergerät (Festplatte, Band ...) und dem Speicher leiten muss. RAM ist eine Reihe von linearen, zusammenhängenden Stellen, die ein Prozessor lesen oder schreiben kann, indem er eine Adresse für den Lese- oder Schreibvorgang angibt. Der Prozessor kann jederzeit in jeder Reihenfolge an einem beliebigen Standort im Speicher arbeiten. Im RAM ist das kleinste Datenelement die Binärdatei bisschen. Die Fähigkeiten und Einschränkungen des Zugriffs von RAM sind prozessorspezifisch. Im Algemeinen Haupterinnerung ist als eine Reihe von angeordnet Standorte beginnend bei Adresse 0 (hexadezimal 0). Jeder Standort kann normalerweise 8 oder 32 Bit speichern, abhängig von der Rechnerarchitektur.

Schlüssel

  • Datenschlüssel müssen im Speicher keine direkte Hardwareadresse sein. Indirekt, abstrakte und logische Schlüsselcodes können in Verbindung mit Werten zu bilden a gespeichert werden Datenstruktur. Datenstrukturen sind vorbestimmt Offsets (oder Links oder Pfade) vom Beginn der Struktur, in dem Datenwerte gespeichert werden. Daher besteht der Datenschlüssel aus dem Schlüssel zur Struktur und dem Offset (oder den Links oder Pfaden) in die Struktur. Wenn eine solche Struktur wiederholt wird und die Datenwerte und die Datenschlüssel in derselben Wiederholungsstruktur gespeichert werden, kann das Ergebnis in Betracht gezogen werden, um a zu ähneln. Tisch, in dem jedes Element der sich wiederholenden Struktur als Spalte angesehen wird, und jede Wiederholung der Struktur wird als Zeile der Tabelle angesehen. In einer solchen Datenorganisation ist der Datenschlüssel in der Regel ein Wert in einem (oder einer Zusammensetzung der Werte in mehreren) der Spalten.

Organisierte wiederkehrende Datenstrukturen

  • Das tabellarisch Die Ansicht der Wiederholung von Datenstrukturen ist nur eine von vielen Möglichkeiten. Wiederholungsdatenstrukturen können organisiert werden Hierarchisch, so dass Knoten in einer Kaskade von Eltern-Kind-Beziehungen miteinander verbunden sind. Werte und potenziell komplexere Datenstrukturen sind mit den Knoten verbunden. Somit liefert die Knotenhierarchie den Schlüssel für die Behandlung der mit den Knoten verbundenen Datenstrukturen. Diese Darstellung kann als als betrachtet werden Umgekehrter Baum. Z.B. Modernes Computerbetriebssystem Dateisysteme sind ein häufiges Beispiel; und Xml ist ein anderer.

Sortierte oder bestellte Daten

  • Daten haben einige inhärente Funktionen, wenn es so ist auf einen Schlüssel sortiert. Alle Werte für Teilmengen des Schlüssels erscheinen zusammen. Wenn Sie nacheinander durch Gruppen der Daten mit demselben Schlüssel oder einer Teilmenge der Schlüsseländerungen bestehen, wird dies in Datenverarbeitungskreisen als Pause oder a bezeichnet. Kontrollpause. Es erleichtert insbesondere die Aggregation von Datenwerten für Teilmengen eines Schlüssels.

Peripherer Speicher

  • Bis zum Aufkommen der Schüttung Nichtflüchtiger Gedächtnis wie BlitzDie anhaltende Datenspeicherung wurde traditionell durch das Schreiben der Daten erreicht externe Blockgeräte wie Magnetband und Scheibenfahrten. Diese Geräte versuchen normalerweise zu einem Ort in den Magnetmedien und lesen oder schreiben anschließend Datenblöcke einer vorgegebenen Größe. In diesem Fall ist der Suchort in den Medien der Datenschlüssel und die Blöcke sind die Datenwerte. Früh benutzt Rohscheibe Datendateisysteme oder Disc-Betriebssysteme reserviert zusammenhängend Blöcke auf dem Disc -Laufwerk für Datei. In diesen Systemen konnten die Dateien ausfüllt sein, bevor alle Daten zu ihnen geschrieben worden waren. So wurde viel unbenutzter Datenraum unproduktiv reserviert, um einen ausreichenden freien Speicherplatz für jede Datei zu gewährleisten. Spätere Dateisysteme eingeführt Partitionen. Sie reservierten Blöcke des Disc -Datenraums für Partitionen und verwendeten die zugewiesenen Blöcke wirtschaftlicher, indem sie nach Bedarf eine Partition dynamisch zuweisen. Um dies zu erreichen, musste das Dateisystem nachverfolgen, welche Blöcke von Datendateien in einer Katalog- oder Dateizuweisungstabelle verwendet oder nicht verwendet wurden. Dies führte zwar den Disc -Datenraum besser aus, führte jedoch zu einer Fragmentierung von Dateien über die Disc und zu einem gleichzeitigen Leistungsaufwand, der aufgrund zusätzlicher Suchzeit zum Lesen der Daten einhergeht. Moderne Dateisysteme reorganisieren fragmentierte Dateien dynamisch, um die Dateizugriffszeiten zu optimieren. Weitere Entwicklungen in Dateisystemen führten dazu Virtualisierung von Disc -Laufwerken, d. H. Wenn ein logischer Laufwerk als Partitionen aus einer Reihe physischer Laufwerke definiert werden kann.

Indexierte Daten

  • Das Abrufen einer kleinen Untergruppe von Daten aus einem viel größeren Satz kann implizit die Daten nacheinander ineffizient suchen. Indizes sind eine Möglichkeit, Schlüssel und Standortadressen aus Datenstrukturen in Dateien, Tabellen und Datensätzen zu kopieren, und organisieren Sie sie dann mithilfe von Verwendung Umgekehrte Baumstrukturen Um die Zeit zu verkürzen, um eine Teilmenge der ursprünglichen Daten abzurufen. Zu diesem Zweck muss der Schlüssel der zu abgerufenen Datenuntergruppen vor dem Abrufen bekannt sein. Die beliebtesten Indizes sind die B-Baum und die Dynamik Hash Schlüsselindizierungsmethoden. Die Indexierung ist Overhead für die Einreichung und Abrufen von Daten. Es gibt andere Möglichkeiten, Indizes zu organisieren, z. Sortieren der Schlüssel und verwenden Sie a binärer Suchalgorithmus.

Abstraktion und Indirektion

  1. Die taxonomische Rangstruktur von Klassen, was ein Beispiel für eine hierarchische Datenstruktur ist; und
  2. Zur Laufzeit die Erstellung von Verweise auf In-Memory-Datenstrukturen von Objekten, die gewesen sind instanziiert von einem Klassenbibliothek.

Erst nach der Instanziierung gibt es ein Objekt einer bestimmten Klasse. Nachdem die Referenz eines Objekts gelöscht wurde, hört das Objekt auch auf. Die Speicherorte, an denen die Daten des Objekts gespeichert wurden Müll und werden als nicht verwendeter Speicher für Wiederverwendung umklassifiziert.

Datenbankdaten

Parallele verteilte Datenverarbeitung

  • Moderne skalierbare und leistungsstarke Datenpersistenztechnologien, wie z. Apache Hadoop, verlassen Sie sich auf eine massiv parallele verteilte Datenverarbeitung in vielen Rohstoffcomputern auf einem hohen Bandbreitennetzwerk.In solchen Systemen werden die Daten auf mehrere Computer verteilt, und daher muss ein bestimmter Computer im System entweder direkt oder indirekt im Schlüssel der Daten dargestellt werden.Dies ermöglicht die Differenzierung zwischen zwei identischen Datensätzen, die jeweils gleichzeitig auf einem anderen Computer verarbeitet werden.

Siehe auch

Verweise

  1. ^ "Daten". Lexiko. Archiviert vom Original am 2019-06-23. Abgerufen 14. Januar 2022.
  2. ^ "Computer Programm". Das Oxford -Taschenwörterbuch des aktuellen Englisch. Archiviert Aus dem Original am 28. November 2011. Abgerufen 11. Oktober 2012.
  3. ^ "Datei (1)". OpenBSD -Handbuchseiten. 24. Dezember 2015. Archiviert Aus dem Original am 5. Februar 2018. Abgerufen 4. Februar 2018.
  4. ^ Paul, Ryan (12. März 2008). "Studie: Menge an digitalen Informationen> Globale Speicherkapazität".ARS -Technik. Archiviert Aus dem Original am 13. März 2008. Abgerufen 13. März 2008.
  5. ^ Gantz, John F.;et al.(2008). "Das vielfältige und explodierende digitale Universum".Internationale Data Corporation über EMC.Archiviert von das Original am 11. März 2008. Abgerufen 12. März 2008.