Daten

Dies sind einige der verschiedenen Arten von Daten.

In der Verfolgung von Wissen, Daten (UNS: /ˈdætə/; Vereinigtes Königreich: /ˈdtə/) ist eine Sammlung diskreter Einheiten von Information in einem Konzeptmodell das in ihren grundlegendsten Formen vermitteln Anzahl, Qualität, Tatsache, Statistikenoder andere grundlegende Bedeutung. EIN Datum ist ein Element in einem Datensatz. Daten sind normalerweise in organisiert in Strukturen wie zum Beispiel Tische Dies liefert zusätzlichen Kontext und Bedeutung und die selbst in größeren Strukturen selbst als Daten verwendet werden können. Daten können verwendet werden als Variablen in einem Rechenprozess.[1][2] Daten können abstrakte Ideen oder konkrete Messungen darstellen.[3] Daten werden üblicherweise in verwendet wissenschaftliche Forschung, Finanzenund in nahezu jeder anderen Form menschlicher organisatorischer Aktivität. Beispiele für Datensätze umfassenAktienkurse, Kriminalitätsraten, Arbeitslosenquote, Alphabetisierung Preise und Volkszählung Daten.

Daten sind gesammelt Verwenden von Techniken wie z. Messung, Überwachung, Anfrage, oder Analyseund normalerweise repräsentiert wie Zahlen oder Figuren das kann weiter sein verarbeitet. Felddaten sind Daten, die in einem unkontrollierten gesammelt werden vor Ort Umgebung. Versuchsdaten sind Daten, die im Verlauf eines kontrollierten generierten wissenschaftlich Experiment. Daten sind analysiert Verwenden von Techniken wie z. Berechnung, Argumentation, Diskussion, Präsentation, Visualisierungoder andere Formen der Analyse. Vor Analaysis, Rohdaten (oder unverarbeitete Daten) ist normalerweise gereinigt: Ausreißer werden entfernt und offensichtliche Instrumente oder Dateneingabefehler werden korrigiert.

Daten wurden als "das neue" beschrieben Öl des Digitale Wirtschaft".[4][5] Daten als allgemeiner Konzeptbezieht sich auf die Tatsache, dass einige existieren Information oder Wissen ist repräsentiert oder codiert in irgendeiner Form geeignet für eine bessere Verwendung oder wird bearbeitet. Daten sind die kleinsten Einheiten von sachlichen Informationen, die als Grundlage für Berechnung, Argumentation oder Diskussion verwendet werden können. Daten können von abstrakten Ideen bis hin zu konkreten Messungen reichen, einschließlich, aber nicht beschränkt auf Statistiken. Thematisch verbundene Daten, die in einem relevanten Kontext dargestellt werden Information. Informationen über kontextbezogene Informationen können dann als beschrieben werden Datenerkenntnisse oder Intelligenz. Die Bestände von Erkenntnissen und Intelligenz, die sich im Laufe der Zeit ansammeln, die sich aus der Synthese von Daten in Informationen ergeben, kann dann beschrieben werden Wissen.

Fortschritte in Computertechnologien haben zum Aufkommen von "Big Data" geführt. Big Data bezieht sich normalerweise auf sehr große Datenmengen, normalerweise auf der Petabyte -Skala. Die Verwendung herkömmlicher Datenanalysemethoden und -Recherrechte, die Arbeit mit solch großen (und wachsenden) Datensätzen ist schwierig, sogar unmöglich. (Theoretisch würden unendliche Daten unendliche Informationen liefern, die das Extrahieren von Erkenntnissen oder Intelligenz unmöglich machen würden.) Als Reaktion darauf verwendet das relativ neue Feld der "Data Science" maschinelles Lernen (und andere künstliche Intelligenz (KI)), die es zulässt Für effiziente Anwendungen analytischer Methoden auf Big Data.

Etymologie und Terminologie

Das lateinische Wort Daten ist der Plural von 'Datum', "(Sache) gegeben," neutraler Vergangenheit Partizip von Wagen "geben".[6] Die erste englische Verwendung des Wortes "Daten" stammt aus den 1640er Jahren. Das Wort "Daten" wurde erstmals 1946 als "übertragbare und lagerbare Computerinformationen" verwendet. Der Ausdruck "Datenverarbeitung" wurde erstmals 1954 verwendet.[6]

Wenn "Daten" allgemeiner als Synonym für "Informationen" verwendet werden, wird es als a behandelt Massennomen in singulärer Form. Diese Verwendung ist häufig in Alltagssprache und in technischen und wissenschaftlichen Bereichen wie z. Software-Entwicklung und Informatik. Ein Beispiel für diese Verwendung ist der Begriff "Große Daten". Wenn sie genauer verwendet werden, um sich auf die Verarbeitung und Analyse von Datensätzen zu beziehen, behält der Begriff seine Pluralform bei. Diese Verwendung ist in Naturwissenschaften, Biowissenschaften, Sozialwissenschaften, Softwareentwicklung und Informatik üblich und wächst immer beliebter in Das 20. und 21. Jahrhundert. Einige Stilführer erkennen die unterschiedlichen Bedeutungen des Begriffs nicht und empfehlen einfach die Form, die dem Zielpublikum des Leitfadens am besten passt. Zum Beispiel,,, APA -Stil Zum 7. Ausgabe müssen "Daten" als Pluralform behandelt werden.[7]

Bedeutung

Adrien Auzout"Eine Tabelle der Öffnungen von Objektgläsen" aus einem Artikel von 1665 in Philosophische Transaktionen

Daten, Information, Wissen, und Weisheit sind eng verwandte Konzepte, aber jeder hat seine Rolle in Bezug auf den anderen, und jeder Begriff hat seine Bedeutung. Nach gemeinsamer Ansicht werden Daten gesammelt und analysiert; Daten werden nur Informationen, die für Entscheidungen geeignet sind, sobald sie auf irgendeine Weise analysiert wurden.[8] Man kann sagen, dass das Ausmaß, in dem ein Datensatz für jemanden informativ ist, davon abhängt, inwieweit sie von dieser Person unerwartet ist. Die Menge an Informationen, die in einem Datenstrom enthalten sind Shannon Entropie.

Wissen Ist das Verständnis auf umfangreichen Erfahrungen mit Informationen zu einem Thema. Zum Beispiel die Höhe von Mount Everest wird allgemein als Daten betrachtet. Die Höhe kann genau mit einem gemessen werden Höhenmesser und in eine Datenbank eingegeben. Diese Daten können zusammen mit anderen Daten auf dem Mount Everest in ein Buch aufgenommen werden, um den Berg auf eine Weise zu beschreiben, die für diejenigen nützlich ist, die sich für die beste Methode zum Klettern entscheiden möchten. Ein Verständnis, das auf Erfahrung im Klettern der Berge basiert und Personen auf dem Weg zur Erreichung des Gipfels von Mount Everest als "Wissen" beraten könnte. Das praktische Klettern des Mount Everest -Gipfels basierend auf diesem Wissen kann als "Weisheit" angesehen werden. Mit anderen Worten, Weisheit bezieht sich auf die praktische Anwendung des Wissens einer Person unter diesen Umständen, unter denen sich das Gutes ergeben kann. Somit ergänzt und vervollständigt die Weisheit die Serie "Daten", "Informationen" und "Wissen" zunehmend abstrakter Konzepte.

Es wird häufig angenommen, dass Daten das am wenigsten abstrakte Konzept sind, Informationen am nächsten am wenigsten und das Wissen am abstraktsten sind.[9] In dieser Ansicht werden Daten zu Informationen durch Interpretation; Beispielsweise gilt die Höhe des Mount Everest im Allgemeinen als "Daten", ein Buch über geologische Merkmale des Mount Everest kann als "Informationen" betrachtet werden, und ein Kletterführer mit praktischen Informationen über die beste Möglichkeit, den Gipfel des Mount Everest zu erreichen, kann als "Wissen" angesehen werden. . "Information" trägt eine Vielfalt von Bedeutungen, die vom täglichen Gebrauch bis zur technischen Verwendung reicht. Diese Ansicht wurde jedoch auch argumentiert, wie Daten aus Informationen und Informationen aus Wissen entstehen.[10] Im Allgemeinen hängt das Konzept der Information eng mit Vorstellungen von Einschränkungen, Kommunikation, Kontrolle, Daten, Form, Unterricht, Wissen, Bedeutung, mentalem Anreiz, Muster, Wahrnehmung und Repräsentation zusammen. Beynon-Davies verwendet das Konzept von a Schild Unterscheidung zwischen Daten und Informationen; Daten sind eine Reihe von Symbolen, während Informationen auftreten, wenn die Symbole verwendet werden, um sich auf etwas zu beziehen.[11][12]

Vor der Entwicklung von Computergeräten und Maschinen mussten die Menschen Daten manuell sammeln und Muster auferlegen. Seit der Entwicklung von Computergeräten und Maschinen können diese Geräte auch Daten sammeln. In den 2010er Jahren werden Computer in vielen Bereichen häufig verwendet, um Daten zu sammeln und sie zu sortieren oder zu verarbeiten, in Disziplinen, die von Marketing, Analyse von Sozialdienstleistungen Nutzung der Bürger für wissenschaftliche Forschung. Diese Muster in Daten werden als Informationen angesehen, die zur Verbesserung des Wissens verwendet werden können. Diese Muster können als "interpretiert werden"Wahrheit"(obwohl" Wahrheit "ein subjektives Konzept sein kann) und kann in einigen Disziplinen oder Kulturen als ästhetische und ethische Kriterien autorisiert werden. Ereignisse, die wahrnehmbare physische oder virtuelle Überreste hinterlassen Der Zusammenhang zwischen Mark und Beobachtung ist gebrochen.[13]

Mechanische Computergeräte werden nach ihrer Darstellung von Daten klassifiziert. Ein Analoger Computer stellt ein Datum als Spannung, Entfernung, Position oder andere physikalische Menge dar. EIN digitaler Computer repräsentiert ein Datenstück als eine Abfolge von Symbolen, die aus einem festgelegt sind Alphabet. Die häufigsten digitalen Computer verwenden ein binäres Alphabet, dh ein Alphabet von zwei Zeichen, die normalerweise "0" und "1" bezeichnet werden. Bekanntere Darstellungen wie Zahlen oder Buchstaben werden dann aus dem binären Alphabet konstruiert. Einige spezielle Datenformen werden unterschieden. EIN Computer Programm ist eine Datenerfassung, die als Anweisungen interpretiert werden kann. Die meisten Computersprachen unterscheiden zwischen Programmen und anderen Daten, welche Programme jedoch in einigen Sprachen arbeiten, insbesondere in einigen Sprachen Lispeln und ähnliche Sprachen, Programme sind im Wesentlichen nicht von anderen Daten zu unterscheiden. Es ist auch nützlich zu unterscheiden Metadatendas heißt eine Beschreibung anderer Daten. Ein ähnlicher, aber früherer Begriff für Metadaten sind "Nebendaten". Das prototypische Beispiel für Metadaten ist der Bibliothekskatalog, der eine Beschreibung des Inhalts von Büchern darstellt.

Datendokumente

Immer wenn Daten registriert werden müssen, gibt es Daten in Form einer Daten dokumentieren. Die Arten von Datendokumenten umfassen:

Einige dieser Datendokumente (Datenrepositories, Datenstudien, Datensätze und Software) werden in Datenzitatindizes indiziert, während Datenpapiere in herkömmlichen bibliografischen Datenbanken, z. B., indiziert werden, z. B., Science Citation Index. Siehe weiter.[14]

Datensammlung

Das Sammeln von Daten kann über eine primäre Quelle (der Forscher ist die erste Person, die die Daten erhält) oder eine sekundäre Quelle (der Forscher erhält die Daten erhält, die bereits von anderen Quellen gesammelt wurden, wie z. B. in einer wissenschaftlichen Journal verbreiteten Daten). Datenanalysemethoden variieren und umfassen Daten -Triangulation und Datenverdauerung.[15] Letzterer bietet eine Artikulate -Methode zum Sammeln, Klassifizieren und Analysieren von Daten unter Verwendung von fünf möglichen Analysewinkeln (mindestens drei), um die Objektivität der Forschung zu maximieren und ein Verständnis der untersuchten Phänomene so vollständig wie möglich zu ermöglichen: qualitative und quantitative Methoden, Literatur, Literatur Bewertungen (einschließlich wissenschaftlicher Artikel), Interviews mit Experten und Computersimulation. Die Daten werden danach "perkoliert" unter Verwendung einer Reihe vorbestimmter Schritte "perkoliert", um die relevantesten Informationen zu extrahieren.

Daten Langlebigkeit und Zugänglichkeit

Ein wichtiges Feld in Informatik, Technologie, und Bibliothek Wissenschaft ist die Langlebigkeit von Daten. Wissenschaftliche Forschung generiert große Datenmengen, insbesondere in Genomik und Astronomie, aber auch in der Medizinische Wissenschaften, z.B. in medizinische Bildgebung. In der Vergangenheit wurden wissenschaftliche Daten in veröffentlicht in Papiere und Bücher, die in Bibliotheken gespeichert sind, aber in jüngerer Zeit praktisch alle Daten werden gespeichert Festplatte oder optische Scheiben. Im Gegensatz zu Papier können diese Speichergeräte jedoch nach einigen Jahrzehnten unlesbar werden. Wissenschaftliche Verlage und Bibliotheken haben seit einigen Jahrzehnten mit diesem Problem zu kämpfen, und es gibt immer noch keine zufriedenstellende Lösung für die langfristige Speicherung von Daten über Jahrhunderte oder sogar für die Ewigkeit.

Datenzugriffszügigkeit. Ein weiteres Problem ist, dass viele wissenschaftliche Daten niemals in Datenrepositorys wie z. Datenbanken. In einer kürzlich durchgeführten Umfrage wurden Daten aus 516 Studien angefordert, die zwischen 2 und 22 Jahren veröffentlicht wurden, weniger als 1 von 5 dieser Studien waren in der Lage oder bereit, die angeforderten Daten bereitzustellen. Insgesamt ging die Wahrscheinlichkeit, dass Daten nach der Veröffentlichung jedes Jahr um 17% zurückgingen.[16] In ähnlicher Weise eine Umfrage unter 100 Datensätzen in Dryade fanden heraus, dass mehr als die Hälfte die Details fehlte, um die Forschungsergebnisse aus diesen Studien zu reproduzieren.[17] Dies zeigt die schlimme Situation des Zugriffs auf wissenschaftliche Daten, die nicht veröffentlicht werden oder nicht genügend Details haben, um reproduziert zu werden.

Eine Lösung für das Problem der Reproduzierbarkeit ist der Versuch zu verlangen Faire DatenDas heißt., Daten, die findbar, zugänglich, interoperabel und wiederverwendbar sind. Daten, die diese Anforderungen erfüllen, können in der nachfolgenden Forschung verwendet werden und fördert somit Wissenschaft und Technologie.[18]

In anderen Bereichen

Obwohl Daten auch in anderen Bereichen zunehmend verwendet werden, wurde vermutet, dass die stark interpretative Natur von ihnen möglicherweise im Widerspruch zu dem Ethos von Daten steht, wie "angegeben". Peter Checkland stellte den Begriff ein Capta (aus dem Lateinischen Kaper, "Nehmen") zwischen einer immensen Anzahl möglicher Daten und einer Untereinstellung von ihnen zu unterscheiden, an die sich die Aufmerksamkeit orientiert.[19] Johanna Drucker hat argumentiert, dass die Geisteswissenschaften die Wissensproduktion als "gelegen, teilweise und konstitutiv" nutzen Daten können kontraproduktive Annahmen einführen, beispielsweise, dass Phänomene diskret sind oder observerunabhängig sind.[20] Der Begriff Capta, was den Beobachtungsakt als konstitutiv betont, wird als Alternative zu angeboten Daten für visuelle Darstellungen in den Geisteswissenschaften.

Siehe auch

Verweise

  1. ^ OECD -Glossar statistischer Begriffe. OECD. 2008. p. 119. ISBN 978-92-64-025561.
  2. ^ "Statistische Sprache - Was sind Daten?". Australian Bureau of Statistics. 2013-07-13. Archiviert vom Original am 2019-04-19. Abgerufen 2020-03-09.
  3. ^ "Daten gegen Informationen - Differenz und Vergleich | Diffen". www.diffen.com. Abgerufen 2018-12-11.
  4. ^ Yonego, Joris Toders (23. Juli 2014). "Daten sind das neue Öl der digitalen Wirtschaft". Verdrahtet - via www.rwired.com.
  5. ^ "Daten sind das neue Öl". 16. Juli 2018. archiviert von das Original am 2021-10-27.
  6. ^ a b "Daten | Ursprung und Bedeutung von Daten nach Online -Etymologie -Wörterbuch". www.etymonline.com.
  7. ^ American Psychological Association (2020). "6.11". Publikationshandbuch der American Psychological Association: Der offizielle Leitfaden zum APA -Stil. American Psychological Association. ISBN 9781433832161.
  8. ^ "Joint Publication 2-0, Joint Intelligence" (PDF). Gemeinsame Stabschefs, gemeinsame Doktrin -Veröffentlichungen. Verteidigungsministerium. 23. Oktober 2013. S. I-1. Abgerufen 17. Juli, 2018.
  9. ^ Akash Mitra (2011). "Klassifizieren von Daten für eine erfolgreiche Modellierung". Archiviert von das Original Am 2017-11-07. Abgerufen 2017-11-05.
  10. ^ Tuomi, Ilkka (2000). "Daten sind mehr als Wissen". Journal of Management Information Systems. 6 (3): 103–117. doi:10.1080/074212222.1999.11518258.
  11. ^ P. Beynon-Davies (2002). Informationssysteme: Eine Einführung in Informatik in Organisationen. Basingstoke, UK: Palgrave Macmillan. ISBN 0-333-96390-3.
  12. ^ P. Beynon-Davies (2009). Wirtschaftsinformatik. Basingstoke, Großbritannien: Palgrave. ISBN 978-0-230-20368-6.
  13. ^ Sharon Daniel. Die Datenbank: Eine Ästhetik der Würde.
  14. ^ Schöpfel et al. 2020. "Datendokumente". Isko -Enzyklopädie der Wissensorganisation https://www.isko.org/cyclo/data_documents
  15. ^ Mesily, Olivier (2015). Modelle in der psychologischen Forschung erstellen. États-unis: Springer Psychologie: 126 Seiten. ISBN978-3-319-15752-8
  16. ^ Vines, Timothy H.; Albert, Arianne Y. K.; Andrew, Rose L.; Débarre, Florenz; Bock, Dan G.; Franklin, Michelle T.; Gilbert, Kimberly J.; Moore, Jean-Sébastien; Renaut, Sébastien; Rennison, Diana J. (2014-01-06). "Die Verfügbarkeit von Forschungsdaten nimmt mit dem ARTICS -Alter schnell ab". Current Biology. 24 (1): 94–97. doi:10.1016/j.cub.2013.11.014. ISSN 1879-0445. PMID 24361065. S2CID 7799662.
  17. ^ Roche, Dominique G.; Kruuk, Loeske E. B.; Lanfear, Robert; Binning, Sandra A. (2015). "Öffentliche Datenarchivierung in Ökologie und Evolution: Wie gut geht es uns?". PLOS Biologie. 13 (11): E1002295. doi:10.1371/journal.pbio.1002295. ISSN 1545-7885. PMC 4640582. PMID 26556502.
  18. ^ Eisenstein, Michael (April 2022). "In der Verfolgung der Daten unsterblich". Natur. 604 (7904): 207–208. Bibcode:2022natur.604..207e. doi:10.1038/d41586-022-00929-3. ISSN 1476-4687. PMID 35379989. S2CID 247954952.
  19. ^ P. Checkland und S. Holwell (1998). Informations-, System- und Informationssysteme: Erkennen des Feldes. Chichester, West Sussex: John Wiley & Sons. S. 86–89. ISBN 0-471-95820-4.
  20. ^ Johanna Drucker (2011). "Geisteswissenschaften Ansätze zur grafischen Anzeige". Digitale Geisteswissenschaften vierteljährlich. 005 (1).

Externe Links