Data Science - Was es ist, Definition und Konzept

Inhaltsverzeichnis:

Data Science - Was es ist, Definition und Konzept
Data Science - Was es ist, Definition und Konzept
Anonim

Data Science ist eine Disziplin, die untersucht, woher eine bestimmte Informationsbasis stammt. Außerdem wird erörtert, wie diese Ressourcen für den produktiven Einsatz interpretiert und dargestellt werden können.

Das heißt, Data Science bezieht sich auf die Verwaltung von Datenbanken, die in digitalen Dateien gespeichert sind und aus denen viele nützliche Informationen als statistische Indikatoren extrahiert werden können. Diese können beispielsweise einem Unternehmen helfen, geschäftliche Entscheidungen zu treffen.

Ebenso stellt Data Science Werkzeuge zur Verfügung, die es ermöglichen, die verfügbaren Daten nicht nur zu interpretieren, sondern beispielsweise auch in Bildern darzustellen. So haben wir unter anderem das Histogramm, das Balkendiagramm, das Tortendiagramm.

Wie sich ableiten lässt, ist diese Wissenschaft interdisziplinär, da sie hauptsächlich Kenntnisse in Mathematik, Statistik und Informatik umfasst.

Data Science und Datentypen

Es sollte auch beachtet werden, dass Data Science mit zwei Arten von Daten arbeiten kann:

  • Strukturiert: Dies sind solche, die organisiert sind, z. B. Tabellen mit unterschiedlichen Spalten, jede mit einer anderen Kategorie wie: Name, Nachname, Alter, Ausweisnummer usw.
  • Unstrukturiert: Solche, die einem bestimmten Format nicht entsprechen, wie zum Beispiel ein frei geschriebener Text. In diesem Fall müssen Sie den Inhalt interpretieren und die verwaltbaren Daten extrahieren.

Unter Berücksichtigung aller Erläuterungen müssen auf Data Science spezialisierte Fachkräfte nicht nur über analytische Fähigkeiten verfügen, sondern auch in der Lage sein, den Inhalt der von ihnen verarbeiteten Informationen zu kommunizieren.

Bedeutung von Data Science

Data Science ist wichtig für Unternehmen oder Institutionen, die mit großen Datenmengen arbeiten müssen. So können diese zu wertvollen Informationen werden.

Wir können Data Science mit Big Data in Verbindung bringen, was darin besteht, Mechanismen zu entwickeln, die in der Lage sind, riesige Datenmengen aus verschiedenen Quellen zu verarbeiten und zu verwalten. Ziel ist es, sie in für den Menschen interpretierbare Informationen umzuwandeln, die ihm bei der Entscheidungsfindung helfen.

Diese zu verarbeitenden Daten können aus Transaktionen zwischen Einzelpersonen und Organisationen (z. B. Bankgeschäften), täglichen Aktionen von Personen (z. B. Suchen im Internet), Maschinen (z biometrisch (wie Fingerabdruck).

Geschichte der Datenwissenschaft

Man kann sagen, dass der amerikanische Statistiker John Wilder Tukey in den 1960er Jahren Pionierarbeit in der Datenwissenschaft leistete und die Bedeutung der Analyse von Daten betonte, anstatt statistische Modelle zu testen.

Erst 1996 wurde der Begriff Data Science jedoch erstmals im Titel einer Vorlesung verwendet, im Vortrag: "Data Science, Klassifikation und verwandte Methoden". Dies im Rahmen der Mitgliederversammlung der „International Federation of Classification Societies“ (IFCS) in Kobe, Japan.

Ein weiterer wichtiger Meilenstein kam 2005, als das National Science Board "Long-Life Digital Data Collections Enabling Research and Education in the 21st Century" veröffentlichte. In diesem Dokument werden Data Scientists als Computerexperten, Datenbank- und Softwareprogrammierer sowie Fachleute anderer Disziplinen (wie Bibliothekare und Archivare) definiert, die für das erfolgreiche Management einer digitalen Datensammlung entscheidend sind.

Dies ist jedoch noch ein Studienfach, das sich noch in der Entwicklung befindet.