Data Mining - Was es ist, Definition und Konzept

Data Mining ist der Prozess des Durchsuchens großer Datenbanken, um nützliche Informationen zu finden, die für die Entscheidungsfindung verwendet werden können. Auch der englische Begriff „Data Mining“ wird verwendet.

Es kann als die Technologie und Software verstanden werden, die verwendet wird, um Verhaltensmuster innerhalb der Datenbank zu finden. Die grundlegende Grundlage dafür ist, dass diese Muster bei der Entscheidungsfindung helfen. Es könnte beispielsweise Unternehmen helfen, die Verhaltensmuster ihrer Kunden zu verstehen. In einer Weise, die die Etablierung von Strategien zur Umsatzsteigerung oder Kostensenkung erleichtern würde.

Vorteile von Data-Mining

Der grundlegende Vorteil dieses Datenanalyseverfahrens ist die große Anzahl von Geschäftsszenarien, auf die es angewendet werden kann, als Beispiel haben wir:

  • Prognose: Prognose des Unternehmensumsatzes.
  • Wahrscheinlichkeit: Auswahl der besten Kunden für den direkten Kontakt per Telefon oder E-Mail.
  • Sequenzanalyse: Analyse der von Kunden gekauften Produkte und Überprüfung der Wechselbeziehungen zwischen ihnen.

Phasen des Data Mining

Innerhalb eines Data-Mining-Prozesses finden wir fünf Phasen:

  • Zielsetzung und Datenerhebung: Zunächst müssen wir uns darauf konzentrieren, welche Art von Informationen wir erhalten möchten. Stellen wir uns das Beispiel vor, dass ein Supermarkt wissen möchte, zu welcher Tageszeit die meisten Kunden anwesend sind. Dies wäre das Ziel und die Information, die der Handel in diesem Fall erhalten möchte.
  • Datenverarbeitung und -verwaltung: Sobald wir wissen, welche Daten wir sammeln möchten, setzen wir die Daten um. Dies ist vielleicht die schwierigste Phase des Prozesses. Nun, es erfordert die Auswahl der repräsentativen Probe, an der die Analyse durchgeführt werden soll. Nachdem die Stichprobe ausgewählt wurde, muss analysiert werden, welche Art von Variablen oder Regressionsmodell mit der Stichprobe durchgeführt werden soll.
  • Modellauswahl: Sie ist eng mit der vorherigen Phase verwandt. Es geht darum, ein Modell oder einen Algorithmus zu erstellen, der uns das bestmögliche Ergebnis liefert. Dazu muss eine umfassende Analyse der in das Modell einzubeziehenden Variablen durchgeführt werden. Dies wird eine komplizierte Aufgabe, da sie von der Art der zu analysierenden Informationen abhängt. Daher führen Data Miner verschiedene Tests des Algorithmus durch, wie zum Beispiel: lineare Regression, Entscheidungsbaum, Zeitreihen, neuronales Netz usw.
  • Analyse und Überprüfung der Ergebnisse: Grundsätzlich geht es darum, die Ergebnisse daraufhin zu analysieren, ob sie eine logische Erklärung liefern. Erklärung, die die Entscheidungsfindung auf der Grundlage der durch die Ergebnisse gelieferten Informationen erleichtert.
  • Modell-Update: Der letzte Schritt des Prozesses wäre die Aktualisierung des Modells. Es ist sehr wichtig, dass es im Laufe der Zeit durchgeführt wird, damit es nicht veraltet ist. Die Variablen des Modells könnten unbedeutend werden und daher ist eine periodische Kontrolle des Modells erforderlich.

Beliebte Beiträge

Deutschlands BIP sinkt um 0,1%

Die deutsche Wirtschaft steht erneut im Auge des Hurrikans und ihr Bruttoinlandsprodukt (BIP) sinkt um 0,1%. Deutschland leidet wieder. Nach einem ersten Quartal, in dem sie um 0,4 % gewachsen war, brach die deutsche Wirtschaft wieder ein. Die deutsche Lokomotive, die bis vor kurzem ein Beispiel für Widerstandsfähigkeit warWeiterlesen…

Thomas Cook geht 178 Jahre später pleite

600.000 Kunden an Land und eine Zahlungseinstellung scheinen das traurige Ende eines großen Tourismusunternehmens wie Thomas Cook zu sein. Der Untergang eines Unternehmens mit 178-jähriger Tradition war jedoch eine vorhergesagte Tragödie. Es gab viele Symptome, die den Sturz von Thomas Cook ankündigten: eine kolossale SchuldWeiterlesenRead…

Die Arbeitslosigkeit sank im März um 16.620 Personen auf 4.795.866

Die Zahl der Arbeitslosen, die Ende März bei der öffentlichen Arbeitsverwaltung (ehemals INEM) gemeldet sind, ist im Vergleich zum Vormonat um 16.620 Personen gesunken (-0,35%). Damit sinkt die Zahl der Arbeitslosen auf 4.795.866. Historisch gesehen ist der März ein guter Monat in Bezug auf die Arbeitslosigkeit. Im Vorjahr dieWeiterlesen…

Der Nasdaq erreicht 5.000, ist er so überbewertet wie im Jahr 2000?

Der Nasdaq erreichte gestern mit 5.000 Punkten ein Niveau, das er auch vor 15 Jahren auf dem Höhepunkt der Dotcom-Blase im März 2000 erreichte. Ist dieser Index so überbewertet wie damals? Die Märkte sind heute viel stärker überbewertet als in anderen Aufwärtsphasen, dank der Geldflut, die von den weiterlesen…